标签:数据分析 数据挖掘 算法 arcgis 数据
自然界中任何一个带有位置信息的个体都能被抽象为一个空间点数据,“点”的模式在自然与社会经济中都是普遍存在的,对点数据的分析,主要分为两大类:
1、点数据本身模式的识别和探索。
2、通过点模式的显示的信息,进行进一步的预测和知识总结。
目前在点数据模式的探索上,主要有以下五种:
1、点的疏密,包括点数据的分布探索,是否一致、均匀或者不均匀。
2、点的方位,包括点的分布和方向。
3、点的数量:多少(极值和均值)。
4、点的大小:代表的含义(如点一个点代表多少人口)。
5、其他,如点的一些动态变化等。
进一步预测和知识总结,就需要根据第一步分析出来的结果进行总结,一般来说主要是通过模型构建和分析表格来进行如异常值检测、离群值分析、信息预警等进一步分析。
在点数据挖掘的算法中,主要包括了密度分析(包括样方分析和核密度分析)、距离分析(最近邻分析和k函数分析)、空间冷热点分析(空间聚集的概率分析)、插值分析等。
在ArcGIS中,针对这些方法,主要提供空间分析模块和空间统计模块。
其中ArcGIS空间统计模块中,针对聚类和地理分布提供如下工具:
1、分析模式工具集:这些工具可用于评估要素(或与要素关联的值)是形成一个聚类空间模式、离散空间模式还是随机空间模式。包括如下工具:
- 平均最近邻工具,根据每个要素与其最近邻要素之间的平均距离计算其最近邻指数。
- 高/低聚类工具,使用 Getis-Ord General
G 统计可度量高值或低值的聚类程度。
- 增量空间自相关工具,测量一系列距离的空间自相关,并选择性创建这些距离及其相应z得分的折线图。
z得分反映空间聚类的程度,具有统计显著性的峰值 z得分表示促进空间过程聚类最明显的距离。这些峰值距离通常为具有“距离范围”或“距离半径”参数的工具所使用的合适值。
- 空间自相关工具,根据要素位置和属性值使用 GlobalMoran‘s I统计量测量空间自相关性。
- 多距离空间聚类分析,确定要素(或与要素相关联的值)是否显示某一距离范围内统计意义显著的聚类或离散。
2、聚类分布工具集,这些工具可用于识别具有统计显著性的热点、冷点或空间异常值。
包括如下工具
- 聚类和异常值分析工具,给定一组加权要素,使用 AnselinLocal Moran‘s I统计量来识别具有统计显著性的热点、冷点和空间异常值。
- 分组分析工具,根据要素属性和可选的空间/时态约束对要素进行分组。
- 热点分析工具,给定一组加权要素,使用 Getis-OrdGi*统计识别具有统计显著性的热点和冷点。
- 优化的热点分析工具,给定事件点或加权要素(点或面),使用 Getis-OrdGi*统计创建具有统计学上的显著性的热点和冷点的地图。它评估输入要素类的特征以获得最佳结果。
3、度量地理分布工具集,可通过度量一组要素的分布来计算各类用于表现分布特征的值,例如中心、密度或方向。您可利用此特征值对一段时间内的分布变化进行追踪或对不同要素的分布进行比较。度量地理分布工具集可以解决如下问题中心在哪里?数据的形状和方向如何?要素如何分散布局?
包括如下工具:
- 中心要素工具,识别点、线或面要素类中位于最中央的要素。
- 方向分布工具,创建标准差椭圆以概括地理要素的空间特征:中心趋势、离散和方向趋势。
- 线性方向平均值工具,识别一组线的平均方向、长度和地理中心。
- 平均中心工具,识别一组要素的地理中心(或密度中心)。
- 中位数中心工具,识别使数据集中要素之间的总欧氏距离达到最小的位置点。
- 标准距离工具,测量要素在几何平均中心周围的集中或分散的程度。
4、常用地理工具集:这些实用工具可执行多种功能:计算面积、评估最小距离、导出变量和几何、转换空间权重文件和采集重合点。这些工具脚本可用于执行各种数据转换任务。设计目的是为了与空间统计工具箱中的其他工具结合使用。
包括如下工具:
- 计算面积工具,计算面要素类中每个要素的面积值。
- 计算邻近点距离工具,返回一组要素与指定的 N个最邻近点(N为输入参数)的最小、最大和平均距离。可从结果窗口访问执行结果。
- 收集事件工具,将事件数据(如犯罪或疾病事件点)转换为加权点数据。
- 将空间权重矩阵转换为表工具,将二进制空间权重矩阵文件 (.swm)转换为表文件。
- 将要素属性导出到ASCII工具,将要素类坐标和属性值导出到以空格、逗号或分号进行分隔的
ASCII 文本文件中。
在ArcGIS空间分析模块中,针对点数据的分析提供了一下几类工具集:
1、密度分析工具集:使用“密度分析”工具,可计算每个输出栅格像元周围邻域内输入要素的密度。通过计算密度,在某种意义上来说,您将在表面上展开值(输入值)。将每个采样位置(线或点)的量级分布在整个研究区域,并计算输出栅格中每个像元的密度值。
包括如下工具:
核密度分析:使用核函数根据点或折线 (polyline)要素计算每单位面积的量值以将各个点或折线 (polyline)拟合为光滑锥状表面。
线密度分析:根据落入每个单元一定半径范围内的折线 (polyline)要素计算每单位面积的量级。
点密度分析:根据落入每个单元周围邻域内的点要素计算每单位面积的量级。
2、距离分析工具集:距离”工具用于通过以下方式执行距离分析:欧氏(直线)距离、成本加权距离、用于垂直移动限制和水平移动限制的成本加权距离、源之间具有最小行程成本的路径和廊道
包括如下工具:
- 廊道分析工具,计算两个输入累积成本栅格的累积成本总和。
- 成本分配工具,根据成本面上的最小累积成本计算每个像元的最近源。
- 成本回溯链接工具,定义在最近源的最小累积成本路径上为下一像元的相邻点。
- 成本距离工具,计算每个像元到成本面上最近源的最小累积成本距离。
- 成本路径工具,计算从源到目标的最小成本路径。
- 欧氏分配工具,基于欧氏距离计算每个像元的最近源。
- 欧氏方向工具,计算每个像元相对于最近源的方向(以度为单位)。
- 欧氏距离工具,计算每个像元相对于最近源的方向(以度为单位)。
- 路径距离工具,考虑表面距离以及水平和垂直成本因素的情况下,为每个像元计算与最近源之间的最小累积成本距离。
- 路径距离分配工具,考虑表面距离以及水平和垂直成本因素的情况下,根据成本面上的最小累积成本计算每个像元的最近源。、
- 距离回溯链接工具,考虑表面距离以及水平和垂直成本因素的情况下,在指向最近源的最小累积成本路径上定义表示下一像元的近邻。
3、插值分析工具集,表面插值工具用于根据采样点值创建连续(或预测)表面。对战略上分散的采样位置进行测量,然后可将预测值指定给其他所有位置。输入点的间距可以是随机的或固定的,也可以根据采样方案来确定。栅格数据集的连续表面制图表达表示某些测量值,例如高度、密度或量级(例如,高程、酸度或噪点级别)。表面插值工具会根据输出栅格数据集中所有位置的采样测量值进行预测,而无论是否已在该位置进行了测量。
包括如下工具:
- 反距离权重法工具,使用反距离加权法 (IDW)将点插值成栅格表面。
- 克里金法工具,使用克里金法将点插值成栅格表面。
- 自然邻域法工具,使用自然邻域法将点插值成栅格面。
- 样条函数工具,使用二维最小曲率样条法将点插值成栅格表面。生成的平滑表面恰好经过输入点。
- 含障碍的样条函数工具,通过最小曲率样条法利用障碍将点插值成栅格表面。障碍以面要素或折线要素的形式输入。
空间点数据分析与ArcGIS
标签:数据分析 数据挖掘 算法 arcgis 数据
原文地址:http://blog.csdn.net/allenlu2008/article/details/46273425