1、-1-空间数据分析报告使用MoransI统计法实现空间自相关的测度1、实验目的(1)理解空间自相关的概念和测度方法。(2)熟悉ArcGIS的基本操作,用MoransI统计法实现空间自相关的测度。2、实验原理2.1空间自相关空间自相关的概念来自于时间序列的自相关,所描述的是在空间域中位置S上的变量与其邻近位置Sj上同一变量的相关性。对于任何空间变量(属性)Z,空间自相关测度的是Z的近邻值对于Z相似或不相似的程度。如果紧邻位置上相互间的数值接近,我们说空间模式表现出的是正空间自相关;如果相互间的数值不接近,我们说空间模式表现出的是负空间自相关。2.2空间随机性如果任意位置上观测的属性值不依赖于近邻
2、位置上的属性值,我们说空间过程是随机的。Hanning则从完全独立性的角度提出更为严格的定义,对于连续空间变量Y,若下式成立,则是空间独立的:式中,n为研究区域中面积单元的数量。若变量时类型数据,则空间独立性的定义改写成式中,a,b是变量的两个可能的类型,ij。2.3MoransI统计oransI统计量是基于邻近面积单元上变量值的比较。如果研究区域中邻近面积单元具有相似的值,统计指示正的空间自相关;若邻近面积单元具有不相似的值,则表示可能存在强的负空间相关。-2-设研究区域中存在n个面积单元,第i个单位上的观测值记为yi,观测变量在n个单位中的均值记为y,则MoransI定义为= ni nj
3、ijni nj ijni WWnI 1111 ji1 2i )y-)(y-(y)y-(y式中,等号右边第二项=n1i n1j jiij )y-)(y-(yW类似于方差,是最重要的项,事实上这是一个协方差,邻接矩阵W和)y-)(y-(yji的乘积相当于规定)y-)(y-(yji对邻接的单元进行计算,于是I值的大小决定于i和j单元中的变量值对于均值的偏离符号,若在相邻的位置上,yi和yj是同号的,则I为正;yi和yj是异号的,则I为负。在形式上MoransI与协变异图u-)Z(su-)Z(sN(h)1(h)C ji=相联系。MoransI指数的变化范围为(-1,1)。如果空间过程是不相关的,则I的
4、期望接近于0,当I取负值时,一般表示负自相关,I取正值,则表示正的自相关。用I指数推断空间模式还必须与随机模式中的I指数作比较。通过使用MoransI工具,会返回MoransIndex值以及ZScore值。如果Zscore值小于-1.96获大于1.96,那么返回的统计结果就是可采信值。如果Zscore为正且大于1.96,则分布为聚集的;如果Zscore为负且小于-1.96,则分布为离散的;其他情况可以看作随机分布。3、实验准备3.1实验环境本实验在Windows7的操作系统环境中进行,使用ArcGis9.3软件。3.2实验数据此次实习提供的数据为以湖北省为目标区域的bount.dbf文件。.d
5、bf数据中包括第一产业增加值,第二产业增加值万元,小学在校学生数,医院、卫生院床位数,乡村人口万人,油料产量,城乡居民储蓄存款余额,棉花产量,地方财政一般预算收入,年末总人口(万人),粮食产量,普通中学在校生数,肉类总产量,规模以上工业总产值现价(万元)等属性,作为分析的对象。-3-4、实验步骤本报告用MoransI检验湖北省各区域规模以上工业总产值现价(万元)的空间分布的空间自相关性。(1)FeaturetoPoints对于线类要素和多边形要素,程序会计算要素的几何中心点,然后对几何中心点进行分析。这就会造成有些要素的几何中心点不在几何要素内部,如果想达到此目的,需要先用FeaturetoP
6、oints工具进行转换后再进行分析。在ArcToolbox中选择DatManagem entToolsFeaturesFeatureToPoint,在InputFeatures选项中选择bount.shp文件。图 1转换对话框-4-图 2转换结果(2)MoransI指数计算在ArcToolbox中选择SpatialStaisticsToolsAnalyzingPaternsSpatialutocorrelation(MoransI),在InputFeaturesClas选项中选择bount_FeatureToPoint2.shp文件,在InputFiled中选择属性“规模以上工”,在Conce
7、ptualizationofSpatialRelationships中选择InverseDistanceSquared。-5-图 3SpatialStatisticsTools-6-图 4SpatialAutocorrelation对话框图 5MoransI结果展示-7-(3)AnselinLocalMoransI指数计算在ArcToolbox中选择SpatialStaisticsToolsMappingclustersClusterandOutlierAnalysi(AnselinLocalMoransI),在InputFeaturesClas选项中选择bount.shp文件,在InputF
8、iled中选择属性“规模以上工”,在ConceptualizationofSpatialRelationships中选择InverseDistanceSquared。图 6AnselinLocalMoransI对话框-8-图 7AnselinLocalMoransI结果展示图 8AnselinLocalMoransI结果一览图 9新增要素使用该工具会输出一个新的要素类。该要素类在原要素类上添加了两个字段,分别为LMiIndex、LMiZScore和IMiPValue,前两个分别代表各个要素的索引值I和score值。如果索引值I为正,则要素值与其相邻的要素值相近,如果索引I值为负值,则与相邻要素
9、值有很大的不同。如果Zscore为正且越大,则要素越与相邻要素值相近,相反,如果Zscore值为负却越小,则与相邻要素值差异越大(也就是相关性不强)。-9-5、结果分析(1)MoransI结果分析图 10MoransI指数结果图MoransI指数的变化范围为(-1,1)。如果空间过程是不相关的,则I的期望接近于0,当I取负值时,一般表示负自相关,I取正值,则表示正的自相关。用I指数推断空间模式还必须与随机模式中的I指数作比较。上图显示MoransI的值为0.09,接近于0,可以认为整体上湖北省各区域的规模以上总产值的空间分布是不相关的。图 11湖北省地图从上述湖北省地形图可以知道,湖北省地形复
10、杂,且东西地形差异大,导致-10-交通要素的差异(西部山区交通不便,而东部尤其是武汉城市圈交通十分便捷);地理区位差异大,资源丰富度不同(如大冶市拥有丰富的铁矿资源),经济发展起步不同及各区域的经济地位的不同,导致各区域经济发展差异且无规律分布,因而呈现出空间自相关模式中的随机模式。(2)AnselinLocalMoransI结果分析图 12ZScore值图示图 13AnselinLocalMoransI结果视图-1-图 14原因分析根据聚集及分析特例工具的原理,zscore为正且越大,则要素越与相邻要素值相近,相反,如果zscore值为负却越小,则与相邻要素值差异越大(也就是相关性不强)。图
11、12显示,颜色越红表示要素与相邻要素值越接近,颜色越蓝,表示与相邻要素值差异越大。而通过下图使用Graduatedsym bols所展示出来的结果显然和上面所呈现出的结果是一样的。图 15ZScore值图示-12-图 16AnselinLocalMoransI结果视图图 17相关性结合本实验分析对象,即京山、应城市、天门市、汉川市、仙桃市五个地区的规模以上工业总产值比较相近;而大冶市则与其相邻的咸宁市、江夏区、鄂州市、黄冈市、阳新等地区的规模以上工业总产值差异较大。分析原因,京山、应城市、天门市、汉川市、仙桃市地形地势因素接近,最主要的是都位于武汉城市圈的辐射圈内,交通区位、市场潜力等因武汉市发展所带动的相关地方经济的机遇是类似的,因此其规模以上工业总产值空间分布呈现出较强的空间相关性。对于大冶市,大冶市的大冶矿产丰富,素有“百里黄金地,江南聚宝盆”之美誉。已发现和探明的大小矿床273处,金属矿、非金属矿53种是全国6大铜矿生产基地,10大铁矿生产基地和建材重点产地。黄金、白银产量居湖北省之-13-冠,硅灰石储量居世界第二。其工业发展起步早,发展快,丰富的矿产资源推动了大冶市的经济发展,因而其工业总产值明显高于周围其他市县。导致其周围地区的规模以上工业总产值的空间分布的相关性较弱。