1、地图分析与应用 Map Analysis and Applications,李飞雪 南京大学地理信息科学系,2,数据概括相同,空间模式不同,3,数据分析的缺点,以经典统计理论为基础,标准正态分布,缺失位置信息,4,空间数据很少符合正态分布,位置信息非常重要,依赖(Dependence)是一种规律(rule)空间相互作用、空间外部性、空间溢出等,空间尺度非常重要,5,空间依赖性(Spatial Dependence),变量Y在第i个空间单元上的观测值由该空间系统中其他空间单元上的观测值通过函数f表达,iS,S是所有空间单元的集合。,6,空间依赖性的产生原因,空间相互作用,测量误差,7,空间异质性
2、(Spatial Heterogeneity),i代表空间观测单元,fi表示因变量yi与自变量xi、参数向量i和误差项i之间具体的函数关系。,8,空间模式的量化,9,专题三 空间统计分析,空间统计分析,即空间数据(spatial data)的统计分析,是现代计量地理学中一个快速发展的方向和领域。 空间统计分析,其核心是认识与地理位置相关的数据间的空间依赖、空间关联或空间自相关,通过空间位置建立数据间的统计关系。,空间统计分析,地球表面上的事物或现象之间存在着某种联系,并以相似或差异的方式表现出来。 Tobler(1970) “地理学第一定律”描述了这样性质:“所有的事物或现象在空间上都是有联系
3、的,但相距近的事物或现象之间的联系一般较相距远的事物或现象间的联系要紧密”。 在空间统计学中,相似事物或现象在空间上集聚(集中)的性质称之为空间自相关(Spatial autocorrelation)。空间上的相关性或关联性(Spatial associatiaon)是自然界存在秩序与格局的原因之一(Goodchild 1986)。,地理学第一定律,在地理学中,每一个空间位置上的事物(现象)都具有区别于其他位置上的事物(现象)的特点,这种差异性被称为空间异质性(Spatial heterogeneity)(Anselin 1988)。 与地理学第一定律所描述的空间依赖性相对应,Goodchil
4、d(2003)将空间异质性总结为“地理学第二定律”。 Goodchild在2003年的UCGIS年会上做了一场题为“地理信息科学基本定律(The Fundamental Laws of GIScience)”的报告。在该报告中,Goodchild将“空间异质性”概括为地理学第二定律(the Second Law of Geography)。,地理学第一定律,13,基本分析方法/分析指标,空间权重矩阵 空间权重矩阵是对空间邻接关系的定义,是空间统计分析运算的基础之一。 全局空间自相关 局部空间自相关,14,15,空间权重矩阵(spatial weight matrix),对空间邻居(spatia
5、l neighborhood)或邻接关系的描述,通常定义一个二元对称空间权重矩阵W,来表达n个位置的空间区域的邻近关系。 目前对于空间权重指标的构建,主要基于两类特征:连通性(Continuity)和距离(Distance)。此外,还可以通过面积、可达度等方式对空间权重指标进行构建。,空间权重矩阵,16,空间权重矩阵(spatial weight matrix),基于连通性特征的空间权重指标,又可以称为空间邻接指标。 三种基本的空间邻接定义方式:考虑横纵方向邻接关系的“卒”型、考虑对角线方向邻接关系的“象”型以及综合考虑上述方向的“后”型。 空间邻接影响不仅仅局限于两个单元的相邻,一个空间单元
6、还可通过相邻单元对外围非相邻单元产生影响,对于这类影响可以通过设定空间二阶乃至高阶邻接指标进行表达。,17,空间权重矩阵(spatial weight matrix),基于距离特征的空间权重指标,又可以称为空间距离指标。 空间距离指标选择空间对象间的距离(如反距离、反距离平方值、距离负指数等)定义权重矩阵。 如Cliff和Ord曾提出的Cliff-Ord空间权重指标,即是将距离作为指标定义的一部分。,i = 1,2,n;j = 1,2,n 其中,dij为空间对象间的距离,ij为空间对象共享边界的长度,a、b为两类距离的权重调整系数。,18,空间权重矩阵(spatial weight matri
7、x),空间数据集中不同实体单元间存在不同程度的空间关系,在实际使用中,一般通过矩阵形式给出空间逐点的空间权重指标,称为空间权重矩阵。,W是一个nn的正定矩阵,矩阵的每一行指定了一个空间单元的“邻居集合”。 一般地,面状观测值用连通性指标:若面状单元i和j相邻,则wij=1;否则,wij=0。点状观测值用距离指标:若点i和j之间的距离在阈值d以内,则wij=1;否则, wij0。 通常约定,一个空间单元与其自身不属于邻居关系,即矩阵中主对角线上元素值为0。,19,在实际应用中,一般根据以下两种规则定义邻居: 公共边界 如果第i和第j个空间单元具有公共边界,则认为它们是邻居,空间权重矩阵中的元素为
8、1;否则,不是邻居,元素为0。 距离 如果第i和第j个空间单元之间的距离位于给定的临界距离d之内,则认为它们是邻居,空间权重矩阵中的元素为1;否则,不是邻居,元素为0。 Cliff-Ord广义空间权重矩阵,其中dij是i和j之间的距离,bij是i和j之间的公共边界占i周长的比例。,20,21,空间自相关度量的意义 发现空间分布模式 如何度量?,全局空间自相关统计指数,22,主要描述整个研究区域上空间对象之间的关联程度,以表明空间对象之间是否存在显著的空间分布模式。(Cliff and Ord, 1981),全局空间自相关分析主要采用全局空间自相关统计量(如Morans I、 Gearys C、
9、General G)进行度量。,全局空间自相关(global spatial autocorrelation),23,Morans I 统计量是一种应用非常广泛的空间自相关统计量,它的具体形式如下(Cliff and Ord,1981):,Morans I,其中,xi 表示第 i 个空间位置上的观测值, ,wij是空间权重矩阵W(nn)的元素,表示了空间单元之间的拓扑关系,S0 是空间权重矩阵W的所有元素之和。 反映的是空间邻接或空间邻近的区域单元属性值的相似程度。,全局空间自相关统计指数,24,用矩阵形式表示如下:,其中,X 是 xi 与其均值的离差向量(n1),W 是(nn)的空间权重矩阵
10、,S0 含义同上。,25,Tabulated lattice data,Adjacency matrix, W,I=0.0317. If this value is close to 0 there is very little spatial autocorrelation, which is what we have found in this example,26,对观测值在空间上不存在空间自相关(或独立、随机分布)这一原假设进行检验时,一般根据标准化以后的Morans I 值或 z 值,即:,Morans I 的检验,在统计推断的过程中,通常需要对变量x的分布做出假设。 一般分两种情况
11、:一是假设变量 x 服从正态分布;二是在分布未知的情况下,用随机化方法得到 x 的近似分布。 通过在正态或随机两种分布假设下得到I的期望值和方差来分别进行假设检验。,27,在正态分布假设下,Morans I 的期望值和方差分别为:,式中,和,分别是空间权重矩阵 W 的第 i 行和第 i 列元素之和,28,在随机分布假设下,Morans I 的期望值和方差分别表示为:,式中,其他符号同上。,29,通常将Morans I 解释为一个相关系数,取值范围从-1到+1。0 I 1表示正的空间自相关,I = 0表示不存在空间自相关,-1 I 0表示负的空间自相关。,当Morans I 显著为正时,存在显著
12、的正相关,相似的观测值(高值或低值)趋于空间集聚。 当Morans I 为显著的负值时,存在显著的负相关,相似的观测值趋于分散分布。 当Morans I 接近期望值(-1/(n-1),随着样本数量的增大,该值趋于0)时,表明不存在空间自相关,观测值在空间上随机排列,满足经典统计分析所要求的独立、随机分布假设。,30,随机检验(Permutation test),在不存在空间自相关的假设下,观测值x1,xn可被认为是观测值被随机分配到n个空间位置上的一次随机过程。当观测值为n时,可能的空间组合次数为n!,这n!次随机排列构成观测值在原假设条件下的分布。根据这一分布,可以得到统计量的期望值和方差。
13、,蒙特卡罗检验( Monte Carlo test ),当n比较大时,这些观测值的随机排列的组合数非常大。通常情况下是利用k个随机数生成方法来构建一个经验的原始分布。 当k=99时,可以满足5%显著性水平下的检验;当k=999次,可以满足1%显著性水平的检验。k值越大,经验分布越接近原假设下的分布状态。可以根据这种经验分布来检验一个观测值的出现是否为“小概率事件”,从而判断是拒绝还是接受原假设。,31,Gearys C,Gearys C 也是一种较常用的空间自相关统计量,其结果解释类似于Morans I(Cliff and Ord 1981)。其形式为:,对该统计量的统计推断也是根据相应的标准
14、化Z值。,32,在正态分布假设下,Gearys C 的期望值和方差分别为:,在随机分布假设下,Gearys C的期望值和方差分别表示如下:,式中符号同Morans I的期望和方差公式。,33,Gearys C 总是正值,取值范围一般为 0 到 2 之间,且服从渐近正态分布。 当Gearys C小于 1 时,表明存在正的空间自相关。 当Gearys C大于 1 时,表明存在负的空间自相关。 当Gearys C 值为 1 时,表明不存在空间自相关,即观测值在空间上随机排列 。,34,General G 统计量,Morans I 和Geary C 统计量均可以用来表明属性值之间的相似程度以及在空间上
15、的分布模式,但它们并不能区分是高值的空间集聚(高值簇或热点(hot spots)还是低值的空间集聚(低值簇或冷点(cold spots),有可能掩盖不同的空间集聚类型。Getis-Ord General G 统计量则可以识别这两种不同情形的空间集聚(Getis and Ord,1992;OSullivan and Unwin,2003)。,式中, wij(d)是根据距离规则定义的空间权重; xi和xj含义同上。,对General G 的统计检验采用下式:,35,在空间不集聚的原假设下,General G 的期望值和方差分别是:,其中,,36,当General G 值高于E(G),且Z值显著时,
16、观测值之间呈现高值集聚。当General G 值低于E(G),且Z值显著时,观测值之间呈现低值集聚。当General G 趋近于E(G)时,观测值在空间上随机分布。,37,Gamma()统计量,Gamma()统计量由空间相似性矩阵(W)和属性相似性矩阵(Y)对应元素的交叉积构造而成(Hubert et al., 1981),是大多数空间自相关检验统计量的一般形式(Florax et al., 2004)。该统计量的表达式为:,其中,空间相似性矩阵可以采用空间权重矩阵形式,其元素wij表达位置i和j之间的空间相似性(spatial similarity)或空间关系。 而属性相似性矩阵Y及其元素y
17、ij可以采用不同的形式(如欧几里德距离、曼哈顿距离等)。,38,当在属性相似性矩阵Y中采用不同的方式度量观测值之间的空间关联时,可以得到不同的空间自相关统计量。 例如,当矩阵Y中的元素为两个观测值的乘积,即,时,可以得到类似Morans I的统计量。,时,可以得到类似Gearys C的统计量。,当矩阵Y中的元素为两个观测值的差的平方和,即,39,局部空间自相关(Local spatial autocorrelation),全局空间自相关统计量建立在空间平稳性这一假设基础之上,即所有位置上的观测值的期望值和方差是常数。然而,空间过程很可能是不平稳的,特别是当数据量非常庞大时,空间平稳性的假设就变
18、得非常不现实(Ord and Getis,1992,Anselin,1995)。,局部空间自相关统计量可以用来识别不同空间位置上可能存在的不同空间关联模式(或空间集聚模式),从而允许我们观察不同空间位置上的局部不平稳性,发现数据之间的空间异质性,为分类或区划提供依据(Getis and Ord,1992 1996;Ord and Getis,1995; Anselin,1994,1995)。,40,Getis和Ord(1992)提出了度量每一个观测值与周围邻居之间是否存在局部空间关联的G统计量。 该统计量是某一给定距离范围内邻居位置上的观测值之和与所有位置上的观测值之和的比值,能够用来识别位置
19、i和周围邻居之间是高值还是低值的集聚。 若不包括i位置上的观测值,则为Gi统计量;若包括i位置上的观测值,则为Gi*统计量。,G统计量,Gi和Gi*统计量的具体形式分别为:,41,在不存在空间依赖性的原假设下,即位置i上的观测值与周围邻居的观测值xj之间在空间上是独立的,Gi和Gi*的期望值分别为:,Gi和Gi*的方差分别为:,其中,,42,在不存在空间自相关的原假设(即Gi = 0或Gi* = 0)下,Gi 和Gi*服从渐近正态分布(Ord and Getis,1992)。 因此,这两个统计量的统计检验可以根据相应的标准化形式:,,,其中,,(j i),(所有j),43,如果Z值为正,且非常
20、显著,则表明位置i 周围的值相对较大(高于均值),高值空间集聚。 如果Z值为负,且非常显著,则表明位置i周围的值相对较小(低于均值),低值空间集聚。 因此,G统计量可以用来识别高值或低值的空间集聚模式。,44,Morans I等空间自相关指数反映的是空间整体的自相关,一般“侧重于研究区域空间对象某一属性取值的空间分布状态”。在一个存在全局空间自相关的样本中,可能存在局部的随机性,或是在全局随机分布的样本中,也可能存在局部的空间关联。 因此,需要能够识别局部不平稳的局部空间空间自相关统计量。,局部空间自相关统计指数,45,Morans I等空间自相关指数反映的是空间整体的自相关,一般“侧重于研究
21、区域空间对象某一属性取值的空间分布状态”。实际研究中,空间自相关的分布是不均匀的,个别局域对象的属性取值对全局分析对象的影响非常显著。 因此,有必要进行局域空间自相关指数计算,分析某一空间对象取值的邻近空间聚类关系、空间不稳定性及空间结构框架。 特别是,当全局自相关分析不能够检测区域内部的空间分布模式时,局域空间自相关分析能够有效检测由于空间自相关引起的空间差异,判断空间对象属性取值的空间热点区域或高发区域等,弥补全局空间自相关分析的不足。,局部空间自相关统计指数,46,LISA统计量,局部空间关联指标(Local Indicators of Spatial Association,LISA)
22、并不是特指某一个统计量,所有同时满足下面两个条件的统计量都可以认为是局部空间关联指标(Anselin,1995)。 每一个观测值的LISA表示该值周围相似观测值在空间上的集聚程度。 所有观测值的LISA之和与全局空间关联度量指标之间成比例。,47,其中,Li表示位置i上的统计量,f是一个函数形式,yi是位置i上的观测值,Ji表示位置i周围的所有邻居集合,yJi是邻居Ji上的观测值。 位置i上的所有邻居通过空间权重矩阵(W)表示,如W中第i行上所有非0元素对应的列,即构成位置i的邻居集合Ji。,这样,LISA可以表达某个位置i上的观测值与周围邻居观测值之间的关系。具体表示如下:,48,LISA主
23、要有两个目的: 识别局部的空间集聚(spatial clusters)或热点(hot spot)。 识别局部的非平稳性。若某个位置上的LISA非常显著,则可将该位置看作热点。若某个位置上的LISA与均值之间的差距非常大,即该位置对全局统计量的贡献超过了它的预期份额,则可将该位置看作是异常点或强影响点(如与均值之差超过2个标准差)(Anselin,1995)。,49,局部Gamma()其中,aij和bij的含义同 统计量,分别表示空间相似性和属性相似性。 空间相似性可以通过空间权重矩阵(W)度量;属性相似性可有不同的度量方式,分别对应不同的局部空间关联统计量。 当bij = zi zj时,则对应
24、局部Morans I 统计量;当bij =(zi - zj)2时,则是局部Gearys C 统计量。,50,每一个观测值i 的局部Morans Ii统计量的定义如下:,其中,zi和zj是观测值的均值标准化,即,式中空间权重矩阵元素wij采用行标准化形式,即,局部Morans Ii,51,Ii表示位置i上的观测值与周围邻居观测平均值的乘积。这样,全局Morans I 和局部Morans Ii 统计量之间的关系是:,局部Morans Ii 统计量的精确分布形式一般未知,对其检验通常采用条件随机化(conditional randomization)或随机排列(permutation)方法(Anse
25、lin 1995)。 条件随机化是指将位置i的观测值固定,其他观测值在整个空间位置上随机排列。这样可以得到Ii的经验分布函数,为观测到的Ii的显著性检验提供依据。,52,局部Morans Ii 统计量的解释类似于G统计量。 若伪显著性水平p值非常小(如 p 0.95),则表明位置i 周围的观测值相对较低。,53,空间位置i 的局部Gearys Ci统计量定义如下:,其中,zi和zj是观测值的标准化形式,空间权重矩阵中的元素wij采用行标准化。 全局Gearys C和局部Gearys Ci统计量之间的关系是:,局部Gearys Ci,54,局部Gearys Ci统计量的伪显著水平p值的计算与局部
26、Morans Ii统计量类似。 若p值较大(如p 0.95),表明Ci值异常小,说明位置 i的观测值与周围邻居的观测值之间是正的空间联系(即相似); 若p值较小(如p 0.05),表明Ci值异常大,说明位置i 的观测值与周围邻居的观测值之间是负的空间联系(即不相似或差异大)。,55,空间关联特征的可视化,在格网数据的可视化过程中,空间权重矩阵和空间滞后(spatial lag)是两个非常重要的概念(Anselin and Bao 1997,Anselin 1999)。 空间权重矩阵第i行的非0元素,定义了该空间单元的所有邻居。 将第i行所有邻居的观测值进行加权平均,即得到变量在位置i上的空间滞
27、后。若空间位置i上的观测值为yi,则相应的空间滞后是jwijyj。通过采用饼状图、柱状图或散点图等形式,将每个位置上的观测值和其空间滞后之间的关系表示在地图上,以便进行直观的分析。 若用矩阵表示,则变量的空间滞后是空间权重矩阵(W)与观测值向量(y)的乘积(Wy)。,56,柱状图,柱状图是专题地图中用来表示事物和现象内部结构组成的一种表示方法。 变量在某个位置上的观测值和其空间滞后之间的关联程度也可以用柱状图加以表示(Anselin,1994,Anselin and Bao,1997)。,57,将每个位置上观测值(yi)和空间滞后((Wy)i)的大小用长方形表示,则构成柱状图。 若yi = (
28、Wy)i,两个柱状图形的面积大小相等。 如果某一位置上的观测值较大,而空间滞后较小,两个图形的高度悬殊较大,表明该位置可能存在负的空间自相关。 如果该位置上的观测值和空间滞后的高度相差不大,表明该位置可能存在正的空间自相关。 柱状图一般仅适用于观测值为正的情况。,58,饼状图一般仅适用于观测值为正的情况。 在饼状图中,将一个圆一切为二,划分为两个大小相等或不等的扇形。 其中,一个扇形表示该位置上观测值(yi)的比例大小,数值为yi/yi+(Wy)i,另一个扇形表示该位置上观测值的空间滞后((Wy)i)所占的比例大小,数值为 (Wy)i /yi+(Wy)i。 若yi = (Wy)i,两个扇形面积
29、大小相等,均为整个圆的一半。如果该位置上的观测值比重大,则空间滞后的比重将变小,两个扇形的面积大小悬殊较大,表明该位置可能存在负的空间自相关;如果该位置上的观测值和空间滞后的比例相差不大,表明该位置可能存在正的空间自相关。,59,Moran 散点图,散点图是数据分析中用来表示二个变量之间相关关系的一种常见的方法。 表示一个变量的空间自相关关系,可以采用Moran散点图(Moran scatterplot)。 Moran散点图可以用来探索空间关联的全局模式、识别空间异常和局部不平稳性等(Anselin,1994,1996)。将变量在每个位置上的观测值表示在横轴上,其空间滞后(标准化的局部空间自相
30、关指标Morans Ii )表示在纵轴上,则二者之间的相关关系就可以用坐标系中的散点形象地表现出来。,60,由于变量观测值和其空间滞后之间的拟合程度(即直线的斜率)恰好是Morans I系数。,61,Moran散点图分为四个象限,分别对应四种不同类型的局部空间关联模式: 右上象限(H-H):观测值zi大于均值(high),其空间滞后也大于均值(high)。 左下象限(L-L):观测值zi小于均值(low),其空间滞后也小于均值(low)。 左上象限(L-H):观测值zi小于均值(low),但其空间滞后大于均值(high)。 右下象限(H-L):观测值zi大于均值(high),但其空间滞后小于均
31、值(low)。,62,右上象限(H-H)和左下象限(L-L)对应正的空间自相关,表示该位置上的观测值和周围邻居的观测值之间相似。其中,右上象限(H-H)对应高-高相似,左下象限(L-L)对应低-低相似。 左上象限(L-H)和右下象限(H-L)对应负的空间自相关,表示该位置上的观测值和周围邻居的观测值之间相异。其中,左上象限(L-H)对应低-高相异,右下象限(H-L)是高-低相异,即低值被周围的高值所围绕,和高值被周围的低值所围绕。,63,右上和左下两个象限分别对应G统计量中的正的空间关联(高-高)和负的空间关联(低-低)。观察右上和左下两个象限的相对密度,可以了解全局空间关联模式在多大程度上是
32、由高值还是低值之间的关联决定的。 观察左上和右下两个象限的相对密度,可以了解哪种形式的负的空间关联占主导地位。 此外,观察Moran散点图的左上和右下两个象限,还可以发现潜在的空间异常。以散点图的象限中心点为圆心,做一个半径为2的圆,可以认为圆以外的观测点是异常值。,这是因为,Moran散点图是用标准化的变量和其空间滞后构造的,图上2个单位的距离意味着偏离均值两个标准差,可以看作是异常值(Anselin and Bao 1997)。,64,Moran 派生图,Moran散点地图,65,当在Moran 散点地图中仅显示那些显著高或显著低的观测值时,得到Moran显著性地图(Moran signi
33、ficance map)。 如果显著观测值属于散点图中的第一象限或第三象限,则认为存在显著空间聚集;如果属于第二或第四象限,则认为存在显著的空间差异。,Moran显著性地图,66,67,江苏省区域经济空间差异分析,ESDA (Exploratory Spatial Data Analysis,探索性空间数据分析)是一系列空间数据分析方法和技术的集合,以空间关联测度为核心,通过对事物或现象空间分布格局的描述与可视化,发现空间集聚和空间异常,揭示研究对象之间的空间相互作用机制。改革开放以来江苏省县域经济差异在空间上的变化状况,影响江苏省区域经济差异扩大或缩小的空间机制。,应用案例,68,研究区域与
34、数据来源,江苏五十年(19491999)和江苏省统计年鉴(20002003)。 空间分析尺度为江苏省77个县(市、区),包括13个省辖市区和64个县(市),时间序列为19782002年,分析变量为县级年人均GDP (现价)。,69,研究方法,全局空间自相关分析 局部空间自相关分析Moran散点图,横轴对应变量z的所有观测值,纵轴对应空间滞后向量(Wz)的所有取值。每个区域观测值的空间滞后就是该区域周围邻居观测值的加权平均,具体通过标准化的空间权重矩阵来加以定义。 右上象限(HH):区域自身和周边地区的经济水平均较高,二者空间差异程度较小。 左上象限(LH):区域自身经济水平较低,周边地区较高,
35、二者空间差异程度较大。 左下象限(LL):区域自身和周边地区的经济水平均较低,二者空间差异程度较小。 右下象限(HL):区域自身经济水平较高,周边地区较低,二者空间差异程度较大。,70,整个研究期间, Global Morans I估计值全部为正,且总体趋势在不断增加。 这表明,改革开放以来,江苏省县域经济发展水平相似(高高或低低)的地区在空间上集中分布,随着时间的推移,这种趋势还在不断加强。 江苏省区域经济发展的基本格局是发达地区集中在苏南,欠发达地区集中在苏北。正是苏南和苏北地区内部空间差异的缩小,才使得县域总体空间差异不断缩小。,71,改革开放以来,江苏省县域经济发展较快,县域之间的总体
36、空间差异有了较大程度的缩小。 2002年,位于HH象限的县(市、区)个数由1978年的10个增加到28个,超过江苏省区域总数的1/3;相反,位于LH和HL象限的数量却分别由1978年的12和14个减少为2002年的6个。 位于HH象限的县(市)个数越多,县域经济的总体空间差异就越小。,72,那些原先经济基础比较薄弱,其周围地区也相对比较落后的县域(LL象限),经过20多年的发展,依然没有摆脱相对滞后的局面。 截止2002年,江苏省仍有接近一半(37个)的县域属于LL象限,仅比1978年减少4个。 这一事实表明,江苏省区域经济协调发展的路子还很长。,73,改革开放初期,江苏省县域经济已表现出较为
37、明显的空间分异格局。 与周边地区相比,全省县域可具体划分为以下四种类型: 空间差异较小、区域自身和周边水平均较高的县域(HH),全部坐落在苏南地区; 空间差异较小,但区域自身和周边水平均较低的县域(LL),绝大多数分布在苏北地区; 空间差异较大,区域自身水平较高,但周边较低的县域(HL),多为苏中和苏北省辖市区; 空间差异较大,区域自身水平较低,但周边较高的县域(LH),主要位于苏中省辖市的周边。,74,在5%显著性水平下,所有县域的Ii值均不显著。这表明,江苏省县域经济虽然在改革开放初期呈现出一定的地带性分布格局,但并不显著。这与表1中江苏省1978年县域人均GDP的Global Moran
38、s I估计结果在5%的水平上也不显著相吻合。,75,经过20多年的发展,江苏省县域经济空间差异分布格局发生了以下变化: HH区域从苏州、无锡地区向西北方向延伸至常州、镇江、扬州和南京等地。那些初期属于HH区域的吴县(现苏州吴中区)、常熟和锡山(现无锡锡山区)等地,则逐渐演变为显著HH区域。 LL区域数量稍有减少,但其集中分布在苏北的基本格局并没有发生变化。苏中、苏南部分LL区域发生了较大变化,其中溧阳、金坛、溧水、靖江等转为HH区域,高淳、泰兴等转为LH区域。在苏北地区内部,出现了显著LL区域(宿豫和沭阳)。 HL区域数量有了大幅度减少,南京、镇江、扬州、泰州和常州等省辖市区和周边丹阳、扬中和
39、江阴等县市转变为HH区域,苏北淮阴市(现淮安市)和金湖转变为LL区域,表现出和周围县域趋同的迹象。值得注意的是,盐城、大丰和海门分别由LL、LL和LH进入HL区域。 LH区域数量减少了一半,但位于苏中的分布格局并没有发生大的变化。与苏南、苏北相比,苏中依然是江苏省县域之间存在较大发展差距的地域。,中国大陆30个省级行政区人均GDP的空间关联分析 根据各省(直辖市、自治区)之间的邻接关系,采用二进制邻接权重矩阵,选取各省(直辖市、自治区)1998-2002年人均GDP的自然对数,依照公式计算全局Moran指数I,计算其检验的标准化统计量Z(I)。,应用案例,从表中可以看出,在1998-2002年
40、期间,中国大陆30个省级行政区人均GDP的全局Moran指数均为正值;在正态分布假设之上,对Moran指数检验的结果也高度显著。 在1998-2002年期间,中国大陆30个省级行政区人均GDP存在着显著的、正的空间自相关,也就是说各省级行政区人均GDP水平的空间分布并非表现出完全的随机性,而是表现出相似值之间的空间集聚。 其空间联系的特征是:较高人均GDP水平的省级行政区相对地趋于和较高人均GDP水平的省级行政区相邻,或者较低人均GDP水平的省级行政区相对地趋于和较低人均GDP水平的省级行政区相邻。,选取2001年我国30个省级行政区人均GDP数据,计算局部Gi统计量和局部Gi统计量的检验值Z
41、(Gi),并绘制统计地图。,检验结果表明 贵州、四川、云南西部3省的Z值在0.05的显著性水平下显著,重庆的Z值在0.1的显著性水平下显著,该4省市在空间上相连成片分布,其人均GDP趋于为同样是人均GDP低值的省区所包围。 由此形成人均GDP低值与低值的空间集聚,据此可认识到西部落后省区趋于空间集聚的分布特征。,东部的江苏、上海、浙江三省市的Z值在0.05的显著性水平下显著,天津的Z值在0.1的显著性水平下显著。 东部上海、江浙等发达省市趋于为一些相邻经济发展水平相对较高的省份所包围,东部发达地区的空间集聚分布特征也显现出来。,以(Wz,z)为坐标,进一步绘制Moran散点图多数省(直辖市、自
42、治区)位于第1和第3象限内,为正的空间联系,属于低低集聚和高高集聚类型,而且位于第3象限内的低低集聚类型的省(直辖市、自治区)比位于第1象限内的高高集聚类型的省(直辖市、自治区)更多一些。,可以看出,从人均GDP水平相对地来看: 高值被高值包围的高高集聚省(直辖市)有:北京、天津、河南、安徽、湖北、江西、海南、广东、福建、浙江、山东、上海、江苏。 低值被低值包围的低低集聚省(自治区)有:黑龙江、内蒙古、新疆、吉林、甘肃、山西、陕西、青海、西藏、四川、云南、辽宁、贵州。 被低值包围的高值省(直辖市)有:重庆、广西、河北;被高值包围的低值省份只有湖南。,82,空间统计分析软件,GeoDA GS+
43、GRASS ,83,BB统计量主要用来度量二值型数据(0,1)之间的空间关联程度。,BB统计量(Black-Black Joint Counts Statistic),其中,Z(si)表示第 i 个空间位置上的观测值(0,1),wij是空间权重矩阵W(nn)的元素。 若第 i 个空间位置为黑颜色,则Z(si)=1,也可理解为该位置上发生了某一事件。,对观测值在空间上不存在空间自相关(或独立、随机分布)这一原假设进行检验时,一般根据标准化以后的BB 值,即:,84,BW统计量(Black-White Join Counts Statistic),对BW进行检验时,一般也根据标准化以后的BW 值,即:,在二项分布假设下,均值和方差的表达式如下:,85,