1、空间分析的概念 空间分析:是基于地理对象的位置和形态特征的空间数据分析技术,其目的在于提取和传输空间信息。包括空间数据操作、空间数据分析、空间统计分析、空间建模。空间数据的类型 空间点数据、空间线数据、空间面数据、地统计数据属性数据的类型 名义量、次序量、间隔量、比率量 属性:与空间数据库中一个独立对象(记录)关联的数据项。属性已成为描述一个位置任何可记录特征或性质的术语。空间统计分析陷阱 1)空间自相关 :“地理学第一定律” 任何事物都是空间相关的,距离近的空间相关性大。空间自相关破坏了经典统计当中的样本独立性假设。避免空间自相关所用的方法称为空间回归模型。2)可变面元问题 MAUP:随面积
2、单元定义的不同而变化的问题,就是可变面元问题。其类型分为:尺度效应:当空间数据经聚合而改变其单元面积的大小 、形状和方向时,分析结果也随之变化的现象。区划效应:给定尺度下不同的单元组合方式导致分析结果产生变化的现象。3)边界效应 :边界效应指分析中由于实体向一个或多个边界近似时出现的误差。生态谬误 在同一粒度或聚合水平上,由于聚合方式的不同或划区方案的不同导致的分析结果的变化。 (给定尺度下不同的单元组合方式)空间数据的性质 空间数据与一般的属性数据相比具有特殊的性质 如空间相关性,空间异质性,以及有尺度变化等引起的 MAUP 效应等。一阶效应:大尺度的趋势,描述某个参数的总体变化性;二阶效应
3、:局部效应,描述空间上邻近位置上的数值相互趋同的倾向。空间依赖性:空间上距离相近的地理事物的相似性比距离远的事物的相似性大。空间异质性:也叫空间非稳定性,意味着功能形式和参数在所研究的区域的不同地方是不一样的,但是在区域的局部,其变化是一致的。ESDA 是在一组数据中寻求重要信息的过程,利用 EDA 技术,分析人员无须借助于先验理论或假设,直接探索隐藏在数据中的关系、模式和趋势等,获得对问题的理解和相关知识。常见 EDA 方法:直方图、茎叶图、箱线图、散点图、平行坐标图主题地图的数据分类问题 等间隔分类;分位数分类:自然分割分类。空间点模式:根据地理实体或者时间的空间位置研究其分布模式的方法。
4、茎叶图:单变量、小数据集数据分布的图示方法。优点是容易制作,让阅览者能很快抓住变量分布形状。缺点是无法指定图形组距,对大型资料不适用。茎叶图制作方法:选择适当的数字为茎,通常是起首数字,茎之间的间距相等;每列标出所有可能叶的数字,叶子按数值大小依次排列; 由第一行数据,在对应的茎之列,顺序记录茎后的一位数字为叶,直到最后一行数据,需排列整齐(叶之间的间隔相等) 。箱线图为系数。 设 W1=0,则由式 推出空间误差模型:是空间加权的( W2) 误差项; 系数; 不相关的、同方差的误差向量。 包含空间效应的方法:通过误差项。空间 Durbin 模型(SDM):将因变量的空间延迟(spatial l
5、ag)和自变量的空间延迟项加在模型中便得到空间 Durbin 模型。地图代数中的函数与类型函数是建立在基本运算符基础上的对栅格数据的高级操作,主要函数类型包括:局部函数、焦点函数、类区函数、块函数。局部函数函数运算:栅格数据以某种函数关系作为分析依据进行逐网格运算,从而得到新的栅格数据。又分为数学函数、选择函数、重分类函数、统计函数。焦点函数,又称邻域函数邻域分析也称窗口分析,主要应用于栅格数据模型。邻域函数计算出的栅格数据每个象元位置上的值都是输入数据中相应位置下指定的一些邻域单元的函数. 计算出的邻域统计值是一个移动窗口,它可以对数据进行扫描。窗口分析:对于栅格数据系统中的一个、多个栅格点或全部数据,开辟一个有固定分析半径的分析窗口,并在该窗口内进行诸如极值、均值等一系列统计计算,或与其它层面的信息进行必要的复合分析,从而实现栅格数据水平方向上的扩展分析。空间决策:空间决策是一个利用地理信息的分析和解释对一组方案进行优劣排序和选择的过程。决策步骤:(1)决策问题的定义(2)确定用于评价的一组标准(3)加权标准产生可选择性(4)决策规则应用(5)推荐问题的最佳解决方案10,)NIX2(0,NIX1122(0,)yNIX