1、第五章 地理系统要素间的 相关分析与回归分析,1 地理要素间的相关分析 2 地理要素间的回归分析 3 地理系统的空间趋势面分析,基本要求:(1)掌握相关程度的度量方法及简单相关系数的显著性检验方法;(2)掌握一元线性回归模型和多元线性回归模型的建立方法;(3)了解非线性回归模型的建立方法。 重点与难点:(1)相关系数的求解及检验;(2)最小二乘法;(3)利用SPSS软件进行相关和回归分析。,第五章 地理系统要素间的 相关分析与回归分析,1 地理要素间的相关分析,1.1 相关分析的意义,1.2 地理要素间相关关系的种类,1.3 地理相关程度的测度方法,1.4 相关系数的显著性检验,1 地理要素间
2、的相关分析,1.1 相关分析的意义,相关分析,自变量和因变量的判定 地理相关 地理要素之间关系的类型:,函数关系(完全相关) 相关关系(统计相关) 独立,1 地理要素间的相关分析,1.1 相关分析的意义,函数关系与相关关系的联系和区别: 联系:在一定条件下是可以相互转化的。 区别:研究分析方法不同。,1.2 地理要素间相关关系的种类,1 地理要素间的相关分析,1 地理要素间的相关分析,1.3 地理相关程度的测度方法,1.3.1 简单线性相关程度的测度 1.3.2 简单非线性相关程度的测度 1.3.3 多要素相关与相关矩阵,1 地理要素间的相关分析,1.3 地理相关程度的测度方法,相关表,相关图
3、(散点图),相关系数,某商店10名售货员的工龄和日工资的相关表,1 地理要素间的相关分析,1.3 地理相关程度的测度方法,相关表,是一种显示变量之间相关关系的统计表。将两个变量的对应值平行排列,且其中某一变量按其取值大小顺序排列, 得到相关表。,相关图(散点图),1 地理要素间的相关分析,1.3 地理相关程度的测度方法,是将两个变量的对应值,在平面直角坐标系中用坐标点的形式描绘而成的图形。,1 地理要素间的相关分析,1.3 地理相关程度的测度方法,1.3.1 简单线性相关程度的测度,相关系数:,1.一般常用的相关系数(r)2.顺序(等级)相关系数(rs),用来度量直线相关程度和方向的指标。,分
4、子:两个变量的离差积和; 分母:两变量离差平方和之积的平方根。,1 地理要素间的相关分析,1.3 地理相关程度的测度方法,1.一般常用的相关系数(r),1.3.1 简单线性相关程度的测度,1 地理要素间的相关分析,1.3 地理相关程度的测度方法,简单线性相关,1 地理要素间的相关分析,1.3 地理相关程度的测度方法,相关系数 r 的性质:,简单线性相关,r-1,1; 当 r 0 时为正相关, r 0 时为负相关; 当|r|= 1 时,则r = 1 为完全正相关,r = -1 为完全负相关; 当 r = 0 时,说明两变量之间完全无关; 当|r|1 时,说明两变量之间关系密切; 当|r|0 时,
5、说明两变量之间相关程度差。,1 地理要素间的相关分析,1.3 地理相关程度的测度方法,相关系数 r 的性质:,简单线性相关,r =0 完全不相关;0 r 0.3 微弱相关; 0.3 r 0.5 低度相关; 0.5 r 0.8 显著相关; 0.8 r 1 高度相关;r =1 完全相关。,要求:计算x与y的相关系数,说明其相关方向和程度。,1 地理要素间的相关分析,例:某地区历年人均收入与商品销售额资料如下:,解:将计算表中的数值代入r计算公式得:,计算结果表明,人均收入与商品销售额之间存在高度的直线正相关关系。,1 地理要素间的相关分析,2.顺序(等级)相关系数(rs),设两个要素x和y有n对样
6、本值,令T1代表要素x的序号(或位次),T2代表要素y的序号(或位次),则:,代表要素x和y的同一组样本位次差的平方。,1 地理要素间的相关分析,公式:,1.3 地理相关程度的测度方法,表示两个要素(变量)顺序间直线相关程度和方向的系数),1.3.1 简单线性相关程度的测度,1 地理要素间的相关分析,例:全国1999年31个省(市、区)的总人口(x)和国内生产总值(y)及其位次列于下表中。试计算x与y之间的顺序相关系数。,解:将计算表中的数值代入rs计算公式得:,即:总人口(x)与国内生产总值(y)之间的等级相关系数为0.806。计算结果表明,二者存在高度的直线正相关关系。,1 地理要素间的相
7、关分析,称为回归值(或理论值),是yi的预测值。,1 地理要素间的相关分析,1.3 地理相关程度的测度方法,相关指数R,1.3.2 简单非线性相关程度的测度,1 地理要素间的相关分析,1.3 地理相关程度的测度方法,相关指数R的性质:,R0,1; R=1时,两变量完全曲线相关; R=0时,两变量完全曲线无关; Rmax时,相关程度密切,Rmin 时,相关程度差; R|r|; RxyRyx,1.3.2 简单非线性相关程度的测度,1 地理要素间的相关分析,1.3 地理相关程度的测度方法,1.3.3 多要素相关与相关矩阵,设有原始地理数据矩阵,1 地理要素间的相关分析,多要素相关矩阵的性质: 对角线
8、上的元素均为1; 此矩阵为方阵; 沿对角线对称。,1.3 地理相关程度的测度方法,要测度两两要素之间的相关程度,公式为:,得到相关系数矩阵:,1.4 相关系数的显著性检验,1 地理要素间的相关分析,目的:判定相关系数是否有意义,1.4 相关系数的显著性检验,1 地理要素间的相关分析,(1)计算出相关系数r。 (2)给定显著性水平,按n-2查相关系数临界值r表,查出相应的临界值 r。 (3)比较|r|与r的大小:当|r|r时:两变量在水平上相关性显著;当|r|r时:两变量在水平上相关性不显著; (4)相关性显著,可进一步做回归分析。,简单线性相关系数的显著性检验步骤,2 地理要素间的回归分析,2
9、.1 回归分析的意义和作用,2.2 一元回归模型的建立,2.3 多元地理回归模型的建立,2 地理要素间的回归分析,2.1 回归分析的意义和作用,2.1.1 概念,2.1.2 回归分析的作用,2.1.3 回归分析的类型,2 地理要素间的回归分析,2.1 回归分析的意义和作用,2.1.1 概念,是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。,2 地理要素间的回归分析,2.1 回归分析的意义和作用,2.1.2 回归分析的作用,相关分析研究的是现象之间是否相关、相关的方向和密切程度,一般不区别自变量或因变量。回归分析则要分析现象之间相关的具体形式,确定其因果关系,并用数学模型来表现其
10、具体关系。,2 地理要素间的回归分析,2.1 回归分析的意义和作用,2.1.2 回归分析的作用,比如,从相关分析中我们可以得知“质量”和“用户满意度”变量密切相关,但是这两个变量之间到底是哪个变量受哪个变量的影响,影响程度如何,则需要通过回归分析方法来确定。,2 地理要素间的回归分析,2.1 回归分析的意义和作用,2.1.3 回归分析的类型,2 地理要素间的回归分析,2.2 一元回归模型的建立,2.2.1 一元地理回归模型类型的判断方法,2.2.3 一元线性回归模型的效果检验,2.2.2 一元线性地理回归模型的建立,2.2.4 利用回归模型进行预测,2 地理要素间的回归分析,将地理要素(x,y
11、)的数据点绘在普通方格纸上,散点图呈直线,则一元地理回归模型为直线型。将地理要素(x,y)的数据点绘在双对数格纸上,散点图呈直线,则一元地理回归模型为幂函数型。,2.2 一元回归模型的建立,2.2.1 一元地理回归模型类型的判断方法,2 地理要素间的回归分析,2.2 一元回归模型的建立,将地理要素(x,y)的数据点绘在单对数格纸上,而其横坐标轴取对数分格,纵坐标为普通分格时呈直线,则一元地理回归模型为对数函数型。 将地理要素(x,y)的数据点绘在单对数格纸上,而其横坐标轴为普通分格,纵坐标取对数分格时呈直线,则一元地理回归模型为指数函数型。,2.2.1 一元地理回归模型类型的判断方法,2 地理
12、要素间的回归分析,2.2 一元回归模型的建立,2.2.2 一元线性地理回归模型的建立,式中: A,B为待定系数; (xi,yi)为n组观测数据,(i=1,2,n); i为随机变量。,设x为自变量,y为因变量, 假定一元线性模型结构为:,2 地理要素间的回归分析,例:某地理区根据工业总产值估计货运总量。现有该地区1996-2000年的统计资料:,2.2 一元回归模型的建立,2.2.2 一元线性地理回归模型的建立,最小二乘法,2 地理要素间的回归分析,1.由最小二乘法求得参数a和b。,称为回归值(或理论值)。,通常采用最小二乘法原理使差的平方和达到最小。,2 地理要素间的回归分析,令,1.由最小二
13、乘法求得参数a和b。,最小二乘法,欲使Q最小,需使,2 地理要素间的回归分析,最小二乘法,移项整理得:,正规方程组,2 地理要素间的回归分析,最小二乘法,用代数法求得:,2 地理要素间的回归分析,最小二乘法,2.具体计算方法,(1)将原始数据根据需要列表,2 地理要素间的回归分析,最小二乘法,(2)根据公式计算b,(3)计算a,(4)写出回归模型,2 地理要素间的回归分析,2.2 一元回归模型的建立,2.2.3 一元线性回归模型的效果检验,S越大,回归效果越差;S越小,回归效果越好。,(1)回归模型估计误差,标准估计误差S,2 地理要素间的回归分析,0,2.2 一元回归模型的建立,(2)回归模
14、型的显著性检验,总的离差平方和,2.2.3 一元线性回归模型的效果检验,2 地理要素间的回归分析,U-回归平方和,Q-剩余平方和 (残差平方和),2.2 一元回归模型的建立,式中:,总的离差平方和,2 地理要素间的回归分析,2.2 一元回归模型的建立,总平方和的自由度也可以分解为:,N-1,1,N-2,相关系数r 检验回归效果,总的离差平方和,R越大,U越大,回归效果越好,2 地理要素间的回归分析,2.2 一元回归模型的建立,总平方和的自由度可以分解为:,N-1,1,N-2,方差分析检验回归效果,总的离差平方和,2 地理要素间的回归分析,2.2 一元回归模型的建立,当FF时,回归模型有效。,一
15、元线性回归方程的方差分析表,总的离差平方和,2 地理要素间的回归分析,上例中:,2.2 一元回归模型的建立,若=0.05,F= F0.05(1,3) =10.1, 有FF,故回归模型有效(显著)。,2 地理要素间的回归分析,为中心作对称分布的,越靠近的地方出现概率越大。,2.2 一元回归模型的建立,2.2.4 利用回归模型进行预测,“地理预测”的概念,对于固定的 x=x0 ,y 的取值范围是以,2 地理要素间的回归分析,2.2 一元回归模型的建立,y的取值与剩余标准差S之间,存在如下关系:,的概率约占38%,的概率约占68.3%,的概率约占95.45%,的概率约占99.73%,2.2.4 利用
16、回归模型进行预测,2 地理要素间的回归分析,2.2 一元回归模型的建立,上例中:,:,如当该地区的工业总产值达到30亿元,概率取68.3%时,预测货运量,因此,有68.3%的可靠性推测,货运量在13.039616.2134百万吨之间。,2.2.4 利用回归模型进行预测,测量某导线在一定温度()下的电阻值()得到下表所示的结果,找出它们之间的函数关系,并检验方程的正确性。,思考题,2 地理要素间的回归分析,思考题答案,导线温度与其电阻值关系问题:,2 地理要素间的回归分析,2.2 一元回归模型的建立,2.2.3 一元非线性地理回归模型的建立,地理学中一元非线性关系的实例,地形高度与年平均降水量;
17、 大城市人口密度与距市中心的距离; 玉米产量与耗水量; 树木高度与材积量; 鸟类体重增长率与时令; 林地景观斑块面积与周长,2 地理要素间的回归分析,2.2 一元回归模型的建立,1.一元非线性回归预测的基本步骤,2.2.3 一元非线性地理回归模型的建立,确定非线性回归模型的类型;理论和经验判断观察相关图(散点图) 通过变换将非线性问题转化为线性问题来处理; 应用最小二乘法建立回归方程,求得参数; 进行逆变换,将线性方程转换为非线性方程。,2 地理要素间的回归分析,2.2 一元回归模型的建立,2.2.3 一元非线性地理回归模型的建立,2.一元非线性回归模型的建立,基本模型:幂函数(Power)型
18、、指数函数(Exponential)、对数函数(Logarithmic)型 其它常见模型:S型曲线(Logistic)型、双曲线型、负指数曲线型,2 地理要素间的回归分析,2.2 一元回归模型的建立,(1) 幂函数型,例1:在研究长白山北麓熔岩台地地貌形态的变化中,考察熔岩台地各地点的海拔高度(m)随各地点距白头山天池火山口壁的距离(km)之间的变化关系,表格如下:,2 地理要素间的回归分析,非线性,2.2 一元回归模型的建立,2 地理要素间的回归分析,(1) 幂函数型,Y,A,X,非线性,2.2 一元回归模型的建立,其中:,A取反对数得a。,具体计算步骤,2 地理要素间的回归分析,X,Y,X
19、2,Y2,XY,非线性,2.2 一元回归模型的建立, 原始数据列表处理:,2 地理要素间的回归分析,非线性,2.2 一元回归模型的建立, 根据公式计算b:,计算a:,写出回归模型:,2 地理要素间的回归分析,2.2 一元回归模型的建立,(2) 指数函数型,例2:在研究长白山北坡地形高度(m)对年平均降水量(mm)的影响时,数据如下表所示:,2 地理要素间的回归分析,长白山北坡地形高度与年降水量相关图,非线性,2.2 一元回归模型的建立,2 地理要素间的回归分析,(2) 指数函数型,Y,A,非线性,2.2 一元回归模型的建立,其中:,A取反对数得a。,2 地理要素间的回归分析,非线性,2.2 一
20、元回归模型的建立,具体计算步骤:, 根据公式计算b:, 计算a,写出回归模型, 列表(略),2 地理要素间的回归分析,X,非线性,2.2 一元回归模型的建立,(3) 对数函数型,其中:,2 地理要素间的回归分析,2.2 一元回归模型的建立,2.2.3 一元非线性地理回归模型的建立,3.效果检验,相关指数:,R2越大,回归效果越好;R2越小,回归效果越差。,2 地理要素间的回归分析,2.2 一元回归模型的建立,2.2.3 一元非线性地理回归模型的建立,3.效果检验,剩余标准差(标准估计误差),S越大,回归效果越差; S越小,回归效果越好。,2 地理要素间的回归分析,2.2 一元回归模型的建立,2
21、.2.3 一元非线性地理回归模型的建立,3.效果检验,剩余与总平方和的计算过程(例2),2 地理要素间的回归分析,2.2 一元回归模型的建立,2.2.3 一元非线性地理回归模型的建立,3.效果检验,本例中:,思考题,学生进行野外实习时,用自造的简易流速计测河流流速。为了解决流速计的刻度问题用回归分析法因流速计中的石蜡柱在水压的作用下产生高度差h(cm),h与流速v(m/s)有相关关系,数据如下表。以v为因变量作出散点图,如果不是线性关系,通过变换可化为线性关系,并求出回归方程。,(提示:用对数变换化为线性关系。),2 地理要素间的回归分析,思考题答案,石蜡柱高度差与流速关系问题:,2.3 多元
22、回归,2 地理要素间的回归分析,2.3 多元地理回归模型的建立,2.3.2 多要素非线性回归模型的建立,2.3.1 多元线性回归模型的建立,2 地理要素间的回归分析,1.二元线性回归模型的建立,2.3 多元地理回归模型的建立,2.3.1 多元线性回归模型的建立,2.多元线性回归模型的建立,3.多元线性回归模型的显著性检验,2 地理要素间的回归分析,1.二元线性回归模型的建立,2.3 多元地理回归模型的建立,2.3.1 多元线性回归模型的建立,其中:b0为常数项,b1,b2为y对x1,x2的回归系数。,2 地理要素间的回归分析,2.3 多元地理回归模型的建立,1.二元线性回归模型的建立,2.3.
23、1 多元线性回归模型的建立,2 地理要素间的回归分析,2.3 多元地理回归模型的建立,移项整理得,1.二元线性回归模型的建立,2.3.1 多元线性回归模型的建立,正规方程组,2 地理要素间的回归分析,l11,l12,l1y,l21,l22,l2y,2.3 多元地理回归模型的建立,法一:代数法,2 地理要素间的回归分析,2.3 多元地理回归模型的建立,解之,得:,回归模型为:,2 地理要素间的回归分析,A,M,B,2.3 多元地理回归模型的建立,法二:矩阵法,2 地理要素间的回归分析,2.3 多元地理回归模型的建立,2.3.1 多元线性回归模型的建立,2.多元线性回归模型的建立,其中:b0为常数
24、项, b1,b2, bk为偏回归系数。,2 地理要素间的回归分析,2.3 多元地理回归模型的建立,2.3.1 多元线性回归模型的建立,2.多元线性回归模型的建立,举例:P102。,2 地理要素间的回归分析,2.3 多元地理回归模型的建立,2.3.1 多元线性回归模型的建立,3.多元线性回归模型的显著性检验,2 地理要素间的回归分析,2.3 多元地理回归模型的建立,2.3.1 多元线性回归模型的建立,3.多元线性回归模型的显著性检验,各平方和的自由度:,n-1,k,n-k-1,2 地理要素间的回归分析,2.3 多元地理回归模型的建立,2.3.1 多元线性回归模型的建立,3.多元线性回归模型的显著
25、性检验,方差:,剩余标准差:,F 值:,2 地理要素间的回归分析,2.3 多元地理回归模型的建立,2.3.2 多要素非线性回归模型的建立,多项式回归模型,x1,x2,xk,2 地理要素间的回归分析,多项式回归模型,2.3 多元地理回归模型的建立,2.3.2 多要素非线性回归模型的建立,抛物线模型,x1,x2,3 地理系统的空间趋势面分析,3.1 趋势面分析的一般原理,3.2 趋势面拟合程度的检验,3.3 趋势面分析应用实例,3 地理系统的空间趋势面分析,3.1 趋势面分析的一般原理,3.1.1 空间趋势面分析概述,1.趋势面分析的概念 2.趋势面 3.剩余面,某观测点的观测值 =确定性函数值+
26、随机性函数值 =趋势值+剩余值,3 地理系统的空间趋势面分析,3.1 趋势面分析的一般原理,1.最小二乘法原理,3.1.2 空间趋势面分析的数学模型,3 地理系统的空间趋势面分析,3.1 趋势面分析的一般原理,2.多项式趋势面的数学模型,一次趋势面:,二次趋势面:,三次趋势面:,3.1.2 空间趋势面分析的数学模型,参数求解过程,3 地理系统的空间趋势面分析,则:,3.1 趋势面分析的一般原理,令:,将多项式回归(非线性模型)模型转化为多元线性回归模型。,其残差平方和为:,3 地理系统的空间趋势面分析,其中:U为回归平方和;Q为残差平方和(剩余平方和);p为多项式的项数(不包括b0);n为使用
27、的资料数目。,3.2 趋势面拟合程度的检验,当FF时,回归模型有效。,(一)F检验,3 地理系统的空间趋势面分析,3.2 趋势面拟合程度的检验,I的范围:0-100% I越大,拟合程度越好; I越小,拟合程度越差。 通常认为当I75%时,拟合程度较为满意。,(二)拟和程度指数,某流域1月份降水量与各观测点的坐标位置数据如表5.3所示。要求以降水量为因变量z,地理位置的横坐标和纵坐标分别为自变量x、y,进行趋势面分析,并对趋势面方程进行显著性检验。,3 地理系统的空间趋势面分析,3.3 趋势面分析应用实例,表5.3 流域降水量及观测点的地理位置数据,解题步骤:,3 地理系统的空间趋势面分析,建立趋势面模型,(1)首先采用二次多项式进行趋势面拟合,用最小二乘法求得拟合方程为,(2)算得F统计量的数值,(3)得二次多项式趋势面如图5.3.1,3 地理系统的空间趋势面分析,解题步骤:,(4)再采用三次多项式进行趋势面拟合,用最小二乘法求得拟合方程为,(5)算得F统计量的数值,(6)得三次多项式趋势面如图5.3.2,3 地理系统的空间趋势面分析,模型的显著性检验,解题步骤:,显然:,,而,因此二次趋势面的回归方程显著而三次趋势面不显著。,。,F2(二次多项式的F值),F3(三次多项式的F值),在置信水平=0.05下,查F分布表得:,