1、数理统计在地理学中的应用摘 要:20 世纪中,统计学方法被引入地理学研究领域。数理统计在地理学中的应用包括:地理学研究中的概率函数和统计假设检验、地理系统要素间的相关分析与回归分析以及空间统计分析。在地理学中,最优化方法、地理系统模拟和预测,将进一步得到广泛应用。关键词:数理统计学;地理要素定量描述;经典统计方法;概率函数;统计假设检验;回归分析;空间统计分析0 引言数理统计学时一门较年轻的学科,它主要的发展是从 20 世纪初开始。在早期发展中,以 R.Fisher 和 K.Pearson 为首的英国学派起到了领导作用。其他一些著名的学者,如 W.S.Gosset、J.Neyman、E.S.P
2、earson A.Wald 以及我国的许宝禄教授等提出了一系列的基本概念,一系列有重要应用价值的统计方法和重要的理论问题,他们的工作奠定了许多统计分支的基础。瑞典统计学家 H.Cramer在 1946 年发表了著作Mathematicl Methods of Statistics ,第一次用严整的数学方法总结了那时为止数理统计学的主要成就,被认为标志了这门学科达到成熟的地步。数理统计同时也是一门实用性较强的科学。人们在生产、管理、科学研究等各个方面,大都离不开数据资料的收集、整理和分析工作,因此几乎在人类活动的一切领域中都能找到它的应用。地理学,自其产生之日起,就与数学有着不解之缘。20 世纪
3、 2030 年代,地理学研究中的统计方法开始萌芽,并开始进行地理要素的统计概括和相关关系探讨。1 数理统计在地理学中应用的发展历程大致从 20 世纪 50 年代末到 60 年代末期,在计量地理学发展的初期阶段,统计学方法被引入地理学研究领域,构造一系列统计量来定量地描述地理要素的分布特征,比较普遍地应用各种概率分布函数、平均值、方差、标准差、变异系数、等统计特征参数以及简单的两要素见的一元线性回归分析方法。从今天的观点来看,这些方法都是比较浅显的,但是它却给长期以来只是定性地描述地理学带来了可喜的变化。许多方法无法准确确定的概念,如分布中心、区域形状、地理要素分布的集中和离散程度等都有了定量指
4、标,许多地理要素间的相关关系,可一定量地表示了。这一时期,出现了许多专门探讨和介绍数学的方法(主要是数理统计方法)的地理专著,如东坎和仇佐里合著的统计地理学 (1961) 、加里森和马布里合著的计量地理学 (1967) 、L.J.King 所著的地理学统计分析 (1969)等。随着计算机生产的工业化和高级算法语言程序的发展,20 世纪 60 年代末到 70 年代末,多元统计方法如雨后春笋般地发展了起来,成为数理统计学中特别有生命力的分支之一,过去用手算很难完成的复杂计算问题,运用计算机很快就能得出结果。以电子计算机技术为手段,许多地理学家熟练地掌握了多元统计方法,具备了分析复杂地理问题的能力。
5、在自然地理学、经济地理学和人文地理学中,以电子计算机为,运用多元统计分析方法使许多复杂的问题得到了相当满意的解决。2 经典统计分析方法在地理学研究中的应用经典统计分析方法在地理学研究中的应用,是计量革命的主要成果之一。它是随着计量革命较早发展起来的,直至今天还仍然是计量地理学中常用的一类传统方法。这类方法是建立在经典概率论与数理统计基础上的一类计量地理学方法,他们适用于许多随机地理现象、地理过程和地理事件的处理。2.1 地理学研究中的概率函数和统计假设检验计量地理学是把“数”导入地理系统的分析当中,用地理系统要素的数值来表示地理事物的特征和性质。而地理系统是多级、多要素的复杂的物质、能量运动系
6、统,它包含地球表面的岩石圈、水圈、大气圈、生物圈以及个圈层之间的关系,这就给地理学研究代来了许多复杂的问题,即往往不能从数量上把握地理系统全部要素确定性的变化规律,而通常把地理系统状态及地理系统要素视为具有随机性质。即在总的发展过程中,它有一定的规律性,但受到某些暂时无法全部把握的因素的影响,常出现偏离总体规律的异常情况。这就必须用研究随机现象规律性的数学学科概率论与数理统计作为地理学定量技术的基础。事实上,概率论的理论与方法已广泛应用于水文、气象、地质、地貌、经济地理等地理学的各分支学科。既然在空间分布和时间序列中所表现出来的地理事物往往是一种随机现象,那么如何把随机的地理现象数量化,使之用
7、一个变量 来描述?例如铁矿在样品中的含量 、某种农作物历年单位面积产量 等。地理学者所作的许多工作,都包含对地理系统进行比较或建立地理系统的统计模式。比较就是意味着对地理事物的差异、相似和联系的识别,而在统计方法中,很多方法就是为了判别一些资料是否来自不同的总体,这一类方法统称为差异的显著性检验。2.2 地理系统要素间的相关分析与回归分析地理系统各要素之间的相互关系,可通过大量的观测、试验或实验取得一定的地理数据。然后用数理统计的方法,寻找出隐藏在随机性后面的统计规律,而用回归方程来表达。应当注意,虽然函数关系与相关关系是两类不同类型的变量之间的关系,但它们之间并无严格的界限。相关关系的变量之
8、间尽管没有确定性的关系,但在大量数据条件下,从一定的统计意义上来看,它们之间可能存在着某种类型的函数关系。因而也可以借助于函数关系的数学表达式来表达。而变量之间的函数关系,从理论上来说是完全精确地函数关系,但是如对某种函数关系的变量作多次测定,因有误差存在,所得数据有时并不绝对相同,因而它们之间的关系就变成非确定性的了。严格讲,回归分析就是处理变量之间相互关系的一种数理统计方法。实际上,回归分析和相关分析都是研究和处理变量之间相互关系的一种数理统计方法,但他们之间既有联系,又有区别。在研究对象和内容上两者是相同的,相关分析主要是研究要素(变量)之间联系的密切程度,并没有严格的自变量与因变量之分
9、;而回归分析则主要是研究要素(变量)之间联系的数学表达式,因而就有自变量与因变量之分,从而就可由自变量的取值来预测、延长或插补和控制因变量的取值,所以回归分析尚有地理预测的性质。相关与回归虽有区别,但它们之间又不能截然分开,因为从相关可以获得回归的一些重要信息,反之从回归也能获得相关的一些重要信息。故它们之间是两个紧密相连的概念。回归分析的主要内容可概括如下:1. 从一组地理数据出发,确定这些要素(变量)间的定量数学表达式,即回归模型;2. 根据一个或几个要素(自变量)的值来预测或控制另一个要素(因变量)的取值;3. 从影响某一地理过程中的许多要素中,找出哪些要素(变量)是主要的,哪些要素是次
10、要的,这些要素之间又有些什么关系。回归分析所研究的地理数学模型,依要素(变量)的多少可分为一元地理回归模型和多元地理回归模型。3 空间统计分析空间统计分析,即空间数据(spatial data)的统计分析,是现代计量地理学中一个快速发展的方向领域。空间统计分析的任务,就是运用有关统计分析方法,建立空间统计模型,从凌乱的数据中挖掘空间自相关与空间变异规律。空间统计分析产生和发展的基本理由是:空间数据间并非完全独立,而是存在某种空间联系和关联性,但是经典的统计方法的基本出发点是样本独立假设。由于空间依赖性的存在打破了大多数经典统计分析方法中样本相互独立的基本假设,因此无法直接用经典的统计方法揭示与
11、地理位置相关的控件数据关联和依赖性。然而,空间统计分析并不是抛弃所有经典的统计分析技术,而是对这些技术加以修改以使它们能够适用于空间数据的统计分析。地统计学(Geostatistics ) ,又称地质统计学,他是在法国著名统计学家G.Matheron(1963)大量理论研究的基础上逐渐形成的一门新的统计学分支。一般认为,地统计学是以区域化变量理论为基础,以变异函数为主要工具,研究那些在空间分布上既有随机性又有结构性,或空间相关和依赖性的自然现象的科学。因此,凡是在研究空间分布数据的结构性和随机性,或空间相关性和依赖性,或空间格局与变异,并对这些数据进行最优无偏内插估计,或模拟这些数据的离散性、
12、波动性时,均可应用地统计学的理论及相应的方法。地统计学的应用领域非常广泛,从开始的采矿学、地质学研究领域渗透到土壤、农业、水文、气象、生态、海洋、森林和环境治理等广阔领域。目前,地统计方法已经被引入地理学研究领域。地统计学与经典统计学方法不同。经典统计学方法,从早期的频率分析法到以后的扩散指数法、相关分析、回归分析等模型,一个共同点是依赖于样本频率分布或均值方差关系及其相应的判定准则,确定空间分布格局与相关关系。这些方法忽视了样本的空间位置和方向,难以区别不同空间格局的差异,并受抽样方法和抽样区域范围大小的影响。因此需要一种既考虑样本值,又重视样本空间位置及样本之间距离的方法来研究要素的空间分
13、布格局。地统计学就是一种能够弥补经典统计学的这些缺陷的比较好的方法。它在考虑样本点位置方向和彼此之间的距离的基础上,直接测定空间结构的相关性和依赖性,研究具有一定随机性和一定结构性的各种变量的空间分布及变异规律。地统计学的理论基础是区域化变量理论,主要研究那些分布于空间中并显示出一定结构性和随机性的自然现象。协方差函数和变异函数是以区域化变量理论为基础建立起来的地统计学的两个最基本的函数。地统计学的主要方法之一,克里格法就是建立在变异函数理论和结构分析基础之上的。4 结束语关于地理学的计量化方法的研究,近几年来发展迅速。从计量方法来看,值得注意的发展趋势是:发展复变量分析,此为目前工作的延伸,如相关分析、因子分析、判别分析、等的进一步应用;关于二维空间级数分析有日受注意之势,这方面的新发展不仅地理学者有兴趣,而且对其他地球科学也同样有很大用途;注意概率模式理论上的发展,因为地理学中大部分模式属于概率模式,当统计模式有理论背景时,会显得更有意义,统计分析所依据的基础也就更稳固;地理学今后的研究重点将是人类空间活动及空间现象与环境等,因此最优化方法、地理系统模拟和预测,将进一步得到广泛应用。