1、统计学在人文地理学中的应用2011 级人文地理学专业 江涌起统计学是一门较年轻的学科,它的发展是从 20 世纪初开始。在早期发展中,以 R.Fisher 和 K.Pearson 为首的英国学派起到了领导 作用,W.S.Gosset、J.Neyman、E.S.Pearson A.Wald 以及我国的许宝禄教授等提出的基本概念、统计 方法和重要的理 论问题奠定了许多统计分支的基础。瑞典统计学家H.Cramer 在 1946 年发表的著作 Mathematical Methods of Statistics,第一次用严整的数学方法总结了数理统计学的主要成就,被认为标志了这门学科达到成熟的地步。大致从
2、 20 世纪 50 年代末到 60 年代末期,统计学方法被引入地理学研究领域,构造一系列统计量来定量地描述地理要素的分布特征,比较普遍地应用各种概率分布函数、平均值、方差、标准差、 变异系数统计特征参数以及简单的两要素的一元线性回归分析方法。 这一时期,出 现了许多 专门探讨和介绍数学的方法(主要是数理统计方法)的地理专著,如东坎和仇佐里合著的统计地理学(1961)、加里森和马布里合著的计量地理学(1967)、L.J.King 所著的地理学统计分析(1969)等。随着计 算机生产的工业化和高级算法语言程序的发展,20 世纪 60 年代末到 70 年代末,多元统计方法雨后春笋般地发展起来,成为数
3、理统计学中特别有生命力的分支之一。按照英国著名地理学家里兹大学 S奥彭肖(Openshaw)教授的定义和划分 , 数量地理学大体经历了 60 年代的计量革命(统计模型),70 年代初期的数学模型革命(数理模型和规划模型等),80 年代中期的GIS 革命( 1983 年提出了自动地理学Automated Geography),80 年代末 90 年代初进入计算地理学时代(Geocom-putational Geography)。1994 年在里兹大学正式建立全球第一个计算地理中心,90 年代中期国外学者正式创立地理计算学一词Geocomputation。1996 年起 , 每年一次, 已先后三次
4、举行了全球地理计算学术年会, 出版论文专集。作为数量地理学的深层次发展, 地理计算学的出现与发展, 对整个地理学科, 尤其是 对人文、 经济地理学的理论模型和应用研究, 已经产生并将继续产生深远的影响。 当前人文地理学中常用的统计学方法主要有以下几个:1、回归分析方法回归分析方法是研究要素之间具体数量关系的一种强有力的工具。回归分析方法主要用于相互关系分析,主要是对地理要素地理事物之间的相互关系进行定量分析,可以找出地理要素之间的定量表达式,建立反映地理要素之间关系的具体数学模型,即回归模型。因地理要素之间的关系有线性的也有非线性的,所以回归模型有线性模型和非线性模型。回归分析方法还可用于趋势
5、面的分析。用回归分析方法计算出所要分析的地理要素的趋势面方程,去拟合地理要素分布的空间形态,进而进行研究。回归分析还可用于过程模拟与预测研究。通 过回归分析方法对地理过程进行模拟和拟合,揭示地理要素、地理现象随时间的变化规律从而对其未来发展趋势做出预测。如地理科学第 29 卷第 5 期城市紧凑度的总和测度及驱动力分析以江苏省为例一文就运用了回归分析的方法对城市紧凑度及主要驱动力进行了分析,得出制度调控力、市场拉动力、人口推 动力对江苏城市紧凑度影响显著,交通引导力还需要进一步加强的结论。2、主成分分析主成分分析是对于原先提出的所有变量,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且
6、这些新变量在反映课题的信息方面尽可能保持原有的信息。设法将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出几个较少的综合变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析,是数学上对数据做降维处理的一种重要方法,相对更为客观且变量维数降低便于描述理解和分析。如地理科学2009 年第 4 期浙江省新型工业化地域差异及其机理研究文章中用主成分分析法建立新型工业化水平评价体系。文章选取了 14 项指标为新型工业化内涵评价的基本分析变量,以浙江省 69 个县市的指标为样本,以上述 14 个指标的标准化数据为变量构建矩阵,采用 SPSS 软件对数据进行处
7、理,采用 KOM 样本测度进行检验。3、空间自相关空间自相关是衡量不同空间单元相互关联性的主要方法,是检验某一现象是否显著的与其相邻空间单元的现象相关联的重要指标。通过对空间现象分布格局的可视化描述,发现空 间集聚和空间异常,揭示研究对象之间的空间作用机制,为进 行区域差异的空间 分析提供了有效方法,有利于克服传统的统计方法在进行研究区域经济差异方面的不足。根据空间研究目的的不同,空间自相关可分为全局空间自相关和局部空间自相关。全局空间自相关是通过对属性值的空间特征的整体描述,揭示区域整体的空间关联和空间差异程度。如地理研究第 28卷第 2 期省际边缘区域经济发展差异时空格局及驱动机制以淮海经
8、济区为例一文就采用了全局自相关分析方法,对 1996-2005 年淮海经济区经济差异的时空特征、趋势及驱动机制进行了初步探索,文中采用 Morans I 方法4、模糊层析分析法层次分析法(Analysis Hierarchy Process 简称 AHP)是一种对非定量事件处理的多目标决策方法,该方法的关键步骤是构造判断矩阵,其量化通常采用 1-9 标度,有时 由于决策者对事物 认识的多样性以及客观事物的复杂性,从而使不同决策者对决策对象有不同的偏好,给出的判断矩阵不能很好地反映实际,这样就出现了“不确定性 ”。模糊层次分析法对客观存在的“不确定性 ”采用了0,1区间进行定性描述,基于模糊集合
9、理论的模糊一致关系和模糊一致矩阵,在评价含有多指标、带 有模糊性的方案优选 中能得到更加满意的优选结果。如人文地理2009年第 1 期乡村人居环境的居民满意度评价及其优化策略研究以石首市久合埦乡为例一文运用了模糊综合评价法对乡村人居环境满意度进行评价。以上方法只是人文地理现象研究中应用统计学方法的简单介绍,希望能对大家理解统计学在人文地理现象研究中的重要性起到抛砖引玉的作用。人文地理学者所作的许多工作,都包含对地理系统进行比较或建立地理系统的统计模式。比较就是意味着对地理事物的差异、相似和联系的识别,而在 统计方法中,很多方法就是为 了判别一些资料是否来自不同的总体,这一类方法统称为差异的显著
10、性检验。人文地理系统各要素之间的相互关系,可通过大量的观测、试验或实验取得一定的地理数据,然后用数理统计的方法, 寻找出隐 藏在随机性后面的统计规律,最后用回归方程来表达。地理计算学的出现与发展, 得益于计算机技术和计算理论和方法的巨大发展。90 年代并行超级计算机硬件的成功实现, GPS、RS、GIS 术在获取大容量、整体性地理数据信息中的成功应用, 以超级计算机为 基础的一系列高性能计算新方法的实现, 使计算与实验 共同构成了人类认知客观世界的有效科学工具。地理计算已不是传统意义上的利用计算机求解地理问题的计算, 它以向量或并行处理器为基础的超级计算机为工具, 对“整体、大容量” 资料所表
11、征的地理问题实施高性能计算,探索构筑新的地理学理论和应用模型。这些“ 整体、大容量”资料所表征的地理问题, 在人文、经济 、城市地理学的相关研究中, 有诸如城市中金融交易所之间以电话为载体的信息流问题;有在城市内核、边缘区通勤职工起讫点之间人流等的预测; 有跨国大区域人口普查, 人口预测, 人口规划问题; 有城市内部作为城市基础的生命单元的家庭, 社区的类型、结 构、功能、 组织等的重构; 有城市信息产业、信息经济发展机制及革新等的模拟; 有城市不同时间、 空间尺度上的形态演变动力学等,它们 都是城市地理研究课题的深入与发展。高性能计算所依赖的计算方法与理论模型, 除继续应用 80 年代中叶以
12、来在地理学模型研究中成功引入的突变、自组织、混沌、分支、分形等模型外, 在地理计算学中占重要地位的是神经网络模型(neural network), 遗传算法模型(genetic programming), 细胞自动机模型(cellular automata ran), 模式参数随机取 样模型(dom sampling ofmodelparameter), 模糊逻辑模型 (fuzzy logic geographi ) , 改进了的地理加权回归(callyweighted regression)等。 S奥彭肖教授所 领导的地理计算中心成功地利用了爱丁堡大学拥有 512 个处理器的超级并行计 算机
13、 Cray T3D, 利用人工神经网络模型, 遗传算法模型和模糊逻辑模型研究空 间互作用这一地理学的固有命题, 对 英国达勒姆市( Darham)通勤职工流动大容量资料实施高性能运算; IGU 数学模型专业委员会主席 M费希尔 (Fischer)教授利用神经网络模型对奥地利通信网络的研究; 英国 M巴蒂教授利用细胞自动机理论模型和专用软件对城市和城市系统形态生成, 演变的模拟等都是近年来地理计算学理论与应用研究具有开创性意义的成果。可以预期, 地理计算学的发展将对地理科学的理论和模型研究产生深远影响。今天, Geocomputation 尽管对大部分地理学家来说还颇为陌生, 但正如Geomat
14、ics 在经过诸多科学家相当长一段时间的努力后已为广大地学工作者所接受那样, 地理计算学这一源于数量地理学的新理论与方法, 亦必将成为地理科学前沿研究领域的重要组成部分而为地理学家们所认同。地统计学(Geostatistics ),又称地质统计学,他是在法国著名统计学家G.Matheron(1963)大量理 论研究的基础上逐渐形成的一门新的统计学分支。地统计学的应用领域非常广泛,从开始的采矿学、地 质学研究领域渗透到土壤、 农业、水文、气象、生态、海洋、森林和环境治理等广阔领域。目前,地统计方法已经被引入人文地理学研究领域。地统计学是一种能够弥补经典统计学缺陷的比较好的方法。它在考虑样本点位置方向和彼此之间的距离的基础上,直接测定空间结构的相关性和依赖性,研究具有一定随机性和一定结构性的各种变量的空间分布及变异规律。关于人文地理学的计量化方法的研究,近几年来发展迅速。从计量方法来看,值得注意的发展趋势是:发展复变量分析,如相关分析、因子分析、判别分析等;二维空间级数分析日益受到重视;注意概率模式理论上的发展。人文地理学今后的研究重点将是人类空间活动及空间现象与环境等,因此最优化方法、人文地理系统模拟和预测,将进一步得到广泛应用。