1、基于地理加权回归的石漠化影响因子分布研究 许尔琪 中国科学院地理科学与资源研究所陆地表层格局与模拟重点实验室 摘 要: 分析和识别石漠化的关键影响因子, 有助于有效治理和恢复石漠化。以往研究对影响因子的空间局部差异关注较少, 本文以黔桂喀斯特山地为研究区, 选取自然及社会经济等 12 个影响因子, 利用地理加权回归 (GWR) 模型, 在普通线性回归的基础上嵌入空间因素, 分析石漠化影响因子的空间分异。结果表明: (1) 黔桂喀斯特山地的石漠化 Morans I 大于正态函数在 99%显著水平, 存在明显空间聚集现象; (2) GWR 模型 R2 (0.508) 明显高于传统统计模型的 R2
2、(0.156) , 回归模型拟合效果显著提高; (3) 12 个影响因子与石漠化关系呈现不同数值大小、正负效应和线性组合关系的空间分布差异; (4) 人类活动叠加在喀斯特特殊的岩性、土壤和植被组合上, 显著影响石漠化分布;同时, 局部区域高强度人类活动导致石漠化的急剧变化。GWR 模型可揭示石漠化影响因子的空间分异规律和局部的关键影响因子, 刻画多因子组合作用对石漠化的影响, 有助于差别化的小流域石漠化治理。关键词: 石漠化; 影响因子; 地理加权回归模型; 空间分异; 黔桂喀斯特山地; 作者简介:许尔琪, 男, 广东汕头人, 博士, 主要从事土地利用及空间格局、生态环境效应研究。E-mail
3、:收稿日期:2017-08-23基金:国家自然科学基金项目 (41601095) Spatial variation in drivers of karst rocky desertification based on geographically weighted regression modelXU Erqi Key Laboratory of Land Surface Pattern and Simulation, Institute of Geographic Sciences and Natural Resources Research, Chinese Academy of Sci
4、ences; Abstract: Analysis and identification of key drivers of karst rocky desertification (KRD) can contribute to effective management and restoration. Ignoring heterogeneity leads to statistical bias and influences the specificity of desertification control planning. Taking Guizhou and Guangxi Kar
5、st Mountainous Regions as the study area, this paper chose twelve factors, including socioeconomic, spatial distance, topography, climate, soil, lithology and land use, as drivers of KRD. Geographically Weighted Regression modeling (GWR) and embedding spatial factors to the traditional ordinary line
6、ar regression (OLS) model were used to analyze the spatial distribution of influence on KRD. An obvious spatial agglomeration of KRD in the study area according to Morans I at the significant level of 99% was found. Coefficients of determination (R2) of GWR were much higher for OLS (0.508 vs. 0.156)
7、 , indicating a much better fit for the GWR model.Coefficients of GWR between twelve drivers and an obvious spatial distribution of value magnitudes, negative or positive effects and combined types. The specifics of the karst background create a fragile and vulnerable environment that is susceptible
8、 to human activities. Meanwhile, intense human activities lead to a sharp change in KRD status, which included the predatory sabotage for casing the severe KRD and the KRD restoration projects for reversing KRD to no KRD. The regression coefficients of the twelve drivers and their linear combined ch
9、aracteristics showed different spatial distributions based on GWR modeling. Using the GWR model revealed the spatial discrimination of the effects of driving forces on KRD and identified key drivers of KRD at the local area, revealing the spatial distribution of the joint effect of different driving
10、 forces helping provide a scientific reference to differential KRD control at small watershed scales.Keyword: Karst rocky desertification; driving force; geographically weighted regression model; spatial distribution; Guizhou and Guangxi Karst Mountainous Region; Received: 2017-08-23引用格式:许尔琪.基于地理加权回
11、归的石漠化影响因子分布研究J.资源科学, 2017, 39 (10) :1975-1988.Xu E Q.Spatial variation in drivers of karst rocky desertification based on geographically weighted regression modelJ.Resources Science, 2017, 39 (10) :1975-1988.1 引言“石漠化”是指热带、亚热带脆弱的岩溶环境中, 由于不合理人类干扰和破坏, 发生植被退化、土壤侵蚀和基岩裸露等的土地退化现象1-4。世界岩溶地貌集中分布区主要包括有欧洲中南部、北
12、美东部和东亚地区等三大片区。前两个片区上百年前就有石漠化, 如土耳其、法国、摩洛哥、意大利、克罗地亚等等都曾经有石漠化5-7, 但由于上述地区地质环境脆弱性较小、人口和经济压力相对较轻, 石漠化多为生态地质环境因素影响8,9。然而, 地处东亚片区中心地带的西南岩溶地区, 其石漠化问题不仅受地质背景的影响, 更是自然因素和人类活动叠加的结果10-14。因此, 分析和识别石漠化的关键驱动因素及其贡献程度, 有助于治理和恢复石漠化。石漠化吞噬西南岩溶地区民众的生存空间, 影响珠江、长江的生态安全, 制约区域经济社会可持续发展10,15,16。研究表明, 石漠化的影响因子众多14,17-20, 自然因
13、素包括地质条件、气候因素、地形因子和地貌类型等21-24, 人为因子既包括毁林开荒、坡地种植、超载过牧和开山开矿等加剧石漠化的行为, 也包括生态修复工程等治理石漠化的因素9,25-28。不同案例区影响石漠化的关键因素各不相同, 贡献率也有显著差异14,18,19, 但这些研究却很少关注石漠化与影响因子关系在案例区内的空间差异。考虑到石漠化治理和恢复多是以小流域为单元, 如果缺乏对因子影响程度空间分布的认识, 将影响石漠化治理规划和工程制定的准确性, 尤其随着研究区面积的增加, 空间差异和不确定性将进一步增加。因此, 本研究选定黔桂喀斯特山地, 采用地理加权回归 (GWR) 模型, 辨析石漠化与
14、影响因子关系的空间差异, 为喀斯特地区石漠化治理提供科学依据。2 研究区概况、研究方法与数据来源2.1 研究区概况本文以位于贵州和广西的黔桂喀斯特山地为研究区29, 该区覆盖峰林、峰丛和洼地等主要喀斯特地貌类型, 面积为 21.41 万 km, 约位于 22854“N-281227“N, 1041827“E-1102040“E 之间 (图 1) 。地势为西北高, 东南低, 山地多, 平地少。该区属亚热带季风湿润气候, 年均降雨约为 8001900mm, 年均温度为 923。作为中国石漠化分布的最严重区域, 各类型石漠化皆有分布, 是石漠化与影响因子关系研究的典型区。2.2 研究方法与数据来源2
15、.2.1 石漠化分级因石漠化分级标准较多, 尚无统一定论, 本文采用国家林业局官方发布的最新一期石漠化空间分布数据 (2011 年) 30, 并对部分结果进行人工修正, 该数据主要依据基岩裸露、植被覆盖和土壤覆盖程度进行石漠化分级31 (表 1) , 将石漠化强度等级分为无石漠化、潜在石漠化、轻度石漠化、中度石漠化、强度石漠化和极强度石漠化等 6 级, 分别用 16 表示。2.2.2 影响因子选取对比以往研究对石漠化影响因子贡献程度的结果14,17-20, 考虑数据的可获得性, 本文共选取 12 个影响因子 (图 2) , 包括社会经济、空间距离、地形、气候、土壤和土地利用等因素, 其数据来源
16、及处理过程见表 2 (见第 1978 页) 。以 1km1km 栅格单元对石漠化和影响因子进行空间重采样, 共计 21.41 万个单元, 进行后续分析。图 1 黔桂喀斯特山地范围 Figure 1 Boundary of Guizhou and Guangxi Karst Mountainous Region 下载原图表 1 石漠化等级分级标准 Table 1 Classification standard of karst rocky desertification 下载原表 2.2.3 数据预处理为避免指标之间由于量纲和数量级的影响, 本文采取 Z-score 标准化方法将石漠化分级及影响
17、因子进行标准化处理, 转化函数如下:式中 x为标准化后数值;x 为原始数值; 为样本数据均值; 为样本数据标准差。采用容差及方差膨胀因子 (VIF) 对影响因子与石漠化关系进行共线性检验, 以避免由于因素之间高度共线影响回归分析结果。各影响因子容差均大于 0.1, 方差膨胀因子 (VIF) 均介于 010 之间 (表 3) , 因素之间不存在高度共线性, 可直接进行回归分析。2.2.4 全局空间自相关检验选取 Morans I 指数检验石漠化分布的空间自相关性, 判断其在空间上集聚的特点和平均集聚程度42, 其计算公式如下:表 3 黔桂喀斯特山地石漠化与影响因子共线性检验结果 Table 3
18、Collinearity test results between karst rocky desertification and driving factors in Guizhou and Guangxi Karst Mountainous Region 下载原表 图 2 黔桂喀斯特山地石漠化影响因子空间差异 Figure 2 Driving forces of karst rocky desertification in Guizhou and Guangxi Karst Mountainous Region 下载原图表 2 黔桂喀斯特山地石漠化影响因子及其数据来源、处理过程 Table
19、 2 Driving forces of karst rocky desertification and data sources and processing in Guizhou and Guangxi Karst Mountainous Region 下载原表 式中 i, j 为所在单元;n 为空间单元总数;W ij为空间单元 i, j 之间的影响程度, 若相邻则值为 1, 不相邻为 0;Xi, Xj为 X 在相应空间单元 i 和 j 上的石漠化分级数值;X为 X 的平均值。I 值区间为-1, 1, 值越趋近于 1 或者-1, 表明空间分布差异性越大, 接近 0 则代表单元间不相关。应用
20、 Arc GIS 10.1 软件中的Morans I 指数工具进行计算。2.2.5 地理加权回归模型地理加权回归模型 (GWR) 是对普通线性回归-最小二乘法 (OLS) 的扩展, 将数据地理位置镶嵌到回归模型之中43,44, 可体现空间分异规律, 反映自变量与因变量在空间上的相互影响关系。其计算公式如下:式中 i 为样本点;y i为样本点 i 的因变量; (u i, vi) 为样本点 i 的空间位置; j (ui, vi) 为连续函数 j (u, v) 在样本点 i 的值;P 为样本点 i 独立变量的个数; i为随机误差项。利用 Arc GIS10.1 软件中的 GWR 工具来实现模型构建,
21、 以高斯函数确定权重, 并选取 AIC 方法确定最有效带宽。3 结果及分析3.1 黔桂喀斯特山地石漠化分布黔桂喀斯特山地 2011 年在各石漠化等级均有所分布 (图 3) , 其中, 无石漠化和潜在石漠化面积最大, 分别为 13.59 万 km 和 3.35 万 km, 各占总面积的63.48%和 15.66%;其余类型石漠化面积较低, 重度、中度和轻度石漠化分列三到五位, 比例分别为 8.23%、6.73%和 4.84%, 极重度石漠化面积最少, 比重仅为 1.06%。Morans I 指数为 0.56, 标准化统计量 Z (I) 值为 514.97, 大于正态函数在 99%显著水平时的临界
22、值 2.58, 表明石漠化存在着显著空间集聚现象。图 3 2011 年黔桂喀斯特山地石漠化空间分布 Figure 3 Spatial distribution of karst rocky desertification in Guizhou and Guangxi Karst Mountainous Region in 2011 下载原图无石漠化是全区基底, 其余等级石漠化在贵州和广西的空间分布有一定差异。广西范围石漠化的分布相对集中且等级差别相对明显, 广西东南部和西部石漠化等级相对较低, 主要以无石漠化等级分布为主, 而中部石漠化等级相对较高, 重度石漠化和极重度石漠化等级集中分布在该区
23、域。贵州范围内石漠化的空间分布格局更为分散, 以潜在石漠化和轻度石漠化两种等级分布为主, 在各个区域皆有所分布, 中度以上等级石漠化则多分布在西部。3.2 石漠化 GWR 模型拟合结果GWR 模型与 OLS 模型相比, 其拟合效果显著提高 (表 4) , GWR 的拟合优度 R (0.508) 明显高于 OLS 中的 R (0.156) , GWR 的 AIC (42 551.165) 远小于比OLS 的 AIC (564 901.811) 。同时, GWR 模型的标准化残差值的范围在-3.37, 3.65, 其中约 99.76%的范围在-2.58, 2.58, 表明标准化残差值在 99%的显
24、著性水平下是随机分布。GWR 模型对自变量在每个空间位置的回归系数进行局部统计, 分别得到回归系数的统计特征 (表 5) 以及直方图累积分布 (图 4) 。人口密度 (x 1) 、到主要公路的距离 (x 4) 、海拔 (x 5) 、坡度 (x 6) 、年均气温 (x 8) 、植被指数 (x 9) 、土壤砂粘百分比 (x 10) 、碳酸盐比例分级 (x 11) 和土地利用分级 (x 12) 等因素对石漠化影响程度的波动区间较小, GDP (x 2) 、到主要铁路的距离 (x 3) 、年均降水 (x 7) 等因素对石漠化的影响程度波动区间较大。因子回归系数均呈现出正负变动幅度, 主要集中在-1,
25、1范围内, 围绕在 0 上下浮动。除人口密度、GDP、海拔、坡度和植被指数等 5 个因子有一定偏态分布, 其余因子呈较明显正态分布。GDP、植被指数、碳酸盐岩百分比等因子回归系数小于 0 的比例较大, 其他因素与石漠化的回归系数大于 0 的比重较大。表 4 GWR 模型参数估计及检验结果 Table 4 Parameter estimation and test results of the GWR model 下载原表 表 5 黔桂喀斯特山地石漠化影响因子的 GWR 模型回归系数的描述性统计 Table 5 Statistical characteristics of GWR regress
26、ion coefficients for driving forces of karst rocky desertification in Guizhou and Guangxi Karst Mountainous Region 下载原表 图 4 黔桂喀斯特山地石漠化影响因子回归系数统计 Figure 4 Histogram statistics of regression coefficients of GWR for different driving forces in Guizhou and Guangxi Karst Mountainous Region 下载原图3.3 石漠化影响因
27、子的空间分异规律利用 GWR 模型, 分析石漠化影响因子回归系数的空间分布 (图 5) , 结果表明, 每一因子回归系数呈现不同的正负和数值的空间变化, 且各因子系数的空间分布各不相同。一方面, 不合理人类活动可加剧石漠化, 有效保护的行为和工程则可治理石漠化, 这使得量化人类活动强弱的驱动因子与石漠化在不同空间位置可能正负效应和影响大小的差异。另一方面, 因子多以联合作用影响石漠化的分布, 由于某个关键因子在局部的影响程度以及因子间的相关性, 使得其他影响因子在回归方程中系数发生变化。因此, 影响因子与石漠化关系, 在空间上呈现出影响程度、正负效应和因子组合的显著差异。3.3.1 社会经济因
28、子对石漠化影响的空间分异规律人口密度回归系数呈现“中间低南北高”分布, 与石漠化呈明显正相关区域主要分布在黔西、黔北、桂西和桂南, 人口集聚加大了对土地的压力, 加剧石漠化。呈明显负相关区域, 集中分布在黔南及桂中西的天等、兴宾和上林等县 (市) , 研究表明, 很多石漠化严重等级区域的人口较少, 生态环境较差45, 石漠化受自然因子 (如岩性、土壤和坡度) 的影响更大, 使得人口密度回归系数为负值。GDP 对石漠化的影响程度变化幅度较大 (图 5) , 但仍主要集中在-1, 1之间 (图 4) , 回归系数总体呈现“西低中东高”格局。黔东, 桂东以及黔桂交界的GDP 与石漠化呈明显正相关,
29、区域经济发展的提高以资源掠夺和破坏环境为代价, 如桂西北红水河流域建立高能耗的林板厂46, 大量砍伐木材, 严重破坏植被, 加剧石漠化;呈较大负相关区域主要分布在黔西、桂中和桂西南, 生态建设与产业发展和农民增收相结合, 如黔西南的“晴隆模式”、“坪上模式”和“顶坛模式”等47, 既增加区域 GDP, 又增大对石漠化治理投入, 从而, 有效减轻对土地压力和治理石漠化, 使得 GDP 与石漠化关系以负相关为主。3.3.2 空间距离因子对石漠化影响的空间分异规律两类空间距离因子对石漠化影响无明显空间分布规律, 距离因子影响了人类活动的可达性, 距离因子小, 表明人为干扰活动范围和强度大, 同时,
30、石漠化治理工程实施可能性也增加, 使得因子与石漠化正负相关关系并存48;随着距离因子增大, 人为活动减弱, 以距离因子与其他因子复杂组合影响为主。到主要铁路距离回归系数在贵州极值分布少, 而广西波动较大。在贵州修文、清镇以及广西东兰、巴马、罗城和环江等县 (市) 内, 因子与石漠化正相关较大;负相关较大区域主要集中广西河池、都安、上林、靖西、凌云和那坡等县 (市) 内。各县 (市) 主要公路可达性较好, 道路的影响较为相似, 因此回归系数波动较小 (表 5) , 正负交错分布。到主要公路距离与石漠化正相关较大区域 (回归系数为 0.3291.049) 主要集中在贵州凯里、织金、康宁、紫云, 以
31、及广西河池、宜州、南丹、忻城、那坡和大新等县 (市) 内 (图 5d) ;负相关较大区域则零散分布在黔西北以及桂中、桂南, 这些区域道路可达性相对较差, 以土壤和岩性因子的影响为主。3.3.3 地形因子对石漠化影响的空间分异规律海拔和坡度回归系数变化均相对较小, 分别在-2.5855.539 和-0.3510.835 范围内 (表 5) , 呈“东南高西北低”的空间分布 (图 5e, 图 5f) 。海拔和坡度影响植被和土层的分布, 随着海拔和坡度增加, 植被生境变差, 土层变薄, 容易加剧石漠化。因此, 海拔与石漠化关系以正相关为主, 正相关较大区域主要集中在贵州六盘水、西秀以及广西中东部;零
32、星区域因子与石漠化负相关较大, 包括贵州大方、兴仁、安龙和广西都安、德保、武宜、天等、兴宾等县 (市) , 随着海拔升高, 人类活动受到限制, 有利于石漠化改善。坡度回归系数以正值为主, 负值多分布在贵州。黔中和桂中东部该因子与石漠化正相关较大, 负相关较大区域则主要分布在黔西、黔北和桂西南。坡度较低区域, 坡度增加, 发生水土流失风险越高, 容易加剧石漠化, 坡度与石漠化呈正相关关系;当坡度增加到一定程度, 限制了人类活动, 随着坡度增加, 人类活动减弱, 有助于石漠化恢复, 坡度与石漠化为负相关。如清镇市王家寨流域研究表明, 石漠化严重程度随坡度增加而升高, 超过 27后石漠化程度则逐渐降
33、低49。图 5 黔桂喀斯特山地石漠化影响因子回归系数 Figure 5 Spatial distribution of GWR regression coefficients for driving forces of karst rocky desertification in Guizhou and Guangxi Karst Mountainous Region 下载原图图 5 黔桂喀斯特山地石漠化影响因子回归系数 Figure 5 Spatial distribution of GWR regression coefficients for driving forces of kars
34、t rocky desertification in Guizhou and Guangxi Karst Mountainous Region 下载原图3.3.4 气候因子对石漠化影响的空间分异规律年均降水和年均气温回归系数皆分布较为分散。贵州和广西中东部年均降水量与石漠化正相关较大, 降水量增加, 增强了对土层的冲刷动力, 加剧水土流失和石漠化;负相关较大区域 (回归系数为-18.087-3.831) 则分布在黔东北和黔桂交界 (图 5g) , 区域降雨增加有利于植被生长, 植被盖度的增加又有利于石漠化改善, 使得两者呈负相关关系。年均气温与石漠化正相关关系较大区域主要集中在贵州中部, 以及
35、广西河池、宜州、南丹、忻城、那坡等县 (市) 内, 气温升高, 加速喀斯特发育和土层干化, 进而影响植被生长, 产生石漠化;负相关关系较大区域主要集中在贵州南部以及广西中南部, 上述区域降雨大、植被盖度高, 三者相互影响值得气温与石漠化呈负相关。3.3.5 植被因子对石漠化影响的空间分异规律植被指数越大, 表明植被生长状况越好, 越有利于水土保持, 因此, 植被指数与石漠化的关系以负相关为主。回归系数的波动相对较小, 变化范围分布在-0.8500.349 (表 5) , 呈现“东高西低”的空间分布格局 (图 5i) 。与石漠化负相关较大区域主要集中在贵州的六盘水市辖区、大方、纳雍、关岭、晴隆、
36、安龙、隆林以及广西德保、平果、田东、凌云等县 (市) ;正相关较大区域零散分布在贵州东部和广西东北部, 这些区域植被指数数值较高且变化很小, 包括人口密度、GDP 等人为因子对石漠化的影响更大, 使得回归关系呈现一定的弱正相关。3.3.6 立地因子对石漠化影响的空间分异规律土壤质地对石漠化影响的变化范围相对较小, 土壤砂粘百分比回归系数分别在-1.9621.105 (表 5) , 分布较为零散, 正负交错。研究区东部该因子与石漠化正相关较大;负相关较大区域则零散分布在贵州大方、长顺、惠水、独山和广西柳江等县 (市) 内, 土壤质地的变化与石漠化存在一定非线性关系50, 使得该因子无明显空间分布
37、特征。岩性因子回归系数变化幅度也较小, 在-1.7271.417 之间, 呈现“东高西低”格局 (图 5k) 。碳酸盐岩比例分级与石漠化负相关较大区域主要集中在黔西南和桂西北, 该因子级别越低, 则碳酸盐岩比例越大, 有利于岩溶发育, 加剧石漠化;与石漠化正相关较大区域主要集中在黔东和桂东北, 研究表明植被在特殊的喀斯特环境有很强适应能力, 裸岩暴露夹缝中仍能生长51, 因此, 上述区域人为因子贡献大, 通过合理的保护和修复有效治理石漠化, 促进植被恢复, 使得该因子系数呈正值。3.3.7 土地利用分级对石漠化影响的空间分异规律土地利用分级回归系数范围为-0.4710.527 (表 5) ,
38、对石漠化影响程度变化较小, 呈“桂中高、其余低”分布格局 (图 5l) 。该因子与石漠化在贵州晴隆、施秉以及广西中部多个县市呈较大正相关, 土地利用强度大, 容易导致水土流失, 加剧石漠化;负相关较大区域分布零散, 包括有贵州清镇、石阡、余庆、纳雍、紫云、独山, 以及广西环江、罗城、凤山、东林、凌云和德保等县 (市) 内, 脆弱的喀斯特是石漠化形成的主因, 自然因子贡献大, 使得该指标为负值。4 结论黔桂喀斯特山地石漠化 Morans I 指数为 0.56, 标准化统计量 Z (I) 值为514.97, 大于正态函数在 99%显著水平的数值, 存在明显的空间集聚分布。GWR模型分析加入空间要素, 克服了经典回归模型统计条件假设的缺陷, 其 R (0.508) 明显比 OLS 模型的 R (0.156) 高, 拟合效果显著提高。GWR 计算的各石漠化影响因子回归系数在正负区间皆有分布, 主要集中在-1, 1范围内, 呈现不同空间分布:人口呈“中间低南北高”, GDP 为“西低中东高”, 植被指数和岩性为“西低东高”, 海拔和坡度则是“东南高西北低”, 土地利用分级呈“桂中高、其余低”, 到主要铁路的距离、到主要公路的距离、年均降水、年均气温和土壤质地对石漠化的影响空间分布较为零散。