1、基于 OLI 数据与决策树法的去山体阴影水体信息提取研究 张红梅 王大卫 高杨 公维朕 安徽理工大学地球与环境学院 宿州学院环境与测绘学院 摘 要: 研究山区地表水体信息 OLI 遥感数据去阴影自动提取方法, 设计基于数字高程模型与指数提取的决策树分类方法, 提高水体自动识别的精度。该方法选取改进的归一化水体指数、归一化植被指数、比值植被指数、主成分分析前 3 个分量以及波段之间的组合运算, 并结合 DEM 构建决策树分类规则。综合采用单波段阈值、谱间关系、植被指数和水体指数阈值完成山体水体的去阴影识别研究, 与计算机自动识别分类方法比较, 其精度明显提高。结果表明, 决策树分类方法在精度上明
2、显高于常用的计算机自动分类方法, 可以很好地被利用于 OLI 遥感数据水体信息的海量、大范围提取。关键词: 山区; 地表水体; 山地阴影; OLI 数据; 决策树法; 作者简介:张红梅 (1982-) , 女, 讲师, 博士研究生.收稿日期:2017-01-02基金:国家重点研发计划项目子课题 (2016YFD0300801) A study of extraction method of mountain surface water based on OLI data and decision tree methodZHANG Hongmei WANG Dawei GAO Yang GONG
3、 Weizhen School of Earth and Environment, Anhui University of Science Environment and Surveying Engineering College, Suzhou University; Abstract: The automatic extraction method of OLI remote sensing data for surface water body in mountainous area is studied.The decision tree classification method b
4、ased on DEM and index extraction is designed, which improves the accuracy of automatic identification of water body.The improved normalized water index (MNDWI) , ratio Vegetation Index (RVI) and normalized difference vegetation index (NDVI) are selected, and the decision tree classification rules ar
5、e constructed with the digital elevation model (DEM) .At the same time, the method of threshold value method, spectrum-photometric method, vegetation index and water index threshold method are used.The research result shows that the decision tree classification method is obviously higher than other
6、methods, which can be used in the extraction of surface water of OLI image data.Keyword: mountain; surface water; hillshade; OLI data; decision tree; Received: 2017-01-02水资源与水环境监测与调查是合理规划和有效利用水资源的基础。遥感水体监测技术具有监测范围大、适时性、动态性、周期短、信息量大等优势, 在水体信息监测方面发挥着重要作用1。利用遥感技术提取水体信息在水资源调查与评价、湿地信息提取、海陆交替地带监测和洪水水情监测等领
7、域被广泛应用。针对 Landsat 卫星数据 TM 和 ETM+影像, 水体信息提取的方法研究成果较多2-4。常用的方法有单波段阈值法、 (TM2+TM3) / (TM4+TM5) 谱间关系法、植被指数法和水体指数法5等方法。单波段阈值法主要利用近红外波段水体与其他地物光谱差异进行阈值确定完成水体提取, 阈值确定较难。目前常用的美国陆地资源卫星系列已进入 Landsat8 星 OLI 影像数据, OLI 数据的山区去山体阴影混淆的水体信息计算机自动识别方法研究, 其研究结果对于调节山区水利、促进农业发展、合理排泄灌溉等具有十分重要的意义。1 试验区介绍六安市辖 3 区 4 县, 位于安徽省西部
8、, 地处江淮之间, 南北长 179 km, 东西宽176 km, 面积约 15 490km。六安大地构造隶属秦岭褶皱系 (东端) 和中朝准地台 (南缘) 两个级构造单元, 自南向北为跨武当淮阳隆起、北秦岭褶皱带和华北断坳 3 个级构造单元, 进一步划分为大别山复背斜、佛子岭复向斜、合肥六安凹陷等次级构造单元。六安市西南高, 东北低, 由南向北呈阶梯状分布, 具山地、丘陵、岗地和平原4 个地貌类型。六安市山脉隶属大别山山脉, 为长江和淮河分水岭, 将全市分为长江与淮河两个流域。境内山脉分为西南段皖山和东段霍山, 平均海拔 400m以上。六安地区地处北亚热带的北缘, 属湿润季风气候。其特征是:季风
9、显著, 雨量适中;冬冷夏热, 四季分明, 雨季集中在 79 月份。植被为亚热带常绿阔叶林植被带、皖中落叶与常绿阔叶混交林。六安市辖区有丰富的水资源。辖区内有淠河、史河、杭埠河 3 大河流, 为防洪、工农业生产以及建立良好的生态环境, 建国以来, 在六安大别山三大河流上游先后修建了著名的梅山、响洪甸、佛子岭、磨子潭及龙河口等几座大型水库。2 OLI 影像数据处理2013-02-11, 继 Landsat 计划 40 后 NASA 再次成功发射了 Landsat 8 卫星, 该星携带有两个主要传感器:OLI 和 TIRS。OLI 陆地成像仪包括 9 个波段, 空间分辨率为 30 m, 其中包括一个
10、 15 m 的全色波段, 成像宽幅为 185km185km。OLI包括了 ETM+传感器所有的波段, 调整了 OLI Band5 (0.8450.885um) , 排除了0.825um 处水汽吸收特征;新增蓝色波段 band 1 (0.4330.453um) 和短波红外波段 band 9 (1.3601.390um) 。选取四景 OLI 影像 12238 (20151011) 、12138 (20151002) 、12139 (20151002) 和 12237 (20151011) , 统一高斯克吕格北京 54 坐标系 6 度分带投影方式, 完成影像的大气校正、几何校正、镶嵌、边界切割处理等
11、, 完成六安市 Landsat8 OLI7 个 30 m 空间分辨率波段数据的处理。 (图 1 为 OLI 数据band7、band5 和 band4 波段的 RGB 假彩色合成影像) 。图 1 六安市 OLI 数据 754 波段 RGB 合成图 下载原图3 指数提取遥感卫星数据地表水体的提取方法主要有:目视解译法、单波段阈值法、监督分类与非监督分类法、指数法6、谱间关系法等7。利用目视解译方法, 山体阴影与部分河流及湖泊均为暗黑色 (见图 2) , 难以区别, 计算机自动分类方法也不理想。研究区湖泊、河流地表水体空间分布分散, 目视解译效果不佳。因此选择合适波段, 利用水体 OLI 数据的光
12、谱反射特性, 提取地表水体的谱间关系指数8, 建立水体光谱特征模型, 确定其阈值, 并结合 DEM 建立决策树分类规则对地表水体信息进行提取9-10。图 2 754 波段 RGB 影像山体阴影与水体对比 下载原图提取的指数有:归一化植被指数 (NDVI, Normalized Difference Vegetable Index) 、比值植被指数 (RVI, Ratio Vegetation Index) 、改进的归一化水体指数 (MNDWI, Normalized Difference Water Index) , Band3+Band4、Band5+Band7、Band3+Band4+Ba
13、nd5+Band7 数据, 并选取主成分分析前 3 个分量和 DEM 数字高程、坡度数据, 共提取相关特征指数 11 个, 与OLI 原始数据组合完成决策树分类基础数据库, 空间分辨率均为 30m。其中:NDVI= (NIR-R) / (NIR+R) , RVI=NIR/R, MNDWI= (G-SMIR) / (G+SMIR) .式中:NIR, R, G, SMIR 分别为 Landsat-8 卫星 OLI 数据的近红外 band5、红光band4、绿光 band3 和短波红外波段 band7 (2.112.29um) 。植物具有在可见光红光波段强吸收, 近红外波段高反射的特征, 因此利用近
14、红外 band5 和红光 band4 组合运算, 得到 NDVI 和 RVI 指数, 利用决策树方法, 分类植被与其他地物。NDVI 指数对于植被覆盖度低、植被生长状态的监测灵敏;植被覆盖度较高时 RVI 指数值指示效果较好, 并且 RVI 能有效地区分阴坡植被与山体阴影。徐涵秋在 Mcfeeters 提出的归一化差异水体指数基础上, 提出改进的归一化差异水体指数 (MNDWI) , 可以很好地区分水体和水体阴影, 同时达到抑制建筑物和植被覆盖信息的效果5。4 决策树分类决策树分类方法是基于遥感光谱特征等数据, 通过对数据统计、分析、判别, 结合专家经验, 建立分类指标数据集和决策树分类规则,
15、 提取信息的方法。其技术路线为遥感影像处理特征参数提取和 DEM 数据获取标准样区统计建立规则分类后处理、精度验证和应用。该方法具有多源数据综合利用、便于理解、易于操作等优点, 并且大量研究结果表明该方法分类精度较高11-12。分类精度通过目视判读和计算机统计分析相结合的方式进行评价。实验结果表明:1) 水体和山体阴影在 OLIband1 至 band5 和 band7 波段 value 值均小于其他覆盖地类。2) band1 至 band4 波段山体阴影的 value 值均接近于 0, 此时与深度和面积较大的水体 (面积数十 km, 深度 50m 以上的六安地区水库) 光谱特征与山体阴影较为
16、接近, 目视效果也相似 (见图 2) , 造成“异物同谱”的现象。3) OLI 数据的 band5 单波段山体阴影与水体光谱特征相似, 但与其他地类差异较大, 可以直接利用 band5 单波段阈值法区分两个类别:第一类为水体和山体阴影, 第二类为其他地类 (见图 3) ;同时试验得出主成分第一分量对于区分此两类地物效果也较好。图 3 水体、阴影和其他地物 OLI 数据光谱统计 下载原图4) 直接利用 band1 至 band4 单波段阈值分类水体与山体阴影效果不好, 如面积较大、深度较浅的水体 (区域北部沟通淮河的瓦埠湖) 目视效果与光谱特征与山体阴影差别较大。5) 水体与山体阴影在 NDVI
17、, RVI, MNDWI 和Band3+Band4+Band5+Band7、band5+Band7、Band3+Band4 及 DEM 坡度数据上均能较好地区分。反复试验建立研究区决策树分层分类规则 (见图 4) 。图 4 OLI 数据去山体阴影水体提取决策树 下载原图规则 1:Band51600or 主成分 , 决策其他地类, 否则执行规则 2;规则 2:NDVIBand5, 决策为水体, 否则运行规则 3;规则 3:MNDWIBand2, 决策为山体阴影, 否则运行规则 4;规则 4:高程500or slope15, 决策为山体阴影。部分水库与山体阴影光谱特征相同, 各波段 value 均
18、接近于 0, 通过 DEM 高程和坡度决策分类。5 结果与分析为了更好地评价决策树分类的精度, 选择计算机自动分类的监督分类方法 (最大似然法, 标准样区与决策树分类法相同) 和非监督分类方法 (动态聚类法) 同时完成该研究区 OLI 数据的自动识别工作, 分类结果部分区域显示见图 5、图 6 和图 7, 图中蓝色填充部分为水体覆盖, 黑色为山体阴影, 白色为其他地类;图 7 红色部分为水体。图 5 决策树分类结果 下载原图图 6 754 波段 RGB 图和决策树分类结果 下载原图图 7 动态聚类 (左) 和最大似然分类 (右) 下载原图从图 6 和图 7 可以看出, 由于山体阴影和山区深度较
19、深的水库光谱特征极为相似, 仅通过 OLI 数据原始波段的计算机统计识别, 会产生混淆像元, 从而很难区分水体和山体阴影的信息。非监督分类将水体和山体阴影直接分类为同一个类别;监督分类仍有将水体分类为阴影或阴影分类为水体的部分。在 91 卫图 13 级影像图上获取水体、山体阴影和其他地类三类地物训练样区276 个, 对样区特征指数和 DEM 等数据进行统计后建立决策树分类规则, 完成六安市地表水体信息的提取。采用误差混淆矩阵13的总体精度和 Kappa 系数评价分类结果。总体分类精度为被正确分类的像元数和验证总像元数的比值;Kappa 系数是评价分类精度的多元统计结果, 一般认为其值在 0.8
20、1.0 之间, 符合分类要求, 分类精度较高。研究结果显示:决策树分类总精度为 99.36%, Kappa 系数为 0.983 4, 采用同样的标准样区进行最大似然法分类, 其总精度为93.91%, Kappa 系数为 0.857 9。显然决策树分类方法在山体去阴影提取中优于计算机自动识别方法, 很好地避免了漏分、误分的现象。统计六安市面积为 15 468.56km, 其中水体面积为 938.78km, 占区域总面积的6.07%。6 结论1) 研究区山体阴影与水体光谱特征比较接近, 特别是水库水体部分, 与阴影光谱比较一致, 目视解译或计算机自动解译很难区分提取。2) Band5 波段和主成分
21、 1 波段对于区别水体、山体阴影与其他地物, 效果明显。3) NDVI, RVI 和 MNDWI 能很好地区分水体和山体阴影;与山体阴影极为相近的水库水体部分, 辅助 DEM 的高程和坡度建立决策规则。4) 山区山体阴影面积较大, 目视判读解译水体, 并区分山体阴影很难实现解译工作, 必须进行计算机自动识别方法研究。与常规的计算机自动监督分类与非监督分类方法相比较而言, 决策树分类方法能很好地提高山区水体提取的精度。从监督分类最大似然法 Kappa 系数为 0.857 9 提高到 0.983 4。5) 对于山地地区, 特别是大范围提取地表水体信息, 利用 30m 空间分辨率的OLI 数据, 完
22、全能够满足分类要求。对于研究区域范围内小面积的水体空间位置和面积信息提取, 可以从提高数据空间分辨率和像元分解方法方面进行突破。研究中只完成了决策树分类方法与常规分类方法的对比研究, 后期仍可以添加决策树决策指标, 增加决策数据源或对比其他分类方法进行更深入的研究。参考文献1李纪人.与时俱进的水利遥感J.水利学报, 2016, 47 (3) :436-442. 2韩忻忆, 颉耀文.基于决策树的干旱区湿地信息自动提取以疏勒河流域为例J.遥感技术与应用, 2015, 30 (6) :1146-1152. 3王伟武, 朱霞, 孙跃池, 等.基于 ETM 图像的山地水体提取方法研究J.系统仿真学报,
23、2013, 25 (9) :2196-2200, 2205. 4杨甲, 张珂, 刘丽, 等.基于 SPOT-5 影像的吴哥地区水体提取方法研究J.测绘工程, 2016, 25 (3) :51-55. 5徐涵秋.利用改进的归一化差异水体指数 (MNDWI) 提取水体信息的研究J.遥感学报, 2005 (5) :589-595. 6李辉, 周启刚, 焦欢, 等.基于 TM 影像的重庆市都市区 NDVI 时空变化特征J.水土保持研究, 2015, 22 (6) :250-255. 7刘晓曼, 庄大方, 屈冉, 等.基于遥感数据的 19892009 年拉鲁湿地变化研究J.湿地科学, 2013, 11
24、(4) :433-437. 8王冰, 吕昌伟, 何江, 等.基于遥感的呼伦湖水体动态监测研究J.环境科学与技术, 2012, 35 (9) :94-98, 149. 9余超, 李明阳, 何隆华.利用决策树分类方法的南京江宁水稻面积变化研究J.遥感信息, 2015, 30 (2) :80-84. 10张红梅, 吴基文, 刘星, 等.特征提取和决策树法土地利用遥感分类J.测绘科学, 2014, 39 (10) :53-56. 11宋明明, 郑文龙, 卞国栋, 等.基于多时相 Landsat8 数据的南方丘陵区典型地物信息提取 以秦淮河流域为例J.科学技术与工程, 2016, 16 (18) :209-216. 12张璇.基于高光谱遥感的城市水网水体提取研究和实现D.济南:山东大学, 2014. 13李宜展, 潘耀忠, 朱秀芳, 等.土地覆盖类别面积混淆矩阵校正与回归遥感估算方法对比J.农业工程学报, 2013, 29 (11) :115-123, 295.