1、生态环境 2007, 16(1): 108-111 http:/Ecology and Environment E-mail: 基金项目:国家教育部“985 工程” GIS 与遥感的地学应用科技创新平台项目(105203200400006 )作者简介:王淑君(1976),女,博士研究生,主要从事 3S 在生态学方面的应用研究。E-mail: jjun_收稿日期:2006-07-04神经网络模型森林生物量遥感估测方法的研究王淑君,管东生中山大学环境科学与工程学院,广东 广州 510275摘要:森林生物量的估测是全球变化研究的基础,而遥感宏观、 综合、动态、快速的特点决定了基于遥感的生物量模型 为
2、森林生物量估测的发展方向,目前的遥感生物量估 测方法大多基于回归分析,需要 预先假设、事后检验,仅为经验性的统计模型。神经网络的分布并行处理、非线性映射、自适应学习和容错等特性,使其具有独特的信息处理和计算能力,在机制尚不清楚的高维非线性系统体现出强大优势,可以用于遥感生物量估 测。文章在野外调查的基础上,尝试应用 BP 网络和 RBF 网络技术,建立广州 TM 遥感影像数据与森林 样方生物量实测数据之间的神经网络模型,通 过训练和仿真,与生物量实测数据进行比较。 结 果表明,在独立样地估测 中,人工神经网络估测的相对误差均小于 15.18,获得了满意的效果。而 RBF 网络与 BP网络相比,
3、在识别 精度上、 稳定性、速度上,均 优于 BP 网络,其最大相对误差不超过 10.12,平均相对误差为 4.76%。可见应用神经网络方法的“黑箱” 操作虽 然难以归纳出指导性规律,但可以获得很高的精度。尤其 RBF 网络,在 训练完成后,可以应用该模型进行大区域生物量估算, 对于森林的规划及管理具有深远意义。关键词:landsat TM 数据;森林生物量;人工神经网络;BP 网络;RBF 网络中图分类号:X771.8 文献标识码:A 文章编号:1672-2175 (2007)01-0108-04森林生态系统作为陆地生态系统中最重要的一部分,在全球循环中具有举 足轻重的地位,森林生物量是整个森
4、林生态系统运行的能量基础和营养物质来源,森林的光合作用可以减少大气中 CO2的含量,森林生物量和净第一性生 产力的估算是地球碳循环和全球变化研究的基础。而在全球森林中,热带、 亚热带森林的地位非常重要 1,因此对森林生物量测定方法进行研究具有非常重要的意义。遥感特有的宏观、综合、动态、快速的特点,以及与森林生物量之间存在相关性 2,决定了基于遥感信息的森林生物量估测具有比传统方法更大的优越性。郭志华 3利用调查样方材积,建立与光 谱响应的回归方程,成功估算了粤西地区的森林生物量。杨存建 4比较 了利用原始波段、植被指数、地形因子、气象因子与生物量之间建立的不同的回归模型,得出了估测热带森林植被
5、的最佳回归方程。 这些估测的研究鉴于森林类型的多样性以及遥感生物量估算生态机理的认识,主要是根据光 谱信息对生物量进行回归分析,需要假设与检验线 性模式, 仅为经验性的统计模型。人工神经网络( Artificial Neural Networks, ANN)是近年来兴起的一种新的理论方法 5,具有分布并行处理、非线性映射、自适应学习和容错等特性,具有独特的信息处理和 计算能力,适用于机制尚不清楚的高维非线性系统,比 较其他方法而言,具有:(1)不需要预先假设,只需学 习训练样本;(2)能很好的适应有噪声的数据的优势。本文 应用常见的 BP(Back Propagation)网络和 RBF(Ra
6、dial Basis Function)网络算法,根据 TM 影像光谱信息,结合地面调查数据,进行森林生物量的反演。检验神经网络模型的精度,探讨其在遥感生物量反演中的 应用,并分析其优缺点,寻求生物量高效、准确的遥感估测方法。1 神经网络的原理人工神经网络(ANN)是模拟人脑智能结构的特点,将问题抽象的简化模拟 ,将神 经原连接成高度相关的多层网络结构,由各神 经元构成的并行协同处理的网络系统,从而实现 极为丰富的行为。具有独特的信息处理和解决能力 6-7,目前神经网络在生态系统模拟、生态数据处 理以及遥感生态参数的提取方得到了一定的应用 8-9。1.1 BP 网络BP 神 经 网 络 是 指
7、 误 差 反 向 传 播 算 法 (BP 算 法 )的 多 层 前 向 网 络 ,主 要 原 理 是 将 影 响 预 测 对 象 的因 子 作 为 网 络 的 输 入 ,将 预 测 对 象 作 为 网 络 的 输出 。网 络 确 定 后 ,利 用 该 网 络 进 行 监 督 学 习 ,识 别影 响 因 子 与 预 测 对 象 之 间 复 杂 的 非 线 性 映 射 关 系 ,在 参 数 适 当 时 ,能 收 敛 到 较 小 的 均 方 误 差 。BP 网络 包 括 输 入 层 、输 出 层 和 隐 含 层 ,同 一 层 神 经 元 之间 互 不 相 连 ,不 同 神 经 元 之 间 则 全 互
8、 连 。神 经 网 络的 权 重 是 由 前 馈 或 反 馈 通 过 若 干 个 神 经 元 相 互 连接 ,这 些 神 经 元 位 于 隐 含 层 ,并 通 过 其 连 接 输 入 层王淑君等:神经网络模型森林生物量遥感估测方法的研究 109和 输 出 层 。一个基本的神经原,它有 n 个 输入,每个 输入都通过一个适当的权值 wi(i=1,n)连接到神经元节点上,其输出函数 y f(WX,),这 里 Ww 1,w2,,wn,inixa1Xx 1,x2,,wn(W,X 分别为权值矩阵和输入矩阵),a 作为激活函数 f 的输入,激活函数的另一个输入是神经元的阀值 。BP 网络连接权值的调整,按
9、递推关系式进行,一般表达式 为:;uvuvuv)(式中:连接权修正量 ; 为学pinaouty1习速度,即 BP 网络任意连接 权的修正量,取决于该连接权输出端点的等效误差 和输入端点的实pout际信号 。piny1.2 RBF 网络RBF 网络结构由两层组成,即隐层和输出层,同层神经元之间没有连接,相 邻两层神经元完全连接,输入节点的作用是将 n 个 输入分布给隐含层的各神经元。输入的数目等效于所研究 问题的独立变量数目,隐层节点选取径向基函数作 为激活函数,RBF 径向基函数可有以下几种 选择:(1)高斯函数: /)(exp),(2ic(2)平方根函数: 1(3)逆平方根函数: ,与,iB
10、P 网络 表达式不同,其网 络的 输出为权值向量 w与输入向量 x 之 间的向量距离乘以阀值 ,即。),(wdisraby整个 RBF 网络的可调整参数有 3 组:各基函数的中心位置 、方差 (或称函数的 宽度参数 )jc2j和输出单元的权值 ,网络的学 习就是决定隐层径向基函数的中心值 和函数的宽度参数 ,并在j此基础上根据样本,利用最小二乘原 则,求出 输出单元的权值 的过程。 w2 数据准备地 面 生 物 量 数 据 根 据 野 外 样 方 调 查 获 得 ,主要 在 白 云 山 、帽 峰 山 、流 溪 河 风 景 区 附 近 进 行 。共设 样 方 80(针 叶 林 40 个 ,阔 叶
11、 林 40 个 ),选 取 有代 表 性 的 针 叶 林 ,阔 叶 林 幼 龄 、中 龄 、成 熟 龄 林 。森 林 群 落 的 样 方 为 30 m30 m(考 虑 到 TM 影 像的 地 面 几 何 分 辨 率 为 30 m)。样 方 调 查 测 定 每 棵树 木 的 胸 径 和 高 度 ,草 地 和 灌 木 林 调 查 其 平 均 高度 与 盖 度 。样 方 生 物 量 计 算 :单 株 乔 木 根 据 管 东 生 10建立 的 生 物 量 方 程 计 算 ,分 别 计 算 干 、枝 、叶 生 物 量 ,地 下 部 分 的 生 物 量 按 地 上 部 分 推 算 11,森 林 林下 植
12、物 及 草 本 、灌 木 群 落 的 生 物 量 按 张 洪 波 12的 方 程 计 算 。单株乔木生物量干生物量枝生物量叶生物量根生物量;样地生物量乔木生物量林下灌木草本生物量。样地定位采用样地定位,用手持式 Garmin Vista etrex GPS 进行。遥感数据为 Landsat 7 TM 广州幅,时间为2004 年 3 月 9 日,遥感影像经过预处 理:经过辐射校正和地形校正后进行几何校正,根据 15 万地形图选取 60 个地面控制点(GCP ),校正的平均 标准误差为 0.28 个像元,地面几何 误差为 8.4 m。在软件 erdas8.6 支持下求出归 一化植被指数NDVI、比
13、 值植被指数 RVI。 NDVI=(TM4TM3)/(TM4TM3);RVITM4/TM3 (M3、TM4 分别指影 3、4 波段的灰度值)将采样点在 arcgis 9.0 输入,与遥感影像数据统一到相同的坐标下,建立地理信息系 统数据库。3 模型的构建研究选取 tm 影像的 15、7 波段的象元灰度值, 归一化植被指数 NDVI、比 值植被指数 RVI 共7 个因子作为模型的输入变量, 选择该象元的所在地理位置的生物量作为模型的输出变量, 单位为thm-2。由于 阔 叶树和针叶树 的反射光谱特征存在显著差异 13-14,阔叶林与针叶林分别建立模型,从40 个阔叶林和 40 个针叶林样方数据任
14、选 35 组带入模型进行训练。剩余 5 组数据用于模型 训练完成后的仿真,检验模型的精度。在进入系统前,对原始数据进行标准化处理,仿真的 结果按公式反推还原。标准化的表达式为: jijijsx式中: ;nijj1nijx12)(BP 模型取 为三层结构,在利用 BP 网络模型进行预测时,关键在于训练样本的 选择,它直接影响模型的精度。由于森林类型的多 样性,因而所取 样方数据必须具有充分的代表性,全面代表研究区域的森林类型,使得输出与输入之 间变化的规律完全蕴含于网络的权值中,本研究的森林生物量 类型充分考虑的这点,在调查时寻找了具有代表性的 样方进行调查。 110 生态环境 第 16 卷第
15、1 期(2007 年 1 月)RBF 模型设计中,正交最小二乘法可以在确定中心的同时确定网络的连接权值,中心和 权值相配合使得期望输出的误差最小,首先 预选了一个隐含层单元数后,再预选一组 RBF 中心矢量,根据 选定的中心,使用输入样本矢量计 算回归矩阵, 这里采用了梯度算法对参数进行训练。4 模型的检验为了检验模型的可靠程度,BP 网络和 RBF 网络训练完成后,利用网络 sim 仿真函数,将剩余的5 组数输入网络,得出模型的反演 结果,与 实测值进行比较,检验网络模型的精度。其结果如表 1、表 2:结果表明,应用两种网络对两种森林 类型生物量的估算都获得了满意的结果,相 对误差小于15.
16、18%,平均相对误差为 8.22%,而 RBF 网络与BP 网络 相比,更加 稳定、精度更高,最大相对误差不超过 10.12,平均相对误差 为 4.76%。5 结论与讨论本文建立的人工神经网络模型较好地模拟了样方实际的生物量,经过验证 ,应用神经网络方法的“黑箱”操作虽然难以归纳出指 导性规律,但可以获得很高的精度。网络训练完成后,可以应用该模型进行大区域生物量估算,对 于森林的规划及管理具有深远意义。同时应用 BP 网络和 RBF 网络进行预测,结果表明 RBF 网络无论在识别精度上,还是稳定性、速度上,均优于 BP 网络,这是因为在 RBF 网络中,由于初始参数比较接近最优点,从而可以在最
17、初几步达到最优点,避免了 BP 算法易陷入局部最 优的缺陷,同时缩短了网络的训练时间 ,而且 RBF 网络模型的建立不需要大量的样本,有利于 实际的应用。神经网络方法虽有良好的非线性逼近能力,但在解决生物量估测量问题中还存在不少的问题,如实际预测因子的选择问题。在 实际工作中也发现,即使模型拟和十分精确,但其外延性仍很差,根本原因在于预测因子选择,在遥感影像估 测生物量中,对影像的影响因素很多很复杂,因此 预测因子的选择要依据大量的实际调查资料,通 过多次测算获得。此外,神经网络模型还存在难 以完全反应生物量与遥感影响的机理问题,遥感生物量估 测模型今后的发展方向是从光合作用,即植被生产力形成
18、的生理过程出发,研究具有生理学、生 态学意义的机理模型,再利用神经网络的自组织 、自学 习和对输入数据具有高度容错性等优点进行高精度估测。参考文献:1 DIXON R K, BRWN S B, HOUGHTON R A,et al. Carbon pools and flux of globle forest ecosystemJ.Science,1994,263:185-190.2 SPENCER R D ,GREEN M A, BLGGS P H. Integrating Eucalypt Forest Inventory and GIS In West AustraliaJ. Photogrammetric Engineering forests biomass; artificial neural network; BP network; RBF network