1、-水资源研究第 25 卷 第 2 期(总第 91 期)2004 年 6 月-人工神经网络在综合水质评价中的应用阮仕平 1 党志良 1 胡晓寒 1 马 飞 1 张孟涛 2 (1.西安理工大学 环境科学研究所,陕西 西安 710048; 2.北京市自来水集团公司 供水分公司,北京 100034)摘 要: 人工神经网络(ANN)是复杂非线性科学和人工智能科学的前沿,其在水质评价的应用研究在国内外尚处于初创阶段。在详细分析 LM 算法的基础上,提出了基于 LM 算法的水质综合评价 BP 模型,并将该模型应用于实例,进行效果检验。结果表明:LM-BP 模型用于水质综合评价是可行的,与其它评价方法相比,评
2、价结果更加客观、合理,而且网络训练速度最快,适合作为水质综合评价的通用模型。关键词: LM 算法; BP 神经网络; 水质评价1 概 述 水环境质量评价是认识和研究水环境的一项重要内容,其目的是准确反映环境的质量和污染状况,预测未来的发展趋势,是水环境管理保护和治理的一项重要基础性工作。目前在进行水环境质量评价时,主要存在以下问题 1。(1) 迄今没有一个被大家公认通用的具有可比性的水环境质量评价数学模型,各部门进行评价时,选用数学模型的任意性很大,常常不能反映本地区污染状态,同时也不便于与其他地区水质状况进行比较。(2) 多因子综合评价中确定环境因子权重存在任意性,缺乏比较客观可靠的确定环境
3、因子权重的方法。本文将提出一种新的水质综合评价方法,即基于 LM-BP 算法的综合水质评价方法。2 水质综合评价的 LM-BP 模型 2.1 BP 网络及 Levenberg-Marquardt 算法 BP 网络,即多层前馈神经网络,因其采用误差反向传播算法(Error Back-Propagation,即 BP 算法)而得名,1986 年由 D.E.Rumelhart 等人提出。BP 算法结构简单、易于实现。在人工神经网络的实际应用中,8090的神经网络模型是采用 BP 网络或它的变化形式 2,3 。 从结构上讲,BP 网络是一种分层型网络,由输入层、隐层和输出层组成。层与层之间采用全互连方
4、式,同一层的单元之间则不存在相互连接。隐层可以有一个或多个。1989 年,Robert Hecht-Nielson 证明了一个 3 层的 BP 网络可以完成任意的n 维到m 维的映射 3 。BP 网络采用的误差反向传播算法是一种有教师指导的 率学习算法。其学习过程由正反两个方向的信息传播组成,正向传播输入样本数据,反向传播反馈误差信息。在正向传输中,输入信息在神经单元中均由 S 型作用函数激活。文献1 、 4中即采用此种方法。标准BP 网络的逆传播算法具有思路清晰、结构严谨、可操作性强等特点,而且一个3 层的BP 网络可以完成任意的 n 维到 m 维的映射,但其收敛过程存在以下两个缺陷: 收敛
5、速度慢; 存在所谓“局部最小值”问题。可以通过Levenberg-Marquardt (简称LM) 算法来克服。设 x(k)表示第 k 次迭代的权值和阈值所组成的向量,新的权值和阈值组成的向量 xk+1可根据下面的规则求得:(1)xxkk)()1(对于牛顿法则是:(2)()(12E(2)式中 表示误差指标函数 E(x)的Hessian 矩阵;E(x) 表示梯度。)(2xE设误差指标函数为:(3)(21)(xexNi(3)式中 e(x)为误差,那么:(4)()(JET(5)2xSex在(4)、(5)式中:为Jacobian 矩阵。)()(21exSiNi对于高斯牛顿法的计算法则有:(6)()(1
6、xeJxJTLM 算法是一种改进的高斯牛顿法,它的形式为: (7)()(1IxT(7)式中比例系数 0 为常数,I 是单位矩阵。从(7)式可看出,如果比例系数 =0,则为高斯牛顿法;如果 取值很大,则LM 算法接近梯度下降法,每迭代成功一步,则 减小一些,这样在接近误差目标的时候,逐渐与高斯牛顿法相似。高斯牛顿法在接近误差的最小值的时候,计算速度更快,精度也更高。由于 LM 算法利用了近似的二阶导数信息,它比梯度下降法快得多,实践证明,采用LM 算法可以较原来的梯度下降法提高速度几十甚至上百倍。另外由于J T(x)J(x)+I是正定的,所以(7)式的解总是存在的,从这个意义上说,LM 算法也优
7、于高斯牛顿法,因为对于高斯牛顿法来说,J TJ 是否满秩还是个潜在的问题。在实际的操作中, 是一个试探性的参数,对于给定的 ,如果求得的 x 能使误差指标函数 E(x)降低,则 降低;反之,则 增加。2.2 LM-BP 水质综合评价方法 水质综合评价的目的,就是对照一定的环境质量标准,确定水体所属类别及其所具备的使用功能,同时,找出影响水质的主要污染因素,从而为水环境管理提供科学依据。 人工神经网络BP 模型具有很强的分类功能,可以完成水质评价中类别的评判。设有 N 维向量共 m 类,分别记为 Gi(i=1,2,M),向量 Y0输入网络后,输出向量 Ym的各分量应满足:当 Y0属于第 Gi类时
8、,则 yi=1,其他分量为 0,从而实现了分类功能。若将水质评价中的环境质量标准做为样本输入,评价结果作为系统输出,网络通过LM 算法不断学习,归纳出其中规律,由此得到的网络便具有了联想和预测能力,从而可实现水质综合评价中类别的判定。3 LM-BP 水质综合评价实例 为了检验 LM-BP 水质评价方法的正确性,本研究选取文献4中的评价标准及断面监测资料作为实例,并将几种方法的评价结果做以比较。神经网络的输入层神经元数目由评价因子决定,如表 1(略)所示,共有 7 项,因此输入层神经元数目为 7。网络输出应为分类结果,本研究设定类、类、类、类水的期望输出结果分别为:(1000)、(0100)、(
9、0010)和(0001)。因此输出层神经元数目为 4。采用包含一个隐层的神经网络结构,经比较计算,隐层神经元数目定为 8。因此网络结构为 7-8-4。 本研究采用 MATALAB 神经网络工具箱进行编程。将水质标准作为训练样本输入,期望误差 0.001,采用 LM 算法,经过 6 次训练后,网络收敛。网络训练过程如图 1 所示。网络学习结果及评价结构分别见表 3、表 4。 (略)4 BP 网络模型与其他方法模型比较分析 人工神经 BP 网络模型与灰色关联度方法和模糊综合评判方法评价结果列于表 5。 (略) 从表 5 可以看出,3 种方法对断面 2、断面 3 评价结果一致,但对断面 l 和断面
10、4 水质类别判定有差异。人工神经 BP 网络模型评价断面 1 水质为类,与模糊综合评判方法评价结果一致,而与灰色关联度方法不同,即评价结果相差 1 级,由断面 1 断面评价参数的实测值(表 1)与其评价标准(表 2)比较可知,其挥发酚的实测值已超过了评价标准类值,当然其水质应评价为类。因此认为,采用灰色关联度方法对断面 1 水质评判是不准确的,为误判。误判的原因: 权重的构造带有人为性,没有一种统一的求解方法,随意性较大; 灰元在白化过程中会失去一部分信息。对于断面 4,人工神经 BP 网络模型评价为类水体,是贴切的。根据其评价参数的实测值与标准值比较,其数值都没有超过类标准值。因而,判定断面
11、 4 水质为类也是误判。模糊综合评判方法误判原因是:在计算过程中强调了极值的作用,运用取小取大运算法则使得大量有用信息被丢弃,其信息利用率较低,同时,权重构造的人为性也是其致命弊端。人工神经 BP 网络模型具有很强的自学习、自组织和自适应能力,能够充分利用给定的水质数据信息,建立起输入与输出之间复杂的非线性对应关系。而且网络中的大量参数均由学习所得,而不是由人为给定,避免了人为因素的影响,这是人工神经 BP 网络模型与灰色关联度方法以及模糊综合评判方法最根本的区别,因此由人工神经 BP 网络模型得到的评价结果更客观、更合理 4。5 与其它 BP 算法的比较 近年来,出现了许多 BP 网络的改进算法 3,59 ,为了比较各种算法的优劣,笔者在上述网络结构中,采用不同的 BP 网络改进算法进行网络训练,结果如表 6 所示。 (略)由表 6 中的试验结果可以看出,在所有的优化算法中,LM 算法速度最快。6 结 论 本研究采用 LM-BP 算法实现了水质综合评价功能,并通过对比得出合适的网络结构。实践证明,该方法避免了 BP 网络的自身缺陷,评价快速准确,评价结果具有客观性、可比性,很适合做为水质综合评价的通用模型。参考文献: (略)