1、 硕士学位论文基于神经网络的大气细颗粒物软测量研究Study on Soft Sensor of Atmospheric Fine ParticulateMatter based on Artificial Neural Network商潇潇2014年 3月国内图书分类号:TK314国际图书分类号:621.4学校代码:10079密级:公开硕士学位论文基于神经网络的大气细颗粒物软测量研究硕士研究生:商潇潇导 师:郑海明副教授申请学位:工学硕士学专科:机械工程业:机械电子工程所在学院:能源动力与机械工程学院答辩日期:2014年 3月授予学位单位:华北电力大学Classified Index: TK
2、314U.D.C: 621.4Thesis for the Master DegreeStudy on Soft Sensor of Atmospheric Fine ParticulateMatter based on Artificial Neural NetworkCandidate: Shang XiaoxiaoSupervisor:School:Associate Prof. Zheng HaimingSchool of Energy modeling; BP neural networks; RBF neural networks; fineparticulate matterII
3、目 录目录摘 要 IAbstract. II第 1章绪论 . 11.1选题背景与研究意义 . 11.2国内外研究动态 . 21.2.1国外研究动态 . 21.2.2国内研究动态 . 31.3本论文研究内容 . 3第 2章现有大气细颗粒物在线监测技术 . 52.1 射线法原理及 监测仪 技术 52.2微量振荡天平法原理及监测仪技术 . 72.3现有监测仪器技术性能介绍 . 82.4本章小结 . 10第 3章人工神经网络相关理论 . 113.1人工神经网络概述 . 113.2 BP神经网络 . 123.2.1 BP神经网络的结构 123.2.2 BP神经网络的学习过 程 133.2.3改进的 BP
4、算法 153.3 RBF神经网络. 163.3.1 RBF神经网络的结构 163.3.2 RBF神经网络的学习 183.4本章小结 . 20第 4章影响因子的相关性分析 . 214.1数据准备 . 214.1.1数据的采集与划分 214.1.2数据的预处理 . 214.2影响因子的相关性分析 . 234.2.1 NO2浓度的相关性分析 244.2.2 SO2浓度的相关性分析. 24III目 录4.2.3 PM10浓度的相关性分析 . 254.2.4气压的相关性分析 . 264.2.5气温的相关性分析 . 274.2.6相对湿度的相关性分析 . 284.2.7风速的相关性分析 . 294.2.8
5、风向的相关性分析 . 304.3模型输入因子的筛选 . 314.4本章小结 . 32第 5章神经网络软测量模型的建立及检验 . 335.1 BP神经网络软测量模型的建立 335.1.1 BP网络层数的选取 335.1.2输入和输出层神经元个数的选取 . 345.1.3隐含层神经元个数的选取 . 345.1.4传递函数的选取 . 395.1.5训练算法的选取 . 395.2 BP神经网络软测量模型的 检验 . 435.3 RBF神经网络软测量模型的建立. 485.4 RBF神经网络软测量模型的检验 495.5 RBF与 BP网络模型的总体性能比较 525.6大气细颗粒物的软测量界面编写 . 52
6、5.7本章小结 . 55第 6章总结与展望 . 56参考文献 . 58攻读硕士学位期间发表的学术论文 . 61致谢 . 62IV华北电力大学硕士学位论文第 1 章绪论1.1选题背景与研究意义半世纪以来我国经济水平有了空前的发展,但与此同时各种环境污染越来越严重。近两年进入秋冬季节后我国北方地区大范围出现雾霾天气,进一步加大了人们对环境问题的关注,也让人们认识到了“细颗粒物” 这一多年来被我国忽视的大气污染物。美国政府部门 2010年发布了一张世界 20012006年 6年内细颗粒物浓度平均值的地图,如图 1-1所示,在图中,非洲北部和我国的中北部地区(红色显示区域)成为细颗粒物浓度最高的区域
7、1。中国这些地区的细颗粒物浓度全部高于50g/m3甚至接近 80g/m3,污染状况比撒哈拉沙漠 还要严重2。大气中的细颗粒物污染状况引起了人们极大的关注。图 1-1世界 20012006年细颗 粒物平均值地图细颗粒物是指空气动力学当量直径小于或等于 2.5m的颗粒物。细颗粒物来源广泛,化学组成复杂3,虽然在大气中与氧气、氮气相比含量相对较少,却能对大气环境和人类活动产生重大影响。当大气中的细颗粒物浓度过高时会出现灰霾现象,此外细颗粒物粒径小,含有的大量致病物质能严重危害人体健康。研究表明,颗粒物对人体的危害程度与其粒径有关,粒径大小决定了其沉积在人体内部器官的位置。由于细颗粒物粒径很小,随呼吸
8、作用可以进入人体的支气管壁,干扰肺内气体交换,甚至穿透肺泡进入血液循环而影响人体组织器官的功能4,5。除此之外,细颗粒物不仅会引发呼吸道传染病,还会使致癌的几率明显上升。戴海夏 6等人研究发现上海市大气中的细颗粒物的日均浓度与当地居民的日死亡人数有很大的关系。殷永文等人研究发现在灰霾天气期间,细颗粒物的日均浓度每上升 34g/m3,呼吸1华北电力大学硕士学位论文科的日门诊数上升 3.2%7。据世界卫生组织统计,全球因细颗粒物而直接或间接死亡的人数到已从 2004年的 115万人增加到 2011年的 200多万人,而且人数仍在逐年递增。为了控制细颗粒物的污染,保护人体健康,世界上很多国家及组织都
9、制定了严格的细颗粒物空气质量标准。华北地区作为我国经济建设的重要地区,大气中的细颗粒物污染非常严重,近几年,政府从多个方面实施了一系列污染治理措施。对细颗粒物浓度实行在线监测是进行一系列污染防治措施的必要前提,只有及时准确的掌握细颗粒物的污染浓度,政府管理部门才能针对性的制定防治方案,有效的控制细颗粒物污染,为公众提供良好的生活环境。大气中的细颗粒物浓度受所在地区地形地貌、排放源地点、排放速率、气象环境等因素的影响,表现出较强的非线性特性。人工神经网络具有较强的非线性拟合能力,在软测量领域具有很大的发展空间,在所有网络模型中 BP神经网络与 RBF神经网络是目前研究最多理论最为完善的网络模型8
10、-10。鉴于此,建立基于 BP神经网络与 RBF神经网络的软测量模型,探索实现对大气中细颗粒物浓度软测量的可行性,对降低细颗粒物的污染水平,加强大气环境的治理力度具有十分重要的意义。1.2国内外研究动态1.2.1国外研究动态国外方面对神经网络软测量的研究较早,并且取得了不错的研究进展。Greg.M11在上世纪九十年代针对化工控制过程中参数测量难度较大的情况,介绍了将神经网络软测量技术应用于化工生产过程中的参数控制,提出了详细的建模方案,并对比得出了神经网络软测量的相关优点。S.Adwankar和 R.N.Banavar12 介绍了当前神经网络方法在工业建模、系统仿真、过程控制等方面相对于其它方
11、法的强大优势和巨大的发展潜力。X. H. Yang和 H.P. Dai13等人建立了一种基于 RBF神经网络的软测量模型用于非线性系统混合辨识,取得了很好的效果。Dong-jin Choi和Heekyung Park14首先选择了 11个便于测量的辅助变量建立了神经网络软测量模型用来监测污水进水的总凯氏氮,但实验结果并不理想。随后在原有基础上对 11个辅助变量采用主成分分析法进行处理后得到 5个复合参量重新建立软测量模型,实验结果精度有了很大提高,且模型的结构更加简单,程序运行更快。 Pelliccioni A和 Poli U15建立了基于 BP 神经网络的软测量模型成功监测了 CO 和 NO
12、2浓度,在此基础上研究了层与层之间传递函数的选取对软测量结果的影响,并对模型做出了优化。Perez P16分别建立了持续性软测量模型、线性回归软测量模型、神经网络软2华北电力大学硕士学位论文测量模型对圣地亚哥附近地区的 SO2浓度进行监测,对比结果表明神经网络软测量模型明显优于其它两种模型。1.2.2国内研究动态国内方面,东南大学陈强、王培红17 等人在研究锅炉燃烧特性和飞灰含碳量的先验知识上,利用 BP神经 网络建立了飞灰含碳量的 软测量模型,结果表明该模型具有良好的软测量能力,解决了当前测量锅炉飞灰含碳量实时性不强和误差较大的问题。清华大学的卢勇、徐向东18 为了测量烟气中比较重要的含氧量
13、这一种参数,在传统技术的基础上建立了基于神经网络和统计分析的烟气含氧量软测量模型,并与传统软测量方法进行了对比,实验表明所建立的模型相比于传统的方法具有更强的测量精度和容错能力。朱国成、方明建19等人在研究人工神经网络算法和结构的基础上建立了神经网络软测量模型来模拟测量街道峡谷氮氧化物浓度的分布,结果显示训练样本的模型输出与实际值的线性相关值为 0.93,测试样本的模型输出与实际值的线性相关值达 0.87,具有很好的模拟测量效果,可以应用于街道峡谷氮氧化物浓度的软测量计算。大连理工大学的张海传、刘钟阳20 等人通过对臭氧产生过程中的实验研究确定了臭氧产生的关键影响因子,通过测量关键影响因子的数
14、值建立了基于 RBF神经网络的臭氧软测量模型,实验表明该模型的测量结果精度较高,为臭氧浓度的实时在线监测找到了可行的新方法。1.3本论文研究内容神经网络软测量方法在各领域中得到了广泛的应用,而且研究成果也表明了其处理不确定性、复杂性、非线性对象方面所具有的能力。但很少有将神经网络软测量技术应用于大气中细颗粒物浓度监测的实例。因此本文探索建立基于神经网络的软测量模型对大气中的细颗粒物浓度进行监测。主要内容如下:第一章绪论:对我国大气中细颗粒物的污染现状、危害等方面做了介绍,说明了对大气中细颗粒物进行软测量的重要意义,研究了神经网络软测量应用领域的国内外现状,确定了本文的研究内容。第二章现有大气细
15、颗粒物在线监测技术:对现有我国承认的两种大气细颗粒物在线监测系统的原理及技术做了详细介绍,并介绍了两种应用不同原理的细颗粒物监测仪器及其技术指标。第三章人工神经网络相关理论:总体概述了神经网络的本质和特点,详细介绍了 BP神经网络和 RBF神经网络的结构、算法以及训练过程。第四章影响因子的相关性分析:对建模所用数据进行了清除和归一化处理,3华北电力大学硕士学位论文并对整个数据做出了划分。对预选的 8个影响因子通过与细颗粒物做改进相关性分析进一步筛选出 6个影响作用较大的因子,为模型的建立做了准备。第五章神经网络软测量模型的建立及检验:详细阐述了 BP、RBF 网络软测量模型的构建过程,并对建立
16、好的模型做出了检验,对结果进行了误差分析,在此基础上利用 MATLAB GUI编写了软测量系统界面。第六章结论与展望。对论文所做工作进行了总结,对所存在的问题及未来的研究方向进行了展望。4华北电力大学硕士学位论文第 2 章现有大气细颗粒物在线监测技术大气中的细颗粒物污染日益严重,开展细颗粒物的各项研究与治理的关键前提是对细颗粒物浓度进行实时在线监测,获得准确的浓度数据,以此为依据才能制定相应的政策法案来防治大气污染。由于细颗粒物成分中含有多种物质,存在形态具有多样性,监测时还需考虑其它各种问题对监测结果的干扰,所以实现细颗粒物浓度的在线监测与其它污染物相比难度非常大。当前国际上通过美国 EPA
17、认证的技术包括:微量振荡天平法、射线法、 射线光浊度法、光散射法。在我国根据 环境空气质量标准规定,对大气中细颗粒物与可吸入颗粒物的自动分析方法为 射线法和微量振荡天平法两种21 。2.1 射线法原理及监测仪技术射线法主要基于 细颗粒物 对照射其中的 射线的能量吸收原理。 发射一束 射线通过一定质量的细颗粒物时由于二者内部粒子的相互碰撞作用,导致 射线损失的能量被细颗粒物吸收而发生强度衰减,且其衰减量与细颗粒物浓度成正比,因此通过检测 射线的衰减量即可 计算出细颗粒物浓 度22。 射线法细颗粒物监测仪主要包括颗粒物采样头、切割器、动态加热系统、采样泵和监测仪主机。大气由采样泵采集样品,经采样头
18、和切割器处理后成为满足要求的样品,动态加热系统的主要作用是将样品的湿度调整到 35%以下。然后样品被输送到监测仪主机里,在这里样品中的细颗粒物被收集到仪器内部的滤膜上,射线通过滤膜上的细颗粒物会发生强度衰减,通过分析衰减量可得到一定时间内的细颗粒物浓度值。图 2-1为 步进式 射线法细颗粒物监测仪结构图,图 2-2 为连续式 射线法细颗粒物监测仪结构图,二者的区别在于步进式 射 线法监测仪的采样室和测量室是分隔开的,样品采样和测量分析是先后进行。滤膜带需要在两个室间来回移动,仪器必须等采样室内样品采样完成后才能转移到测量室进行测量,所以该方法只能实现间断式测量,实时性较差。连续式 射线法监测仪
19、 的采样室和测量室是一体的,样品采样和测量分析是同时完成的。滤膜带不需要在两个室间来回移动,避免了移动过程中样品的变化,也保证了仪器监测的实时性。5华北电力大学硕士学位论文图 2-1步进式 射线法细颗粒物 监测仪结构图图 2-2连续式 射线法细颗粒物 监测仪结构图射线法仪器的特点:采用 射线法原理的监测仪 器可以实现对细颗粒物的间断测量和连续测量,且不与被监测物接触,可实现间接测量。细颗粒物对 射线的吸收只受细颗粒物质量大小的影响,与细颗粒物自身的类别、大小、构成等属性无关。射线法 仪器采用的 C14放射源放射出的低能 射线,具有安全稳定、半衰期长、性能可靠的优点23。该方法原理简单,实时性强
20、,便于操作维护,自动跟踪能力强,测量精度高,能够长期运行。6华北电力大学硕士学位论文2.2微量振荡天平法原理及监测仪技术微量振荡天平法主要是利用美国 R&P公司研发的锥形元件微量振荡天平专利技术,该原理基于振荡天平的振荡频率与细颗粒物浓度有一定的对应关系的理论24。微量振荡天平法细颗粒物监测仪主要包括采样头、切割器、滤膜动态测量系统、采样泵和仪器主机。与 射线法仪器相同,大气首先由采 样泵采集样品,经采样头和切割器处理后成为满足要求的样品。样品被输送至安装有微量振荡天平传感器的监测仪主机,其主要组成是粗头一端固定,细头一端装有滤膜的空心锥形管,锥形振荡管示意图如图 2-3。样品气体流经空心锥形
21、管,细颗粒物聚集在其中的滤膜上导致空心锥形管细端的振荡频率因为质量的变化发生改变。仪器通过分析频率的改变量可计算出细颗粒物的浓度值。为了避免样品在测量过程中细颗粒物发生质量变化造成测量误差,微量振荡天平法仪器安装的滤膜动态测量系统可以精确的测量出监测过程中细颗粒物质量的变化值,以达到修正测量结果的目的。图 2-4为微量振荡天平传感器示意图。微量振荡天平法仪器特点:微量振荡天平法是对细颗粒物实现直接测量的一种方法,该方法具有很高的测量精度与实时性,且不受细颗粒物本身大小、组成成分、形状等因素的影响。该方法的缺点是容易受外界温度、湿度、噪声、振动等因素的影响。图 2-3锥形振荡管示意图7华北电力大
22、学硕士学位论文图 2-4微量振荡天平传感器示意 图2.3现有监测仪器技术性能介绍以下介绍两种应用上述技术的大气细颗粒物监测设备。图 2-5为河北先河环保科技股份有限公司生产的 XHPM2000E细颗粒物自 动检测仪,主要是基于 射线法原理。技术指标如表 2-1所示。图 2-5 XHPM2000E细颗粒物自动检测仪8华北电力大学硕士学位论文表 2-1 XHPM2000E细颗粒物自动检测仪的技术指标项目测量范围参数01mg/m3或 010mg/m3,可设置0.001 mg/m3显示分度值最低检测限仪器平行性校准膜重现性工作方式0.005 mg/m37%2%小时循环测量流量测量范围输出方式020 L
23、/min(工况)数字输出 RS232,模拟输出 05V(16.72%)L/min(工况)玻璃纤维材料,2个月(1h工作周期)50(可 设置)采样流量滤纸带加热套管加热温度图 2-6为 美国赛默飞世尔科技公司生产的 TEOM1405系列颗粒物监测仪,其主要基于微量振荡天平法原理,可以同时监测细颗粒物和可吸入颗粒物的浓度。技术指标如表 2-2所示。图 2-6 TEMO1405系列颗粒物监测仪表 2-2 TEMO1405系列细颗粒物自动检测仪的技术指标项目测量范围精度参数01,000,000g/m32.0g/m3 (1小时平均);1.0 g/m3(24小时平均)0.1g/m3 (1小时平均)3L/分
24、 钟分辨率主流量旁路流量数据存储13.67L/分钟可存储 5,000,000条记录9华北电力大学硕士学位论文2.4本章小结本章主要对现阶段我国认证的大气中颗粒物自动分析方法做了原理及监测技术的介绍,包括 射线法和微量振 荡天平法两种方法,随后列 举了两种应用上述技术的颗粒物监测仪器及其技术指标。10华北电力大学硕士学位论文第 3章人工神经网络相关理论3.1人工神经网络概述人工神经网络(Artificial Neural Networks,ANN)简称为神经网络(NeuralNetworks,NN ),是一种模 拟人类大脑神经系统进行高速智能化信息处理的网络结构25 。神经网络本质上是一种数值运
25、算模型,由大量的神经元通过权值的相互连接组成,每个神经元则代表了特定的传输函数。通过对大量输入输出数据一一对应的映射训练,数据的内部特性被网络的权值以“记忆” 的方式得以存储,从而实现对输入输出数据的非线性处理和复杂的逻辑操作等功能。神经网络自被提出以来经历了初创期、停滞期、黄金期,目前被广泛应用于系统建模、模式识别、信号处理、时间序列分析、自动化控制等各个科学研究领域,受到工程技术人员的极大赞赏。神经网络在创建过程中吸取了人脑神经系统信息处理过程的很多优点,与传统的系统相比主要特点有26-29 :(1)信息的并行分布式处理能力。神经网络是由大量的神经元相互连接组成,每个神经元都可对信息进行单
26、独的运算传输。虽然神经元个体的结构简单,处理信息的能力很有限,但神经元组成的整个网络由于强大的并行分布式结构,使得系统处理信息高速且高效,满足有些场合对信息高速实时处理的硬性要求。(2)高度非线性处理能力。据我们所知,现阶段线性结构由于自身存在的缺陷已很难满足用户对信息处理的要求。神经网络由于自身并行结构的特点,其数据处理能力具有高度非线性特性,这一特性使得神经网络在处理非线性问题方面具有显著的优势。(3)良好的自学习和自组织功能。当外界环境发生一定变化后,神经网络可以通过自身的学习训练过程改变网络的内部结构和神经元的连接方式,使得网络能够迅速适应外界环境的变化,对于特殊的网络输入信号得到符合
27、要求的输出结果。(4)不依赖于精确的数学模型。神经网络不需要分析具体过程复杂的运动规律,运用已知的定理、定律等建立精确的数学模型。神经网络只需要在对研究对象有一定了解的基础上选择合适的网络结构和参数,运用准确的大量样本数据训练网络,使得样本特性通过网络的权值调整记录下来,从而形成输入到输出的非线性映射即可。(5)良好的容错、联想、综合、推广能力。神经网络将数据的内部特性渗透于整个网络的内部连接中,当所处理的信息部分丢失、模糊或错误时,神经网络通11华北电力大学硕士学位论文过由局部联想到整体,强大的抗噪、推广等能力,使得网络的整体性能不会受到影响。3.2 BP神经网络3.2.1 BP神经网络的结
28、构BP神 经网络是一种典型的分 层型多层神经网络,其 结构包括输入层、隐含层、输出层,其中输入层和输出层各只有一层,隐含层可以有一层或多层。每一层都由不同数量的神经元组成,上下层神经元之间采用全连接方式以实现信息的传递,同层神经元之间则无连接也无信息传递。图 3-1为一个典型的三层 BP神经网络结构图。输入层 隐含层 输出层输出输入.图 3-1典型的三层 BP 神经网络结构图神经元是 BP神经网络的基本 组成部分,其结构模型如 图 3-2所示。输入到输出的映射关系可表示为:R y f xiwi b (3-1)i1 式中 xi 神经元的输入向量;wi上下 层 神经元之间的 连接权值;b神经元的阈
29、值;f上下层神经元间的传递函数;y神经元的 输出向量。12华北电力大学硕士学位论文x1 w1yw2x2 求和 fwRxR b图 3-2 BP神经元结构模型3.2.2 BP神经网络的学习过程BP神 经网络的学习过程分 为输入信息的正向传播和 误差函数的逆向传播。对于选定的一个网络,我们不断用一组组训练样本重复这两个过程对网络进行记忆训练时,当网络的参数已达到我们所设定的值之后,则表示网络已经完成训练30体过程如下:,具(1)输入信息的正向传播31隐含层中第 i个神经元的输出为:ry1i f w1ij x j b1i i 1,2,. m(3-2)1j1式中 f1输入层与隐含层间的传递函数;xj输入
30、向量;w1ij第 j个 输入层神经 元与第i 个隐含层神经元间的连接权值;b1i第i个隐含层神经元的阈值;r输入层神经元个数。输出层第 k个神 经元的输 出为:m y2k f 2 w2ki y1i b2k k 1,2,n (3-3)i1 式中 f2隐含层与输出层间的传递函数;w2ki第i个隐含层神经元与第 k个输出层神经元间的权值;b2k第k个输出层神经元的阈值。误差函数定义为:2E 1tk y2kn (3-4)2k113华北电力大学硕士学位论文式中 tk第 k个输出层神经元的目标输出。(2)误差函数的逆向传播32误差函数沿原路逆向传播同时修正各网络层间的权值和阈值。隐含层第 i个神经元到输出
31、层第 k 个神经 元的权值、阈值变化为:w E E y2kw2ki y2k w2ki tk y2k f 2 y1i ki y1i(3-5)(3-6)2ki ki f 2tk y 2k 式中式中E y2kE2k b2ki tk y2k f 2b2ki b y ki(3-7)2kiw2ki隐含层与输出层间 的权值变化量;b2ki隐含 层与输出层间 的阈值变化量; 网络的学习速率。同理输入层第 j个神经元与隐含层第i个神经元间的权值、阈值变化为:w1ij ij x jb1i ij(3-8)(3-9)式中 w1ij隐含 层与输入层间的权值变化量;b1i隐含层与输入层间的阈值变化量。网络的权值和阈值的修
32、正表达式如下:wk 1 wk wbk 1 bk b(3-10 )(3-11 )误差函数逆向传播逐层优化网络各层神经元间的权值和阈值,整个过程网络计算误差逐渐减小,直到达到所设定的最小误差值或训练样本使用完,此时网络的权值阈值即为网络训练后的最优的权值和阈值。 BP神经网络的学习流程图如图 3-3所示14华北电力大学硕士学位论文开始权值和阈值初始化取一训练样本作为网络输入隐含层神经元输出计算输出层神经元输出计算隐含层神经元输出误差的计算输出层神经元输出误差的计算隐含层和输出层间权值的更新,输出层神经元阈值更新输入层和隐含层间权值的更新,隐含层神经元阈值更新N训练样本取完了吗YN输出误差小于设定误
33、差了吗N训练次数到了吗YY训练结束图 3-3 BP神经网络的学习流程图3.2.3改进的 BP算法BP算法是提出比较早的一种算法, 虽然相对于线性 结构其处理问题的能力有15华北电力大学硕士学位论文了很大的进步,但由于算法自身的一些缺陷使其在应用中出现了很多问题,包括收敛速度慢或根本不能收敛、易陷入局部最小值、网络训练结果不稳定等。为了克服这些不足使得 BP算法更加具有 实用性,近年来在 BP算法的基础上演化出了许多改进的优化算法33。各算法的训练函数及特点见表 3-1。表 3-1 BP网络各算法的训练函数及具体特点训练算法 训练函数 特点最速下降 BP 算法 traingd 训练收敛速度很慢或
34、不能收敛,结果易陷入局部极小值,而且训练过程易出现振荡现象训练收敛速度略快于最速下降 BP算法训练收敛速度快,要求存储空间小,适用于批量模式训练动量 BP 算法弹性 BP 算法traingdmtrainrp学习速率可变的 BP算法Fletcher-Reeves修正算法traingdxtraincgf训练收敛速度比最速下降 BP算法快,只适用于批量模式训练在变梯度算法中存储空间要求最小,收敛速度比学习速率可变的 BP算法快很多,多用于权值较多的情况Polak-Ribiere修正算法Powell-Beale复位算法traincgptraincgb收敛速度在一些情况下快于 Fletcher-Reev
35、es修正算法,但存储空间要求大一些性能比 Fletcher-Reeves 修正算法和Polak-Ribiere修正算法都要好,但存储空间要求比二者大SCG算法 trainscgtrainbfg迭代次数比 Fletcher-Reeves、Polak-Ribiere、Powell-Beale算法要多,但计 算量要少,存储空间要求和 Fletcher-Reeves修正算法类似每次迭代的计算量和存储空间大于变梯度算法,多用于小规模网络模型BFGS拟牛顿算法一步正割 BP 算法LM算法trainosstrainlm性能介于变梯度法与拟牛顿法之间收敛速度最快,适用于中等规模的前馈型网络模型贝叶斯正则化 t
36、rainbr 可以提高网络的泛化能力,避免用试探的方法确定网络规模的大小3.3 RBF神 经网络3.3.1 RBF神 经网络的结构RBF神经网络是一种 3层神经网络,包括一个输入层,一个隐含层,一个输出层。与 BP神经网络相似, RBF神经网络同层神经元间无连接,上下层神经元间实现全连接。RBF神经网络结构如图 3-4 所示16华北电力大学硕士学位论文G j x c j x 1 b1wRhmc1x 2c2x n c hbmG hx ch图 3-4 RBF 神经网络结构图输入层与隐含层间的传递函数为高斯函数。高斯函数是一种局部响应函数,当输入信号靠近函数中心时,函数将产生较大输出,当输入信号距离
37、函数中心较远时,函数输出为零34 。RBF网络输入为输入向量 p和权值向量 w之间的距离乘以阈值b,即:1w1ij pi2 .b w pT w pT Tnx w p .b 2 .b (3-12 )i1式中 x RBF网络输入;p输入向量 p;w输 入层与隐含层间的权值向量;b输入层与隐含层间的阈值。则第 j个隐含层节点输出为y1j G j x c j (3-13 )(3-14 )其中高斯函数公式为: x cG x c j e x pj22 式中 cj 第 j个隐藏层节点的中心, j l,2, h; 高斯函数的宽度。隐含层到输出层之间通常为线性传递,并在此过程中调节两层间的权值,则输出层最终输出
38、表达式为:17华北电力大学硕士学位论文hy2r w2 jr y j1(3-15 )j1式中 y2输出层第 r个神经元的输出,r 1,2, m ;rw2ji第 j个 隐含层节与第 r个输出层间的权值。3.3.2 RBF神 经网络的学习RBF网络的学习过程分为两个部分:第一,径向基函数中心ci和宽度 i的确定;第二,权值 w的修正。径向基函数的中心和宽度分别代表了训练样本的空间模式及其与各中心的距离,可实现样本信息的非线性传递。研究表明,当径向基函数的中心和宽度确定后,网络的权值可用求解线性方程组的方式获得35 。因此,第一部分是整个学习过程的重点,中心和宽度选取的合适程度将直接决定 RBF神经网
39、络的整体性能。1、径向基函数中心的确定的方法主要包括36:(1)固定法:这种方法主要用于训练样本的个数与隐含层神经元的个数相等的情况下,此时每个训练样本就作为隐含层神经元的径向基函数的中心。因此,径向基函数的中心向量即为训练样本的向量。(2)随机固定法:很多情况下,隐含层神经元数小于训练样本的个数,在这种情况下,则从训练样本向量中随机选取组成径向基函数中心向量。(3)K-means聚类中心:从训练样本向量中选择 k个数据组成径向基函数中心的初始向量,剩余的样本采用就近原则进行分配,计算各个中心组中的训练样本的平方值构成径向基函数的中心向量。(4)Kohonen 中心选择法:从训练样本中选取 k
40、个模式组成中心向量的初始值,将中心向量归一化后,计算当前训练样本组与每个中心的内积作为评价两个向量间距离的标准。通过这种方法,可以确定与当前训练样本组距离最近的中心向量,通常中心向量都会向训练模式的方向进行微小修正。当所有训练样本组重复这种方法多次后,中心向量就体现了训练样本的内部特征,此时中心向量即可确定。2、宽度的确定通常包括以下几种方法37 :d(1)固定法:确定了径向基函数的中心后,宽度 式与中心向量的最大距离,N代表隐含层神经元的个数。,式中 d代表训练模N18华北电力大学硕士学位论文(2)平均距离:平均距离是对宽度进行估计的一种方法, j ci c j,该式表示第 j个中心和与之距
41、离最近的第 i个中心间的欧氏距离。(3)其他方法: j ci c j,式中 为系数,取 值范围为 11.5 。3、本文介绍 RBF神经网络最常用的一种学习算法:正交最小二乘法。正交最小二乘法是以“ 能量 贡献” 的原理来计算正交 优选中心38 。我们知道,对于 RBF神经网络输入信息由隐含层到输出层间的传递是线性传递过程,所以对于输入样本集 X t ,dt网络的期望输出可表示为Mdt pitwi i1 t N,1 i M (3-16 )i1式中 wi 隐含层 与输出层神经元间的权值;pit回归因子;M隐 含层神经元数;n网络误差。每个回归算子对整个网络精度的贡献是不同的,正交最小二乘法的基本思
42、想是通过对 pi作 Gram-Schmidt正交化分析 pi对整个网 络精度的贡献大小,从而选择出贡献显著的因子,剔除贡献较小的因子,最终选择出最优的回归因子 pi及其隐含层神经元数 M 39。算法具体流程如下:(1)初选隐含层神经元数 M( M N),初选输 入样本矢量中的一个子集作为RBF网络的径向基函数中心c i(i 1,2,M)。(2)计算回归因子 pi,将初选的径向基函数中心和输入样本数据代入高斯函数计算回归因子: pi t G X t ci (t 1,2,N)(3)对回归因子各列进行正交化如下:令 ui piaik uiT pk(3-17 )uiTui19华北电力大学硕士学位论文k
43、1 1 i k,k 2,3.,M1 i Muk pk aikui (3-18 )(3-19 )(3-20 )i1T d(4)计算 gi uuiiT ui i g2i ui uiT1 i Md dT1 a12 a13 a1M10 a23 a2M( 5)令 A 1由 AW g可求解权值 W ,其中0 0 1 a3MaM 1,M 0 0 0 1 g g1, g 2, , g M T(6)检查是否满足网络精度要求。M1 i (3-21 )i1式中 设定的网络允许误差。若满足要求则停止计算,否则转到(1),重新选择径向基函数的中心。3.4本章小结本章首先对神经网络的原理及特点进行了概述,随后详细介绍了
44、BP神经网络的结构、学习过程、改进算法,RBF神经网络的结构、学习过程等理论。为接下来建立神经网络软测量模型提供了理论上的支持。20华北电力大学硕士学位论文第 4 章影响因子的相关性分析4.1数据准备4.1.1数据的采集与划分本文所采用的实验数据为华北地区某市 2012年 8月2013年 7月空气质量自动监测站公布的大气污染物 SO2、NO2、PM10 、细颗粒物的浓度数据以及对应的气象局实时气象数据,包括气温、气压、相对湿度、风向、风速。在采集到的所有数据中我们以 SO2浓度、NO2浓度、PM10 浓度、气温、气压、相对湿度、风向、风速作为建立网络模型的预选输入因子,对应的细颗粒物浓度作为网
45、络模型的输出数据。实际情况表明所收集到的原始数据集内有很多为不可以使用的数据,在这些数据集内由于一些原因不可避免的会有一些数据出现部分缺失、不对应、误差偏差较大、混乱重复的情况。如果这些问题数据不被清除掉,不仅不会对整个软测量网络模型的构建起到积极的作用,相反可能会使整个模型的构建过程出现问题,导致模型的构建失败。因此必须对所采集到的原始数据集进行清理,选择出正确无误且有利于建模的数据集。经过清理后,最终选择出其中的 600组数据作为软测量建模实验所用的数据集。实验过程中将数据集划分为以下几部分:(1)训练集(包含 500组数据),用于软测量网络模型的训练之用。(2)验证集(训练集数据的子集,
46、选取训练集数据后 100组数据),用于验证软测量网络模型的训练状况。(3)测试集(包含 100组数据),用于测试软测量网络模型的性能。4.1.2数据的预处理由于我们搜集到的原始数据集中不同数据组间不可避免的存在着量纲不同、数量级跨度较大的情况,当这些数据组不经过预处理直接输入网络,数量级较大的数据组将会掩盖数量级较小的数据组,使得网络模型映射失真,造成网络麻痹得不到良好的训练结果。另一方面,模型选用的具有饱和非线性特性的 Sigmoid传递函数只有在接受一定范围内的输入变量时才会有理想的输出结果,当输入变量很大或很小时,该函数的一阶偏导数将趋于 0,致使 BP网 络模型在训练时算法梯度下降速度
47、较慢,继而权值更新出现问题,网络模型无法收敛。因此为了建模需要及便于对21华北电力大学硕士学位论文数据进行管理,需要对原始数据集进行归一化预处理。常见的归一化方式有以下几种(1)公式法xi xminmax xminxi x (4-1)x式中 归一化后的数据;ixi原始数据;xmax、xmin 原始数据的最大 值和最小值。该方法使得网络模型的输入输出数据归一化到0,1区间内,待网络模型输出实验结果后,需将结果进行反归一化后才能得到我们真正需要的数据,反归一化公式为xi xixmax xmin xmin(4-2)(2)在 MATLAB软件中提供了几种归一化的函数,利用 premnmxtramnmxpostmnmx函数组对数据进行归一化处理,函数表达式如下:pn,min p,maxp,tn,min t,maxt premnmxp,t(4-3)式中 p、t网络模型的原始输入向量和目标输 出向量;pn、tn归一化后网络模型的输入向量与目标输 出向量;minp、maxp 原始输入向量的最小值与最大值;mint、maxt