ImageVerifierCode 换一换
格式:DOC , 页数:13 ,大小:183.54KB ,
资源ID:4066804      下载积分:10 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.docduoduo.com/d-4066804.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(BP神经网络的基本原理-一看就懂.doc)为本站会员(weiwoduzun)主动上传,道客多多仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知道客多多(发送邮件至docduoduo@163.com或直接QQ联系客服),我们立即给予删除!

BP神经网络的基本原理-一看就懂.doc

1、5.4 BP神经网络的基本原理BP(Back Propagation)网络是 1986年由 Rinehart和McClelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP 网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。BP 神经网络模型拓扑结构包括输入层(input)、隐层(hide layer)和输出层(output layer)(如图 5.2所示)。5.4.1 BP神经元图 5.3给出了第 j

2、个基本 BP神经元(节点),它只模仿了生物神经元所具有的三个最基本也是最重要的功能:加权、求和与转移。其中 x1、x 2xixn分别代表来自神经元1、2in 的输入;w j1、w j2wjiwjn则分别表示神经元 1、2in 与第 j个神经元的连接强度,即权值;b j为阈值;f()为传递函数;y j为第 j个神经元的输出。第 j个神经元的净输入值 为:(5.12)其中: 若视 , ,即令 及 包括 及 ,则于是节点 j的净输入 可表示为:(5.13)净输入 通过传递函数(Transfer Function)f ()后,便得到第 j个神经元的输出 :(5.14)式中 f()是单调上升函数,而且必

3、须是有界函数,因为细胞传递的信号不可能无限增加,必有一最大值。5.4.2 BP网络BP算法由数据流的前向计算(正向传播)和误差信号的反向传播两个过程构成。正向传播时,传播方向为输入层隐层输出层,每层神经元的状态只影响下一层神经元。若在输出层得不到期望的输出,则转向误差信号的反向传播流程。通过这两个过程的交替进行,在权向量空间执行误差函数梯度下降策略,动态迭代搜索一组权向量,使网络误差函数达到最小值,从而完成信息提取和记忆过程。5.4.2.1 正向传播设 BP 网络的输入层有 n个节点,隐层有 q个节点,输出层有 m个节点,输入层与隐层之间的权值为 ,隐层与输出层之间的权值为 ,如图 5.4所示

4、。隐层的传递函数为f1(),输出层的传递函数为 f2(),则隐层节点的输出为(将阈值写入求和项中):k=1,2,q (5.15)输出层节点的输出为:j=1,2,m (5.16)至此 B-P网络就完成了 n维空间向量对 m维空间的近似映射。5.4.2.2 反向传播1) 定义误差函数输入 个学习样本,用 来表示。第 个样本输入到网络后得到输出(j=1,2,m)。采用平方型误差函数,于是得到第 p个样本的误差 Ep:(5.17)式中: 为期望输出。对于 个样本,全局误差为:(5.18)2)输出层权值的变化采用累计误差 BP算法调整 ,使全局误差 变小,即(5.19)式中: 学习率定义误差信号为:(5

5、.20)其中第一项:(5.21)第二项:(5.22)是输出层传递函数的偏微分。于是:(5.23)由链定理得:(5.24)于是输出层各神经元的权值调整公式为:(5.25)3)隐层权值的变化(5.26)定义误差信号为:(5.27)其中第一项:(5.28)依链定理有:(5.29)第二项:(5.30)是隐层传递函数的偏微分。于是:(5.31)由链定理得:(5.32)从而得到隐层各神经元的权值调整公式为:(5.33)5.4.3 BP算法的改进BP算法理论具有依据可靠、推导过程严谨、精度较高、通用性较好等优点,但标准 BP算法存在以下缺点:收敛速度缓慢;容易陷入局部极小值;难以确定隐层数和隐层节点个数。在

6、实际应用中,BP 算法很难胜任,因此出现了很多改进算法。1) 利用动量法改进 BP算法标准 BP算法实质上是一种简单的最速下降静态寻优方法,在修正 W(K)时,只按照第 K步的负梯度方向进行修正,而没有考虑到以前积累的经验,即以前时刻的梯度方向,从而常常使学习过程发生振荡,收敛缓慢。动量法权值调整算法的具体做法是:将上一次权值调整量的一部分迭加到按本次误差计算所得的权值调整量上,作为本次的实际权值调整量,即:(5.34)其中: 为动量系数,通常 00.9;学习率,范围在 0.00110 之间。这种方法所加的动量因子实际上相当于阻尼项,它减小了学习过程中的振荡趋势,从而改善了收敛性。动量法降低了

7、网络对于误差曲面局部细节的敏感性,有效的抑制了网络陷入局部极小。2) 自适应调整学习速率标准 BP算法收敛速度缓慢的一个重要原因是学习率选择不当,学习率选得太小,收敛太慢;学习率选得太大,则有可能修正过头,导致振荡甚至发散。可采用图 5.5所示的自适应方法调整学习率。调整的基本指导思想是:在学习收敛的情况下,增大 ,以缩短学习时间;当 偏大致使不能收敛时,要及时减小,直到收敛为止。3) 动量-自适应学习速率调整算法采用动量法时,BP 算法可以找到更优的解;采用自适应学习速率法时,BP 算法可以缩短训练时间。将以上两种方法结合起来,就得到动量-自适应学习速率调整算法。4) L-M 学习规则L-M

8、(Levenberg-Marquardt)算法比前述几种使用梯度下降法的 BP算法要快得多,但对于复杂问题,这种方法需要相当大的存储空间。L-M(Levenberg-Marquardt)优化方法的权值调整率选为:(5.35)其中:e误差向量;J网络误差对权值导数的雅可比(Jacobian)矩阵;标量,当 很大时上式接近于梯度法,当 很小时上式变成了 Gauss-Newton法,在这种方法中, 也是自适应调整的。综合考虑,拟采用 L-M学习规则和动量法分别作为神经网络的训练函数和学习函数。5.5 BP神经网络的训练策略及结果本文借助于 MATLAB神经网络工具箱来实现多层前馈 BP网络(Mult

9、i-layer feed-forward backpropagation network)的颜色空间转换,免去了许多编写计算机程序的烦恼。神经网络的实际输出值与输入值以及各权值和阈值有关,为了使实际输出值与网络期望输出值相吻合,可用含有一定数量学习样本的样本集和相应期望输出值的集合来训练网络。训练时仍然使用本章 5.2节中所述的实测样本数据。另外,目前尚未找到较好的网络构造方法。确定神经网络的结构和权系数来描述给定的映射或逼近一个未知的映射,只能通过学习方式得到满足要求的网络模型。神经网络的学习可以理解为:对确定的网络结构,寻找一组满足要求的权系数,使给定的误差函数最小。设计多层前馈网络时,主

10、要侧重试验、探讨多种模型方案,在实验中改进,直到选取一个满意方案为止,可按下列步骤进行:对任何实际问题先都只选用一个隐层;使用很少的隐层节点数;不断增加隐层节点数,直到获得满意性能为止;否则再采用两个隐层重复上述过程。训练过程实际上是根据目标值与网络输出值之间误差的大小反复调整权值和阈值,直到此误差达到预定值为止。5.5.1 确定 BP网络的结构确定了网络层数、每层节点数、传递函数、初始权系数、学习算法等也就确定了 BP网络。确定这些选项时有一定的指导原则,但更多的是靠经验和试凑。1)隐层数的确定:1998年 Robert Hecht-Nielson证明了对任何在闭区间内的连续函数,都可以用一

11、个隐层的 BP网络来逼近,因而一个三层的 BP网络可以完成任意的 n维到 m维的映照。因此我们从含有一个隐层的网络开始进行训练。2) BP 网络常用传递函数:BP网络的传递函数有多种。Log-sigmoid 型函数的输入值可取任意值,输出值在 0和 1之间;tan-sigmod 型传递函数 tansig的输入值可取任意值,输出值在-1 到+1 之间;线性传递函数 purelin的输入与输出值可取任意值。BP 网络通常有一个或多个隐层,该层中的神经元均采用 sigmoid型传递函数,输出层的神经元则采用线性传递函数,整个网络的输出可以取任意值。各种传递函数如图 5.6所示。只改变传递函数而其余参

12、数均固定,用本章 5.2节所述的样本集训练 BP网络时发现,传递函数使用 tansig函数时要比 logsig函数的误差小。于是在以后的训练中隐层传递函数改用 tansig函数,输出层传递函数仍选用 purelin函数。3) 每层节点数的确定:使用神经网络的目的是实现摄像机输出 RGB颜色空间与 CIE-XYZ色空间转换,因此 BP网络的输入层和输出层的节点个数分别为 3。下面主要介绍隐层节点数量的确定。对于多层前馈网络来说,隐层节点数的确定是成败的关键。若数量太少,则网络所能获取的用以解决问题的信息太少;若数量太多,不仅增加训练时间,更重要的是隐层节点过多还可能出现所谓“过渡吻合”(Over

13、fitting)问题,即测试误差增大导致泛化能力下降,因此合理选择隐层节点数非常重要。关于隐层数及其节点数的选择比较复杂,一般原则是:在能正确反映输入输出关系的基础上,应选用较少的隐层节点数,以使网络结构尽量简单。本论文中采用网络结构增长型方法,即先设置较少的节点数,对网络进行训练,并测试学习误差,然后逐渐增加节点数,直到学习误差不再有明显减少为止。5.5.2 误差的选取在神经网络训练过程中选择均方误差 MSE较为合理,原因如下: 标准 BP算法中,误差定义为:(5.36)每个样本作用时,都对权矩阵进行了一次修改。由于每次权矩阵的修改都没有考虑权值修改后其它样本作用的输出误差是否也减小,因此将

14、导致迭代次数增加。 累计误差 BP算法的全局误差定义为:(5.37)这种算法是为了减小整个训练集的全局误差,而不针对某一特定样本,因此如果作某种修改能使全局误差减小,并不等于说每一个特定样本的误差也都能同时减小。它不能用来比较 P和 m不同的网络性能。因为对于同一网络来说,P 越大,E 也越大; P 值相同,m 越大 E也越大。 均方误差 MSE:(5.38)其中: 输出节点的个数, 训练样本数目, 网络期望输出值, 网络实际输出值。均方误差克服了上述两种算法的缺点,所以选用均方误差算法较合理。5.5.3 训练结果训练一个单隐层的三层 BP网络,根据如下经验公式选择隐层节点数 125:(5.3

15、9)式中:n 为输入节点个数,m 为输出节点个数,a 为 1到 10之间的常数。针对本论文 n1取值范围为 313。训练结果如表 5.1所示。表 5.1 隐层节点数与误差的关系隐层神经元个数 训练误差 测试误差3 1.25661 1.12754 0.797746 0.82325 0.631849 0.72786 0.570214 0.67077 0.552873 0.68958 0.445118 0.65759 0.385578 0.649710 0.259624 0.455511 0.185749 0.664412 0.183878 0.4813 0.168587 0.6671由上表可以看出

16、: 增加隐层节点数可以减少训练误差,但超过 10以后测试误差产生波动,即泛化能力发生变化。综合比较隐层节点数为 10与 12的训练误差和测试误差,决定隐层节点数选用 12。 训练误差和测试误差都很大,而且收敛速度极慢(训练过程如图 5.7所示),这个问题可以通过对输出量进行归一化来解决。根据 Sigmoid型传递函数输入和输出的范围,对输入变量不进行归一化处理,只对输出变量进行归一化,这是因为在输出数据要求归一化的同时,对输入数据也进行归一化的话,权值的可解释性就更差了。目标值按下式进行变化:(5.40)使目标值落在 0.050.95 之间,这样靠近数据变化区间端点的网络输出值就有一波动范围,

17、网络的性能较好。用新生成的训练样本与测试样本对隐层节点数为 12的网络进行训练,得到的训练误差为 9.8902810-5,测试误差为 1.989910-4,达到了预定的目标(训练过程如图 5.8所示)。5.6 最终训练后的神经网络结构采用三层 BP网络实现摄像机输出 RGB颜色空间与 CIEXYZ色空间转换,其中隐层含有 12个节点,传递函数采用 tansig函数;输出层传递函数选用 purelin函数。经过测试后结果满意,可以认为该神经网络可以用来实现这个关系映射。网络的结构如图 5.9所示:得到的 BP神经网络的权值和阈值为:5.7 本章小结1) 定量地分析了用线性关系转换摄像机 RGB空

18、间到 CIE-XYZ空间数据后产生的均方误差,表明 CCD摄像机与标准观察者之间有比较明显的差别,也就是说 RGB与 CIE-XYZ间的转换是非线性的。2) 采用 MATLAB 中神经网络工具箱实现多层前馈 BP网络的 RGB到 CIEXYZ颜色空间转换,用经过归一化的训练样本与测试样本对隐层节点数为 12的三层网络进行训练,得到的训练误差为 9.8902810-5,测试误差为 1.989910-4,结果表明经过训练的多层前馈 BP网络可以满足 RGB空间向 CIEXYZ颜色空间转换要求,达到了预定目标。3) 确定了用于 RGB和 XYZ颜色空间转换的 BP网络结构,并求出了该神经网络的权值和阈值。使用该网络可以定量表达食品颜色,定量比较高压加工食品颜色的变化,可以使食品颜色测定和控制实现定量化,而不再是主观性很强的模糊描述。

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报