1、1,四、反馈网络,1982年,1984年美国加州工学院物理学家JHopfield分别提出了两种神经网络模型,属于反馈式神经网络模型。,Hopfield网络是单层对称全反馈网络,根据激活函数的选取不同,分为离散型的霍普菲尔德网络(DHNN)和连续型的霍普菲尔德网络(CHNN)。,前馈式网络的信号是单向从一层传向下一层。若将网络的输出反馈到其输入就得到一个反馈式神经网络。这样的网络就是一个动力学系统。,2,离散型的霍普菲尔德网络的激活函数为二值型的,其输入、输出为0,1的反馈网络,主要用于联想记忆。 其功能是:储存一组平衡点,使得当给网络一组初始值时,网络通过自行运行最终收敛到设计的平衡点上。 连
2、续型的霍普菲尔德网络的激活函数的输入与输出之间的关系为连续可微的单调上升函数,主要用于优化计算。 以目标函数与约束条件建立系统的能量函数,并与网络的权值更新联系起来。网络运行到稳定态,能量函数得极小值。得到优化问题的解。,3,反馈网络能表现出非线性动力学系统的动态特性。具有的主要特性为: 第一、网络系统具有若干个稳定状态。当网络从某一初始状态开始运动,网络系统总可以收敛到某一个稳定的平衡状态; 第二,系统稳定的平衡状态可以通过设计网络的权值而被存储到网络中。 着重关心的是网络的稳定性问题,研究的重点是怎样得到和利用稳定的反馈网络。,4,1.霍普菲尔德网络模型,5,1) 离散型反馈网络 激活函数
3、ai=f()是一个二值型的硬函数, 即aisgn(ni),il, 2, r。2) 连续型反馈网络 ai=f(ni)中的f()是一个连续单调上升的有界函数。 具有饱和线性的激活函数,满足连续单调上升的有界函数条件,可作为连续型的激活函数。还可以用S函数。,6,2. 状态轨迹,设状态向量N=n1, n2, ,nr,网络的输出向量为Aa1,a2,asT , 从初始值N(t0)出发, N(t0+t)N(t0+2t)N(t0+mt), 这些在状态空间上的点组成的确定轨迹,是网络演化过程中所有可能状态的集合,称这个状态空间为相空间。,7,DHNN:因为N(t)中每个值只可能为1,或0,1,对于确定的权值w
4、ij,其轨迹是跳跃的阶梯式,如图中A所示。CHNN:因为f()是连续的,因而,其轨迹也是连续的。如图中B、C所示。,8,对于不同的连接权值wij和输入Pj(i, j=1, 2, r),反馈网络状态轨迹可能出现以下几种情况。 1) 状态轨迹为稳定点 从初值N(t0)开始,一定时间t(t0)后,到达N(t0+t)。如果N(t0+t+t)=N(t0+t),t0,状态N(t0+t)称为网络的稳定点,或平衡点。 处于稳定时的网络状态叫做稳定状态,又称为稳定吸引子。一个反馈网络中,存在很多稳定点,可以分为: 渐近稳定点:如果在稳定点Ne周围的N()区域内,从任一个初始状态N(t0)出发的每个运动,当t时都
5、收敛于Ne,则称Ne为渐近稳定点。,9, 不稳定平衡点Nen:在某些特定的轨迹演化过程中,网络能够到达稳定点Nen,但对于其它方向上的任意一个小的区域N(),不管N()取多么小,其轨迹在时间t以后总是偏离Nen。 网络的解:如果网络最后稳定到期望的稳定点,且该稳定点又是渐近稳定点,那么这个点称为网络的解。 网络的伪稳定点:网络最终稳定到一个渐近稳定点上,但这个稳定点不是网络设计所要求的解,这个稳定点为伪稳定点。,10,2)状态轨迹为极限环 如果在某些参数的情况下,状态N(t)的轨迹是一个圆,或一个环,状态N(t)沿着环重复旋转,永不停止,此时的输出A(t)也出现周期变化,即出现振荡。 对于DH
6、NN,轨迹变化可能在两种状态下来回跳动,其极限环为2。如果在r种状态下循环变化,称其极限环为r。,11,3) 混沌现象 如果状态N(t)的轨迹在某个确定的范围内运动,但既不重复,又不能停下来,状态变化为无穷多个,而轨迹也不能发散到无穷远,这种现象称为混沌(chaos)。 在出现混沌的情况下,系统输出变化为无穷多个,并且随时间推移不能趋向稳定,但又不发散。,12,4) 状态轨迹发散 如果状态N(t)的轨迹随时间一直延伸到无穷远,此时状态发散,系统的输出也发散。 在人工神经网络中,由于输出激活函数是有界函数,虽然状态N(t)是发散的,但其输出A(t)还是稳定的,而A(t)的稳定反过来又限制了状态的
7、发散。 一般非线性人工神经网络中发散现象是不会发生的,除非神经元的输入输出激活函数是线性的。,13,反馈神经网络利用稳定状态点,即稳定的专门轨迹来解决某些问题的。 把系统的稳定点看作一个记忆,从初始状态朝这个稳定点移动的过程就是寻找该记忆的过程。 状态的初始值看作给定的有关该记忆的部分信息,状态N(t)移动的过程,是从部分信息寻找全部信息,这就是联想记忆的过程。 把系统的稳定点考虑为一个能量函数的极小点,在状态空间中,从初始状态N(t0)N(t0+t),最后到达N*。若N*为稳定点,可看作是N* 把N(t0)吸引了过去,在N(t0)时能量比较大,而吸引到N* 时能量已为极小了。,14,从能量观
8、点看,把这个能量的极小点作为一个优化目标函数的极小点,把状态变化的过程看成是优化某一个目标函数的过程。反馈网络的状态移动的过程实际上是一种计算联想记忆或优化的过程。 它的解并不需要真的去计算,只需要形成一类反馈神经网络,适当地安排其权重值wij,使其初始输入A(t0)向稳定吸引子移动就可以达到这个目的。 霍普菲尔德网络是利用稳定吸引子来对信息进行储存的,利用从初始状态到稳定吸引子的运行过程来实现对信息的联想存取的。,15,3. 连续型霍普菲尔德网络(CHNN),CHNN的输入和输出都是连续量。 定义网络中第i个神经元的输入总和为si,输出状态为xi,则网络输出状态:,1) 网络结构,16,连续
9、霍普菲尔德网络激活函数,其中神经元的激活函数 f 为S 型的函数,或,17,2)电路模型,Hopfeild用模拟电路设计了CHNN的电路模型,下面是其中一个神经元。,ui 表示细胞内部膜电位状态。Ci 是细胞膜输入电容,Ri为传递电阻。输出是Vi,Ii 为固定电流。Ri1, Rin 反映了神经元之间的连接权。,18,整理后,其中,CHNN是一个非线性动力学系统。给定初始状态后,系统稳定的话,最终收敛到一个稳定状态。 用硬件实现,求解微分方程的过程由电路自动完成,求解速度非常快。,令,19,3)稳定性,定义CHNN的能量函数,因为xi 是s函数的输出,值是有限的,所以E 有界。 只要 ,系统稳定
10、。,20,因为 单调上升,反函数 也单调上升, 同时 , 因而有,所以CHNN是渐进稳定的。随着时间演变,E不断减小,直到取极小值,这时xi 变为常数,网络收敛到稳定状态。,其中,则有,21,4. CHNN求解TSP问题 1)TSP介绍TSP(Traveling Salesman Problem)问题,即“旅行商问题”。是一个十分有名的难以求解的优化问题,其要求很简单:在n个城市的集合中,找出一条经过每个城市各一次,最终回到起点的最短路径。 如果已知城市A,B,C,D,之间的距离为dAB,dBC,dCD;那么总的距离ddAB+dBC+dCD+。对这种动态规化问题,求其min(d)的解。 因为对
11、于n个城市的全排列共有n!种,而TSP并没有限定路径的方向,即为全组合,所以在固定的城市数n的条件下,其路径总数为 Snn!2n (n4),22,n4时的TSP路径图,城市数与旅行方案数,S44!(2*4)=3,23,2)CHNN求解TSP Hopfield用CHNN求解TSP,开辟了解决这一问题的新途径。基本思想:把TSP映射到CHNN上,通过CHNN状态的动态演化逐步趋向稳态,自动地搜索出优化解。900个神经元在0.2秒内得到30个城市的TSP解。 TSP的解是若干城市的有序排列。任何一个城市在最终路径上的位置可用一个n维的0、1向量表示。n个城市,需要一个nn维矩阵,以5个城市为例,一种
12、可能的排列矩阵为:,矩阵唯一地确定了一条有效行程路径:CAEBDC,24,上面的矩阵称为换位矩阵。换位矩阵的约束条件:(1) 每行只有一个“1”,一个城市只能被访问一次。(2) 每列只有一个“1”,一次只能访问一个城市。,若用dxy表示从城市x到城市y的距离,则上面路径的总长度为: dxydCA+dAE+dEB+dBD+dDC TSP的最优解是求长度dxy为最短的一条有效的路径。,25,3)能量函数设计,(1)约束条件,约束条件要保证换位矩阵的每一行每一列中只有一个值为1,其他值均为零:,(2)目标函数,E2 反映了路径总长度,当,26,(3)总能量函数E,4)网络动态方程,对于二次型能量函数
13、,,欧拉法求解动态方程,27,5)网络输出函数,6)网络输入初始化,A=200,D=100,t=0.0001,10个城市TSP,28,29,30,换位矩阵1 0 0 1 0 0 0 0 0 0 02 0 1 0 0 0 0 0 0 0 03 1 0 0 0 0 0 0 0 0 04 0 0 0 0 0 1 0 0 0 05 0 0 0 0 0 0 0 0 0 16 0 0 0 0 0 0 0 0 1 07 0 0 0 1 0 0 0 0 0 08 0 0 0 0 1 0 0 0 0 09 0 0 0 0 0 0 0 1 0 010 0 0 0 0 0 0 1 0 0 0,31,5. CHNN用
14、于PID优化控制,1) 控制系统结构 被控对象 系统输入 PI控制器kp ,ki是两个需要优化的参数。,32,2) Hopfield网络结构3)能量函数4)控制系统目标函数,33,5)网络权值与阈值的确定 CHNN的状态随时间演变向En 减小的方向运动,到达稳定平衡点时,En=Enmin。此时,dEn/dt=0。当 时,有 。对比两式相关项即可定出网络权值与阈值。,34,35,36,37,权值,阈值,38,6) CHNN网络计算 输出微分方程 欧拉法求解微分方程 设 取K=3.2,a1=0.25, a2=0.03 编程运行可得优化的PI参数。,39,7)主要程序 由输入r(k), PI控制,
15、求输出y(k) e(k)=r-y(k); % 计算误差 ee(k)=ee(k-1)+e(k); % 误差和 u(k)=V(1,k)*e(k)+V(2,k)*ee(k); % PI控制 x(:,k+1)=A*x(:,k)+B*u(k); % 系统状态计算 y(k+1)=C*x(:,k+1); % 系统输出计算,40, 求网络权系值w、阈值I w=-(C*B*e(k)*(C*B*e(k) (C*B*ee(k)*(C*B*e(k); (C*B*ee(k)*(C*B*e(k) (C*B*ee(k)*(C*B*ee(k); %求权系值I=-(C*B*e(k)*(1-(C*A*x(k) (C*B*ee(k)*(1-(C*A*x(k);%求阈值 Kp、Ki优化计算X(1,k+1)=X(1,k)+a1*(w(1,:)*X(:,k)-I(1)*(K2-X(1,k)2) ;%Kp优化计算X(2,k+1)=X(2,k)+a2*(w(2,:)*X(:,k)-I(2)*(K2-X(2,k)2) ;%Ki优化计算,41,42,