1、非线性状态空间方法辨识电液伺服控制系统第 44 卷第 12 期机械工程 Vo1.44No.122008 年 12 月 CHINESEJOURNALOFMECHANICALENGINEERINGDec.2008DoI:10.3901/JME.2008.12.080非线性状态空间方法辨识电液伺服控制系统木岑豫皖叶金杰潘紫微(安徽工业大学机械工程学院马鞍山 243002)摘要:针对回归神经网络辨识和建立非线性动态系统模型的问题 ,研究非线性状态空间描述的回归神经网络数学模型.讨论极小均方误差网络训练收敛准则,通过研究 Kalman 滤波估计公式中的随机变量,提出一种参数增广的回归神经网络非线性状态方
2、程,无导数的 Kalman 滤波器用于增广参数估计,人工白噪声强迫网络学习,更新网络权值,避免了扩展 Kalman 滤波器计算 Jacobian 信息和基于递度学习算法收敛慢的问题.在电液伺服系统辨识建模的应用中表明,回归神经网络较好地跟踪了液压油缸压力变化,与扩展 Kalman 滤波估计学习算法相比,新的算法具有较快的收敛和精度.关键词:系统辨识 Kalman 滤波非线性状态空间电液伺服系统中图分类号:TD422.5NonlinearStateSpaceApproachforIdentifyingElectrohydraulicServoControlSystemCENYuwanYEJinj
3、iePANZiwei(SchoolofMechanicalEngineering,AnhuiUniversityofTechnology,Maanshan243002)Abstract:Forthepurposeofsolvingtheproblemsinidentificationandmodelingofnonlineardynamicsystemusingrecurrentneuralnetworks(RNN),anonlinearstatespacemodelisinvestigatedforRNN.Theconvergencecriterionfornetworkstrainingi
4、sdiscussedunderminimummeansquareerror(MMSE).ThestochasticvariableintheKalmanfilterformulationsisresearched.Aparameter?augmentednonlinearstatespaceequationforRNNisproposed.Aderivative-freeKalmanfilterisemployedtoestimatetheaugmentedparametersandtoupdateweightsofRNNbyusingartificialwhitenoisetocompelR
5、NNtoleam.ComparedwiththeextendedKalmanfilter(EKF),computationofJacobianinformationiSavoidedandtheproblemofslowconvergencerateofalgorithmbasedongradientlearningisalsosolved.TheapplicationofRNNintheidentificationandmodelingofanelectrohydraulicservosystemshowsthatRNNiscapableoftrackingthedynamicpressur
6、eofthehydrauliccylinder.ThenewalgorithmhasfasterconvergenceandhigherprecisioncomparedtothealgorithmofextendedKalmanfilter.Keywords:SystemidentificationKalmanfilterNonlinearstatespaceElectro.hydraulicservosystem0 前言回归神经网络根据非线性状态方程进化参数,采用内部状态反馈来跟踪系统非线性动力学行为,具有较强处理动态信息能力 llj.回归神经网络这种特点被广泛应用于系统辩识和建模,信号处
7、理,自适应控制,时间序列预测等领域【2.有多种结构的回归神经网络,包括全反馈连接和部分反馈连接,单隐层和多隐层网络.学习算法一般是采用基于梯度的实时回归或动态算法离线进行,这些算法只利安徽省教育厅自然科学研究资助项目(KJ2007BI34).20071220 收到初稿,20080409 收到修改稿用了输入输出误差的一阶导数信息来调整网络参数,收敛速度较慢,而且可能存在学习时递度消失 J,使得网络收敛于局部极小点,而导致训练失效.回归扩展 Kalman 滤波器采用对非线性系统导数线性化方法,抽取导数信息训练神经网络,需要计算 Jacobian 矩阵或 Hession 矩阵,计算复杂.一种无需计算
8、导数信息的扩展 Kalman 滤波得到发展,称之为分布逼近的 Kalman 滤波6J, 这种算法原理是通过高阶 Taylor 级数逼近非线性变换的随机变量统计特征均值和协方差,实质是对非线性函数统计线性化处理的计算方法.计算精度优于利用导数信息的扩展 Kalman 滤波器,且 UKF 计算复杂性仅有 O(n),具有较高估计精度.本文针对回归神2008 年 12 月岑豫皖等:非线性状态空间方法辨识电液伺服控制系统 81经网络辨识非线性系统数学模型的问题,首先利用非线性状态空间描述了基于输入输出的自回归模型,在非线性状态空间下,构造回归神经网络学习模型,研究网络权值更新 Kalman 滤波估计算法
9、,并应用在电液伺服系统建模和辨识中,得到了满意的仿真结果.1 非线性系统状态空间描述系统辨识的关键问题是根据一些先验知识,寻找未知系统的结构和确定未知系统的参数.然而,对于非线性系统的辨识,难于获得未知系统全部先验知识,基于输入/输出非线性自回归模型可选择用于非线性系统建模和辨识.设 u(k),yp(k)为未知非线性系统的输入 ,输出测量,不失一般性,考虑单输入/单输出非线性系统辨识,当阶(,m) 已知时,使用输入的 n 阶延时和输出的 m 阶延时构成输入矢量和输出矢量(足)=(Ji),u(k 一 1),u(kn+1)(1)Yp(k)=(Yp(七),Yp( 七一 1),YP(km+1)(2)式
10、中,(作为未知系统 k 时刻的外部输入,Y(k)作为未知非线性系统 k 时刻的可观测输出.白回归模型系统建模问题就是根据获得的辨识对(七),Y(k), 建立一个非线性映射.即YP(k+1)=G(yP(七),Yp(七一 m+1);(七),u(kn+1)(3)式中 G(?)为非线性函数,式 (3)可描述一般非线性系统.神经网络具有能够逼近任意函数的能力,所以可用一个全连接全反馈多层回归神经网络逼近式(3)所描述的单输入/单输出系统,神经网络的描述方程式为y(k+1)=(七),();W)+e(k+1)(4)式中,为有限维参数矢量,则误差信号 e(k+1)为未知系统的输出测量与神经网络计算输出的差,即
11、e(k+1)=yp(k+1)一 y(k+1)(5)在基于递度的网络权值学习算法中,使误差e(k+1)在某种意义下最小,可获得网络的权重矢量.式 f4)规定的网络为含有一个隐层的递归神经网络的状态空间描述为x(k+1)=厂(),lf(Jj);r)(6)y(k+1)=g(J,(七 ),x(k+1);)(7)式中,矢量 x(k+1)是隐层神经元输出 ,矢量 y(k+1)输出层神经元输出,厂(?)称之为隐层神经元的激活函数,g(?)输出层的激活函数,矢量参数 r,表示隐含层,输出层的联接权重矢量.式(6),(7)描述的状态方程与式 (4)描述的方程相比有如下优点:状态方程用较低阶和较少的回归因子.状态
12、方程可以描述许多动态系统.2 回归神经网络的状态空间学习式(6),(7)描述了一个多层回归神经网络 ,信号流图如图 1 所示.(助表示输入矢量,x(k+1)表示隐含层的输出矢量,y(k+11 表示网络的输出矢量.图 1 中,D 为一步延时,反馈隐含层的状态和输出层的输出到各自神经元输入端,具有反馈结构的回归神经网络具有更好的稳定性和泛化能力,能够存储过去的信息.图 1 回归多层感知器结构框图和信息流设)=)(8)则式(6),(7)描述的动态回归神经网络随机状态学习方程为W(k+1)=(尼)+9()(9)y(k+1)=JII(尼),lf(七),(),J,( 七)+l,(k)(10)式(9)称之为
13、白噪声驱动的学习过程方程,式(10)称为测量方程 .过程噪声),测量噪声 l,(k)为 Gaussian 白噪声 .任意 f,满足E(togoj)=,Q(k)(11)JE(J,)=,R(k)(12)E(vw,)=0(13)式(11)(13)中,JE(?)表示对随机变量求期望值算子.Kalman 滤波状态估计算法Kalman 滤波状态估计以最小均方误差准则作为计算标准,建立的线性回归递推算法,在机器人控制,时间序列预测等领域得到广泛应用 J.3.1 扩展 Kalman 滤波估计对于式(6),(7)非线性状态方程描述的回归神经网络,若采用扩展 Kalman 滤波器方法估计网络权82 机械工程第 4
14、4 卷第 12 期重状态,在估计状态附近,必须对式(10)进行线性化处理,线性化计算原理如图 2 所示.图 2 扩展 Kalman 滤波器计算中非线性函数线性化原理图 2 表示的非线性函数线性化方法,需要计算Jacobian 矩阵 ,对于式(10)表示的非线性函数,Jacobian 矩阵的数学表达为)=Oh1aOh2aOh.aw1OhlaOh2aOh.a(14)神经元权值估计按以下步骤进行.(1)计算 Kalman 滤波增益K(k)=P(k/k 一 1)H(尼) (尼)?P(k/k 一 1)H(足)+R(七)(15)(2)网络权值估计W(k/k)=W(k/k 一 1)+()?Y 一(16)(3
15、)协方差估计P(k/尼 )=P(k/k 一 1)一(尼)()?P(k/k 一 1)+Q(尼)(17)(4)网络权值更新w(k+l/k)=W(k/k)(18)(5)协方差更新P(k+l/k)=P(k/k)(19)式(15)(19)表示的神经网络训练算法 ,利用了截尾的一阶 Taylor 级数线性化式(10),此时 Kalman滤波估计为次优估计们.3.2 非线性 Kalman 滤波状态估计非线性 Kalman 滤波状态估计主要是通过选择一些点,利用这些点逼近均值和协方差,而无需导数信息.这种计算方法是统计回归线性化方法结合Kalman 滤波状态估计的算法.对非线性函数进行Sigma 点线性化计算
16、,原理如图 3 所示.图 3 分布逼近的 Kalman 滤波计算中非线性函数的线性化原理分布逼近的 Kalman 滤波估计网络权重的学习按以下各式进行.设式(11),(12)描述学习方程的状态增广为f 一 l/k 一 1wLl/krlVk 一 1j(20)纰一.j对式(20)取期望f_I,111=II(21)l/式(21)中,0,0 分别表示 r,q 阶零矢量.式(20)表示的增广状态协方差为f,_l,W-.=f 口一?I(22)0Rk 一 1J式中,表示测量和过程噪声的相关矩阵.1 时刻的网络权重增广矩阵为一.=(一(+)=wL1i=0+(厩?三,一(厩)一,2L【23)式(23)中,L 为
17、权重矢量的长度 ,(0.O1,1) 为 RLS回归因子,网络输出层的增广输出为/k 一 1=JIl(z,Uk,瓤,)(24)网络输出层的真实输出为Yk/k 一 1=JIl(Wk,Uk,Xk,Yk)(25)测量和协方差更新方程为2 工()=()一 Y()假() 一 J,(七)(26)一一弧一2008 年 12 月岑豫皖等:非线性状态空间方法辨识电液伺服控制系统 83(l)=(尼)一 J,(七)() 一(七)(27),(k)=(后)(七)(28)w(k+1)=(七)+)(k)e(k)(29)P(k+1)=P(七)-7(k)P(k)r(k)(30)式中,.为统计线性回归系数,分别取为:i:1,2,2
18、L2(L+计算误差准则为t,()=e(k)R 一(七)(后)(31)式中()=(尼十 1)一 JIl(),(足),(七),J,(尼),月()=diagE(v(i)v(j),为权重状态估计误差的协方差 ,影响网络学习的收敛速度.Q()=diagE(eJ(i)Xco(j),为测量方程误差的协方差,影响模型跟踪一I 生能.4 回归神经网络辨识应用和仿真电液伺服控制系统由比例阀控制的液压伺服系统和步进运动机构组成,液压油缸驱动步进运动机构按一定节奏工作.由于大负载,大冲击的影响,步进运动机构振动以及运动机构之间的摩擦,是不可测量的非线性变参数.而且电液伺服系统与步进运动机构之间存在强耦合,这些因素都对
19、辩识和建立液压伺服系统数学模型影响较大.另外,系统元件存在非线性和液压油粘滞阻力和可压缩性,也是按非线性规律变化的不可测量信息,在这些不可测量信息综合影响下,电液伺服系统为一个非线性系统l.一般的辩识方法建立数学模型不能完全描述电液伺服控制系统的动态特性.采用回归神经网络辩识电液伺服系统油缸压力动态变化特性,根据电液伺服系统输入输出信息的测量.电液伺服控制系统辨识和神经网络训练框图如图 4 所示.图 4 神经网络训练框图根据图 4 所示辨识框图,设计一个 292 全连接结构的回归神经网络,隐含层和输出层的激励函数为 Sigmoid 型,用于辨识液压油缸的压力变化.训练回归神经网络的输入信号,取
20、自电液伺服控制系统控制输入序列 u(k)与伺服液压控制系统油缸压力输出序列 Y(),辨识试验系统组成框图如图 5所示.图 5 辨识试验系统组成框图根据图 5 所示辨识试验方案,采集电液伺服系统在负载工作时的控制输入信号(七),液压系统油缸有杆腔压力和无杆腔压力,列矢量,组成系统的输出 Y(k).把输入输出辨识对(尼),Yp(后)输入到神经网络,采用扩展 Kalman 滤波估计算法和分布逼近 Kalman 滤波估计算法训练回归神经网络权值.步进梁电液伺服液压系统具有前进,后退,上升,下降四种工况,以电液伺服系统驱动步进梁前进运动的输入输出数据进行神经网络辨识和仿真计算(其他三种工况的辨识与仿真方案相同),神经网络学习误差收敛结果如图 6 所示.jj】 婚窿是样本个数图 6 分布逼近和扩展 Kalman 滤波参数估计平方和误差曲线