1、 (2004 年教案) 辨识与自适应 第八章1第八章 系统辨识在自适应控制中的应用-自校正调节器( Self-Tuning Requlator 简称 STR )8 1 最小方差控制器 ( Minimal Variance Control 简称 MVC )1. 考虑 CARMA 过程A(z-1) y(k) = z-d B(z-1) u(k)+ C (z-1) (k) 式(8-1-1 ) (k) 为 N (0,1) 白噪声,滞后量 d 1 。A(z- 1) = 1+ a1z- 1 + a n z- n B(z- 1) = b0+b1z- 1 + b n z- n (b 0 0)C(z- 1) =
2、1+ c1z- 1 + c n z- n 设 A、 B、 C 均为稳定多项式 (过程稳定且逆稳定)。有:式(8-1-2)2. 将 C/A 分解成两部分令: 式(8-1-3)其中:F(z - 1) 为 d 项的商多项式FzGAd.)()()( 11kzkuzkyd (2004 年教案) 辨识与自适应 第八章2F(z- 1) = 1+ f1z- 1 + f d-1 z- d+1 ( d 项 )G (z- 1) 为余数多项式,有 n 项G(z- 1) = g0+g1z- 1 + g n-1 z- n+1 ( n 项 )例:A = 1-1.7 z- 1+0.7 z- 2 ; C = 1+1.5 z-
3、1+0.9 z- 2 ;d=2 ; n=23. 证明以下多项式恒等式成立 式(8 -1- 4)证明:式(8-1-3)将左右同 A同 C同 A同 B4 向前 d 步最优预报 y * ( k+dk )由式(8-1-2)向前移 d 步,有:BFCAzGCd.(.)1AFzGACzFCAzGCBzddddd11()()ykzBAukCzAkd()()() 11(2004 年教案) 辨识与自适应 第八章3考虑到式(8-1-3) ,有:式(8 -1- 5)由过程式(8-1-1)有:带入上式右项有将式(8 -1- 4)代入上式,有:式(8 -1- 6)其中 F (k+d) 项由 (k+d)、 (k+d-1)
4、、 (k+1),共计 d项组成,均为未来的干扰作用项,与前两项统计无关。用 y * ( k+dk ) 表示 k 时刻向前 d 步的最优预报(最小方差预报) ,ykdBAukFkdGAk()()()()()()()kCAykzBCukdykdBAukGykzGABukFkdGCzCuFddd()()()()()()()() BFCAzGCd.(.)1 )()()()( kFkuBkydky (2004 年教案) 辨识与自适应 第八章4即:E y(k+d)- y * ( k+dk ) 2 E y(k+d)- y ( k+dk ) 2由式(8 -1- 6)有:则 k 时刻向前 d 步的最优预报为:式
5、(8 -1- 7)5 最小方差控制率(MVC )令 yr 为输出设定值,要求 k 时刻的控制量 u(k)使得:将 y * ( k+dk ) = yr 代入式( 8 -1- 7)得出 MVC 为: 2222 )()()( )()()()()()( dkFEkdykuCBFyGE kdykkukykdyky )()()( kuCFBkyGky)(2minkurdEFBkyGCkur )()((2004 年教案) 辨识与自适应 第八章5式(8 -1- 8)若 yr = 0 ,则:式(8 -1- 9)6. MVC 框图 (k)CAyr C u(k) z-d B + y(k)B F + A - GB F
6、存在零极点对消,要求 B 为逆稳定7 MVC 的调节误差与方差定义调节误差为 y (k+d) = y (k+d) - yr由式(8 -1- 6))()(kyFBGku)()()()( dkFkuCBkyGdky yur(2004 年教案) 辨识与自适应 第八章6将 MVC 控制率式(8 -1- 8)代入上式得出: y (k+d) = yr + F (k+d)则:y (k+d) = y (k+d) - yr= F (k+d) 式(8 -1- 10)调节误差的方差为:E y 2 (k+d) = E y (k+d) - yr 2 = 2 E F (k+d) 2= 2 (1+f12+f22+fd-12
7、 ) 式(8 -1- 11)因为 F(z- 1) = 1+ f1z- 1 + f d-1 z- d+1 (共 d 项 )可见:d 愈大调节误差的方差也愈大。8 举例 A y(k) = z-d Bu(k)+ C (k)A = 1-1.7 z- 1+0.7 z- 2 ; B = 1+ 0.5z- 1 ; C = 1+1.5 z- 1+0.9 z- 2 ;d=2 ; n=2由长除法得:F = 1+ 3.2 z- 1 ; G = 5.64- 2.24 z- 1MVC 率,当 yr = 0 时: )(2.31)(5.0(46)( 1kyzzkBFku(2004 年教案) 辨识与自适应 第八章7当 yr
8、0 时:y(k)= F (k) = (1+3.2z-1) (k)E y 2 (k) = 2 (1+f12 )= 2 (1+3.2 2 )=11.24 2习题:已知过程A = 1-1.6 z- 1+0.8 z- 2 、B = 1- 0.5z- 1+0.2 z- 2 、C = 1- 0.95 z- 1+0.5 z- 2 、y r = 0 , 求 d= 1、2、3 时的 MVC 控制率和 y(k)与 E y 2(k) ?9 MVC 小结a) MVC 是使向前 d 步控制方差为最小的随机控制,算法简单,容易实现;b) 其本质上是向前 d 步的最优预报,适用于强随机干扰和大滞后的场合;)(6.17.31
9、245)( kyzzku211216.7.3)(4.5()905.() zkyyzBkGCkurr )()()(11kAzCkuAzkyd (2004 年教案) 辨识与自适应 第八章8c) 只适用于逆稳定(最小相位)过程,由此限制了它的应用范围;d) 指标中仅考虑使得 E y 2 为最小,没有对 u 的约束,有可能因导致过大的控制动作而不能实现;要求过程模型已知,因此它还不是自适应控制。8 2 自校正调节器(Self -tuning Regulator)参数在线辨识与 MVC 的结合,1973 年首次提出,后经不断改进,并获得广泛应用。1 STR 框图干扰u y过程在线估计调节器自校正调节器示
10、意框图 (k)(2004 年教案) 辨识与自适应 第八章9CAu(k) z-d B + y(k)A - GBFMVC 框图 (k)CAu(k) z-d B + y(k)A - (z-1)(z-1)STR(隐式)框图2. 向前 d 步预报方程可以通过在线估计 A、B、C 的参数,计算得出 G 和 F,再计(2004 年教案) 辨识与自适应 第八章10算出 (z-1) 和 (z-1),构成 STR 的显示算法,而更为简洁的是直接辨识以下向前 d 步预报方程:y(k+d ) = (z-1)y(k)+ (z-1)u(k)+ w(k+d) 式(8-2-1)其中: (z-1)= 1+ 2 z-1+ p z
11、-p+1 共 p 项 (p=n) (z-1)= 0+ 1 z-1+ q z- q 共 q+1 项(q=n+d-1)即:y(k+d )= 1y(k)+ py(k-p+1)+ 0u(k)+ 1u(k-1)+ qu(k- q)+ w(k+d) w(k+d) 预报误差将式(8-1-12)预报方程向后位移 d 步,得出:y(k) = (z-1)y(k-d)+ (z-1)u(k-d)+ w(k) 式(8-2-1-a)即:y(k)= 1y(k- d)+ py(k- d-p+1)+ 0u(k- d)+ 1u(k- d -1)+ qu(k- d - q)+ w(k)因为 q= d+p-1,所以上式还可写为y(k
12、)= 1y(k- d)+ py(k- q)+ 0u(k- d)+ 1u(k- d -1)+ qu(k- d - q)+ w(k) 式(8-2-1-b)3. STR 的计算步骤10 在线估计(2004 年教案) 辨识与自适应 第八章11引入向量 = 1、 p、 1、 q T (2n+d-1)1 维 (k) = y(k),y(k-p+1),u(k-1),u(k-q) T预报方程为y(k+d)= 0u(k)+ T (k)+w(k+d) 式(8-2-2 )或:y(k)= 0u(k-d)+ T (k-d)+w(k) 式(8-2-2-a)由上式(8-2-2-a) ,用 RLS 法可在线估计出 的参数。为避
13、免闭环不可辨识问题发生, 0 不参加在线辨识,而是事先确定的。20 确定控制量 u(k)控制的目标是使得 y(k+d)的最小方差预报 y (k+d k )等于 yr , 即:y (k+d k ) = 0u(k)+ k T (k) = yr 则:u(k) = yr- k T (k) 0 式(8-2-3)4. 仿真结果:举一简单例子:y(k) = y(k-1)+u(k-1)+ (k)- 0.7 (k-1)这里的:d=1, A= 1- z-1, B= 1, C= 1- 0.7z-1。解出 F= 1, G= 0.3 。对于参数已知情况下的 MVC 控制率为:u(k) = - 0.3 y (k) , 最
14、优反馈系数为 0.3。以下两图给出 STR 的仿真结果。(2004 年教案) 辨识与自适应 第八章12STR 参数在线估计仿真结果STR 与 MVC 累计损失函数 Vk 的比较5. 收敛性kiyV12)((2004 年教案) 辨识与自适应 第八章13问题:STR MVC ?已证明:当 p 和 q 足够大、而且 (z-1)与 (z-1)间无公共因子,则STR MVC(当 n时) 。6. STR 评价a) 继承了 MVC 的特点,简单,好实现,业已产品化。b) 适用于参数未知、大滞后、强随机干扰和未知时变的场合。c) 只能应用于逆稳定(最小相位)的过程;对 u(k)未加约束。d) 0 需要事先选定
15、,但是仿真结果表明,对 0 并不要求选定的很准确,有较大的选择范围。7. 应用举例例 1矿石破碎机的自校正控制(1976)(2004 年教案) 辨识与自适应 第八章14由于进料矿石块的大小和硬度的不同,造成强干扰,干扰是不可测的,能够测的是破碎机的功率。控制的目的是在不造成过载停机的条件下,使得破碎功率维持于接近最大允许功率,以提高产量。控制量 u(k)是进料器松进矿石的流量,输出量 y(k)是破碎功率。采用STR 是为了使 y 以较小的波动而接近最大允许功率。矿石由进料器到破碎机的传输时滞为 40 50 秒,再循环回路的传输时滞为 70 80 秒,进料器和破碎机能近似视为一阶环节,它们的时间
16、常数分别为 12 秒和 20 秒,因此系统的时滞相对于时间常数而言是相当长的。采样间隔取 10 20 秒,实验得出d=3,p=4 ,q=3。自校正调节器方程为:u(k) = 1y(k)+ 2y(k-1)+ 3y(k-2)+ 4y(k-3)- 1u(k-1)- 2u(k-2)- 3u(k-3) 0其中:u(k) = u(k)- u(k-1)选择 0 = 50(实验表明, 0 在 1 100 的宽广范围内取值,都能够得到良好结果。用带遗忘因子的 RLS 法在线辨识 1、 2、 3、 4 和(2004 年教案) 辨识与自适应 第八章151、 2、 3 (见下图) ,遗忘因子在启动时取 0.95,然后
17、增大到0.99。实践结果表明采用自校正调节器能够使得破碎功率维持在 200KW左右,而采用 PI 调节器时破碎功率为 170KW,即自校正调节器较常规的 PI 调节器能够提高大约 10%的产量。下图示出两次实验的效果。(2004 年教案) 辨识与自适应 第八章16例 2 造纸机的自适应控制(1975)双输入双输出系统,控制量为浓粗料阀 ub 和干燥箱蒸汽压力阀um,被控制量为纸的单位重量 yb 和湿度 ym 。可以把它视为两个并联着的单输入单输出系统,但是纸的湿度 ym 受到单位重量系统的干扰,这种关联的影响在自校正调节器的参数辨识中予以考虑。以湿度系统为例,该系统阶数 n=2,时滞 d=3,
18、有六个待估计参数,其中后面的两个考虑单位重量系统的关联作用。)(1)(0kkumTm(2004 年教案) 辨识与自适应 第八章17其中: m(k)= ym(k),ym(k-1),um(k-1),um(k-2),ub(k),ub(k-1)T例 3醋酸蒸发器液位控制自校正调节器(1979)用高压水蒸气阀位 u(k)控制醋酸蒸发器的液位 y(k),存在约两分钟的延迟。(2004 年教案) 辨识与自适应 第八章18过程模型y(k+4)= 1y(k)+ 2y(k-1)+0u(k)+1u(k-1) +2u(k-2) +3u(k-3)+ (k+ 4); n=2 , T=32 s 。经验选择 0= 0.5,控
19、制率:u(k) = y- 1y(k) - 2y(k-1) - 1u(k-1) - 2u(k-2) -3u(k-3) 0控制效果:原来用 PI 调节器时的液位波动范围是 20 mm,改用 STR 后为 5 mm。(2004 年教案) 辨识与自适应 第八章19例 4STR 在船舶自动驾驶仪中的应用以舵角 为控制量,以航向倾斜角 为输出量。输入输出模型的传递函数为:其简化模型为:模型参数随船的大小、载重量、吃水深度和航行条件的不同而有很大差异,原来采用的基于 PID 调节器自动驾驶仪在恶劣条件时不能很好的工作。而基于 STR 的自动驾驶仪(型号 KADPIL 1)在巨型油轮上已取得很好效果。为适应更
20、复杂条件的改进产品 KADPIL 2,在前者基础上还增加了 Kalman 滤波器,下图给出了 25.5 万吨油轮(长 329 米宽 52 米))1)()( 23sTsKsG)()(s(2004 年教案) 辨识与自适应 第八章20在两种控制器驾驶效果的对比。(2004 年教案) 辨识与自适应 第八章218 3 广义最小方差控制与自校正控制器1. 广义最小方差控制率(GMVC)仍考虑如下模型yr = 0 时控制目标为J= E y 2 (k+d) + u 2 (k) u(k)=u*(k) = min式(8 3 -1) 为抑制 u 2 (k)的加权系数。将式(8 -1- 6)代入上式(8-3-1) ,
21、得出控制目标为因为 F(k+d) 项为未来干扰项,与其他各项统计无关,并且令: 2 = E F(k+d) 2 = Const.由令( J / u(k)) = 0,导出 u*(k) = 0 22)()()( kuEkuCBFkyGEJ)()()( 11kzACkuzABkyd )()()()( dkFkuCBkyGdky )()()()( 22kdkkky (2004 年教案) 辨识与自适应 第八章22注: 中仅 BF/C 的首项中含 u(k),其系数为 b0则得出广义最小方差控制律为:式(8-3-2)若 = 0,则上式退化为 MVC2 GMVC 的性能a) 加权因子 抑制 u 2(k) 的作用
22、引入两个品质指标:随机调节因数 :(式中 n(k)为无控制下干扰作用的结果调节能耗 Su :0)(2)()(2)( 0 kubkuCBFkyGkuJ )()(0kyCbBFGku )(2kny)(uS(2004 年教案) 辨识与自适应 第八章23当 = 0.010.02 时,S u 下降了 48%60%,而 只增加了12%17%;当 0.03 时, 将明显变坏。b) GMVC 可适用于非最小相位过程,原因是如果 B 不稳定,(B + A/b0)仍能是稳定的。3 MVC - PI 和 GMVC - PI 调节器MVC 和 GMVC 对于给定值为有差调节,为消除稳态误差,可串联一个 PI 调节器:MVC - PI 传函为式(8-3-3)GMVC - PI 传函为式(8-3-4)如果 = 0,串联部分为比例调节器;如果 0,为 PI 调节器;如果 = 1,串联部分比例量与积分量相等。性能:a) 增加了一个在单位园上的极点,实现稳态无差;b) 调节器增加一阶,全部参数能在线辨识。c) 值对品质指标随机调节因数 和调节能耗 Su 的影响,见下图。1)()(zBFGs10)()( zCbBFGs(2004 年教案) 辨识与自适应 第八章24可在 GMVC 和 GMVC-PI 的基础上实现(隐式或显示)自校正控制器,并已获得诸多工业应用成果。