1、1第 4 部分 模型参考自适应控制系 统1 概述1.1 模型参考自适应控制(MRAC)图 1.1 模型参考自适应控制系统由四部分组成: 带有未知参数的被控对象假设被控对象的结构已知。对 于线性系统, 这意味着系统的极点数和零点数是已知的,但它们的位置是未知的。 参考模型(它描述控制系统的期望的输出) 应当能反映控制任务中的指定的性能; 规定的理想性态应当是自适应控制系统可以达到的,即当给定对象模型结构后, 对参考模型的结构有一些特有的限制(如阶数和相对阶)。 带有可校正参数的反馈控制律 可以得到一族控制器; 应当具有“完全的跟踪能力”,达到跟踪收敛,即当被控对象的参数精确已知时,相 应的控制律
2、应当使系统的输出与参考模型的输出相等; 现有的自适应控制设计通常要求控制器参数线性化。如果控制规律中可调整的参数是线性的, 则称控制器是参数线性化的。 校正参数的自适应机制 能保证当参数变化时系统稳定并使得跟踪误差收敛到零; 设计方法有李雅普诺夫定理,超 稳定性理论,耗散理 论 等。1.1.1 质量未知的模型参考自适应控制图 1.2 一个非线性质量一阻尼弹簧系统图 1.2 中的质量一阻尼弹簧系统,其 动力学方程为 301|mxbkx其中, 表示非线性耗散式阻尼,而 代表非 线性弹簧。|bx 301()k考查用电动机力 控制一个质量为 的质点在没有摩擦的表面上运动,其性态可以描述为u(1.1)u
3、xm2假设给控制系统发出定位指令 。用下面的参考模型 给 出受控物体对外部指令 的理想响应 )(tr )(tr(1.2)21xxmm其中,正常数 和 反映指定的性能,在理想情况下,物体应当像质量弹簧阻尼系统一样运动到指定的位置12。)(tr若质量 精确已知,可以用下面的控制律实现完全跟踪m)2(xxum其中, 表示跟踪 误差, 是一个严格大于零的数。由这个控制器可以得到按指数收敛的误差系)(txt统 02现在假设质量 不是精确已知的。可以用下面的控制律 m(1.3))(2xxum其中, 表示可以校正的参数。将这个控制律带入对象动态 中,得到闭环误差动态 (1.4)vs其中, 是组合跟踪误差,定
4、义为 s(1.5)x信号量 v 定义为 xvm2参数估计误差 定义为 m方程(1.4)表明组合跟踪误差 与参数误差通过一个稳定滤 波器相关联。s的参数更新规律(1.6)vs其中正常数 称为自适应增益。注:参数 的校正是基于系统的信号,自适 应控制系统具有 非线性本质,从而控制器( 1.3)也是非线性的。m3仿真分析:设物体的真实质量是 ,选择零作为 的初值, 这表明预先不知道真实质量。自适应增益2mm为 ,分别选择其他设计 参数为 , , 。5.0 10256图 1.3 跟踪性能和未知质量参数的估计, 0)(tr图 1.4 跟踪性能和未知质量参数的估计, ttr4sin)(图 1.3 表示位置
5、指令为 ,初始条件 为 , 的仿真结果。0)(tr 0)(mx 5.0mx图 1.4 表示期望位置是正弦函数 的仿真结果。tt4sin两种情形下位置跟踪误差均收敛到零,而只有后一种情形参数 误差趋于零。1.2 模型参考自适应控制方法(MRAC) 和自校正控制方法( STC)的关系STC MRAC更新参数是为了使得输入输出数据3.0 之间的拟合误差最小更新参数是为了使得被控对象和参考模型之间的跟踪误差最小具有更高的灵活性,可以将不同的估计器和控制器耦合起来(即估计和控制分离)控制律和自适应律的选择相对复杂一般很难保证自校正控制器的稳定性和收敛性。通常要求系统的信号足 够丰富,才能使得参数估计值收
6、敛 到真实值,才能保证系统的稳定性和收敛性。不管信号充足与否,系统的稳 定性和跟踪误差的收敛性通常是可以保证的从随机调节问题的研究中演化而来 从确定自动伺服系统的最优控制中发展起来的通常用于离散时间系统 一般用于连续时间系统42 李雅普诺夫理论基础2.1 非线性系统与平衡点1非线性系统一个非线性动力系统可以用以下的非线性微分方程描述(2.1)(,)txf其中,f 是一个 n1 的非线性向量函数,而 x是一个 n1 的状态向量。状 态数 n称为系统的阶。状态向量的一个特定值对应于状态空间的一个点。方程(2.1)的一个解 对应于状态空间的一条曲线,通常称为状态轨线或系统轨线。()tx(2.1)可以
7、表示一个无控制信号的动态系统(自由系统),也可以代表一个反馈控制系统的闭环动态。如果系统的动态方程为 (,)txfu而设计的控制律为 ,g闭环系统的动态方程可以被改写成(2.1)的形式。一类特殊的非线性系统是线性系统。线性系统的动态方程 为()txA其中,A (t)为一个 nn矩阵。2 自治系统与非自治系统定义 2.1 非线性系统(2.1)称为自治的,如果 f不显含 t,即如果系统方程可写作(2.2)()xf否则,该系统称为非自治的。控制系统的非自治性可能来自模型或控制器。设有一个时 不变的动力学模型为(,)xfu控制器是时变的,可能导致一个非自治的 闭环系统,即如果 u=g(x,t)。例如,
8、简单模型 ,控制器是非线性非自治的(例如 )。xu 2sin线性时不变装置的自适应控制器往往使闭环系统变为非线性和非自治的。自治系统和非自治系统的基本区别在于:自治系统的状态轨线不依赖于初始时刻,而非自治系统一般不是这样。3平衡点定义 2.2 状态 称为系统的一个平衡态(或平衡点),如果一旦 ,则此后状态永远停留在 。*x *()tx*x数学上,这表明定常向量 满 足*(2.3))0f平衡点可通过解(2.3)求得。一个线性时不变系统(2.4)xA当 A非奇异时只有一个惟一的平衡点(原点 0)。当 A奇异时,它有无数平衡点,即满足 Ax=0 的所有解。 这表明平衡点不是孤立的。例如: ,x 轴上
9、所0有的点都是它的平衡点。2.1 摆5图 2.1 摆摆的性态可用以下的非线性自治方程来描述(2.5)2sin0MRbg这里 R是摆长、M 是质量、b 是铰链的摩擦系数、 g是重力加速度(常数),记 。则相应的状态方程12,x为(2.6a)12(2.6b)21sinbgxxR于是,平衡点满足 210,sinx因此,平衡点为 及 ,从物理意 义上讲,它们分别对应摆的垂直向上及垂直向下的位置。(02,)(2,0)平衡点的变换设我们感兴趣的平衡点为 ,那么,引入新变量*x*yx并将 代入方程(2.2),即可得到关于 变量 y的方程*yx(2.7)*()yfx当 y=0 时,对应于 ,是(2.7)的一个
10、平衡点。*x因此,若要研究方程(2.2)在平衡点 附近的性态,只要研究方程(2.7)在原点邻域的性态即可。*x62.2 稳定的概念图 2.2 稳定的概念1稳定性与不稳定性定义 2.3 一个平衡点 x=0 称为稳定的(也称李雅普诺夫意义下的稳定),如果任给 R0,总存在 r0,使当r 时, R,t 0。如果 x=0 不是稳定的,则 称为不稳定平衡点。|(0)|x|()|定义 2.3 可写成 ,|(0)|0,|()|rrttx或等价地记作 r RxBB例 2.2 范德波尔振子的不稳定性范德波尔振子方程为 12x21()图 2.3 范德波尔振子的不稳定原点控制系统性能要求由渐近稳定这个概念来描述。2
11、渐近稳定性定义 2.4 平衡点 0 称为渐近稳定的,如果它是 稳定的,而且存在 r0 使当 r 时, 。|(0)|x(),tt0x图 2.2 显示当系统轨线从球 Br内出发的轨线均收敛到原点。球 Br称 为平衡点的一个 吸引域,是指最大的一个区域,使从此区域出发的一切轨线均收敛于原点。一个李雅普诺夫稳定而又不是渐近稳定的平衡点称为临界平衡点。上述定义表征了系统的局部性态。73. 局部稳定性与全局稳定性定义 2.5 如果对任何初值渐近稳定成立, 则这样的平衡点 称为大范围渐近稳定,也称全局 渐近稳定。线性时不变系统的稳定性分三种:渐近稳定、 临界稳定和不 稳定。82.3 李雅普诺夫直接方法李雅普
12、诺夫直接方法的基本原理是一个基本物理现象的数学表达。可以由一个标量函数的变化来判断一个系统的稳定性。图 2.4 一个非线性质量一阻尼弹簧系统图 2.4 中的质量一阻尼弹簧系统,其 动力学方程为(2.8)301|mxbkx这里 表示非线性耗散式阻尼,而 代表非线 性弹簧。|bx 301()kx系统的全部机械能是它的动能与势能之和(2.9)232240101()()dxVkxkx 机械能和前面定义的稳定性概念之间的联系 能量为 0 对应于平衡点 。(,)0x 渐近稳定意味着机械能收敛到零。 不稳定对应于机械能的增长。机械能作为一个标量以隐含形式反映着状态向量的幅值,而且系统的稳定性可以通过系统能量
13、的变化来描述。系统运动中能量的变化率为(2.10)3 301()()(|)|Vxmkxxbx由于阻尼的存在,系统的能量不断减少,一直到质点停止运 动,即。 。2.3.1 正定函数与李雅普诺夫函数上述能量函数有两个性质:第一个性质:它除了 x及 均为零的点外严格正;第二个性质:当 x及 依动力学方程(2.8)变化时,该函数 单调下降。定义 2.6 一个标量连续函数 V(x)称为局部正定的,如果 V(0)=0,且在一个球 内0RB0()x如果 V(0)=0 且上述性 质在整个状 态空间成立,则称 V(x)为 全局正定函数。例如函数 211()(cos)MRgx它是例 2.1 中摆的机械能,它是局部
14、正定的。又如非线性质量阻尼弹簧系统的机械能(2.9),它是全局正定的。注:这个系统动能 不是正定的。2(1/)mx9图 2.5 正定函数 的典型形式),(21xV类似地定义几个相关概念:函数 V(x)称为局部 或全局负定的 ,如果 V(x)是局部或全局正定的;V(x)是正半定的 ,如果 V(0)=0 且对一切 x0,V(x)0;V(x)是负半定的 ,如果V(x)是正半定的。设 x 为自治系统(2.2)的状态,假定 V(x)是可微的,它对时间的导数可以用链式法则得到d()t=fx通常将这个导数称为“V 沿着系统轨线的导数” 。定义 2.7 如果在一个球 内,函数 V(x)是正定的,且有连续偏导数
15、,而且它沿系统(2.2)的任一状态轨线的导数0RB为负半定的,即 ()0那么 V(x)称为系 统(2.2)的李雅普 诺夫函数。图 2.6 定义 2.7 在 n=2 时的描述2.3.2 平衡点定理包括局部与全局两类。局部定理描述平衡点 邻域的稳定性 质。1局部稳定性的李雅普诺夫定理定理 2.1(局部稳定性) 如果在一个球 内,存在一个 标 量函数 V(x),它具有一阶连续偏导数,并且0RB V(x)正定(在球 内)0R 负半定(在球 内)那么平衡点 0 是稳定的,如果 导数 V(x)在球 内是负定的,那么 0 是渐近稳定的。0R10例 2.3 局部稳定性带有粘性阻尼的单摆方程为 sin0考查以下
16、标量函数(2.11)2()1cos)Vx这个函数是局部正定的。时间导 数为02()sinVx利用上述定理可知,原点是稳 定平衡点。物理学观点, 是摆消耗能量的功率。V选择这个李雅普诺夫函数,还 不能得到系统渐近稳定的结论 ,因 为 只是负半定的。()Vx选择适当的李雅普诺夫函数,可以得到更精确的 结果考查以下标量函数(2.12)21()()2(1cos)x它也是系统的一个李雅普诺夫函数,因 为局部地有 2()sin)0Vx更为有趣的是 实际上是局部负定的, 证明了摆的渐近稳 定性。V一个重要事实:李雅普诺夫分析中的所有定理都是充分性定理。例 2.4 局部渐近稳定性考查下述非线性系统关于原点的稳
17、定性 2211()4xxx224给定正定函数 1212(,)V它沿着系统轨线的导数 为V )xx因此, 在二维球 B2内(或 换言之,一个矩阵 M是正定的,如果二次函数 是正定函数 .每个正定矩阵对应一个正定函数。反之, 显T然不成立。判定定理:设 M 为对称矩阵,M 正定的充要条件是其主子式(即 M11,M11M12M 21M22,detM)均为正数;或等价地,其特征值均为正数。正半定、负定、负半定等概念可类似定义。一个 nn方阵 M被称为正半定的(p.s.d.),如果 ,0Tx2线性时不变系统的李雅普诺 夫函数给定一个线性系统 ,考 虑一个候选二次李雅普诺夫函数AxTVxP其中,P 是一个
18、给定的对称正定矩阵,函数沿系 统轨线的导数为另一个二次形式(2.13)TTQxPx这里(2.14)A因此,问题变成能否找到一个 对称正定矩阵 Q使它满足李雅普诺夫方程(2.14)。例 2.6 考虑二阶线性系统,其 A矩阵为 04812选 P=I,则得 4TQP=+矩阵 Q不是正定的。给定一个正定矩阵 Q,反过来找正定矩阵 P,即 选择一个正定矩阵 Q。 由李雅普诺夫方程(2.14)解出 P。 检验 P是否正定。定理 2.3 一个 线性时不变系统 渐近稳定的充要条件是,任给对称正定矩阵 Q李雅普诺夫方程(2.14)有xA惟一矩阵解 P,而且 P是对称正定的。说明:任何正定矩阵 Q都可以用来判定
19、线性系统的稳定性。例 2.7 考虑例 2.6 中的二阶系统,取 Q=I且设 12pP这里,由于 P的对称性,有 ,于是李雅普诺夫方程为21p1204810812p 其解为 1125/6,/6pp相应的矩阵为13516P它是正定的,因此原线性系统 是全局渐近稳定的。143 高级稳定性理论3.1 非自治系统的稳定性概念1 平衡点对一个形如(3.1),(txf的非自治系统, 称为它的一个平衡点,如果下式成立:x(3.2)0,收0t注意:对 此方程都成立, 这意味着系统(3.1)在所有的 时间内都能够停留在点 。0t x例如:线性时变系统(3.3)Ax)(t当 不恒为奇异矩阵时,该系统有惟一的平衡点原
20、点 0。)(tA2 稳定性概念的扩展把自治系统的稳定性概念扩展到非自治系统,关 键在于定 义中要适当地包含初始时间 。0t定义 3.1 平衡点 0 在 是稳定的,如果 对于任意的 ,存在一个正数 ,使得 t R),(Rr(3.4)trt)(0xxt否则,平衡点 0 是不稳定的。这个定义表明:状态轨线可以停留在一个半径 任意小的球内,只要它是从一个半径 充分小的球内出发。r定义 3.1 不同于定义 2.3,因为 定义 3.1 中的初始球的半径依 赖于初始时间 。0t定义 3.2 平衡点 0 在 是渐近稳定的,如果t 它是稳定的; ,使得 。)(0tr0()(),rtttxx0定义 3.3 平衡点
21、 0 是全局渐近稳定的,如果 对 有 (),tt3 稳定性概念中的一致性 定义 3.4 平衡点 0 是局部一致稳定的,如果定 义 3.1 中的 标量 可以选择为与 无关,即 。r0t)(Rr引入一致稳定概念的直观原因是为了排除对大的 ,越来越不稳定的系统。0t类似地,一致渐近稳定是为了限制初始 时间 对状态收敛 方式的影响。定义 3.5 平衡点 0 是局部一致渐近稳定的,如果 它是一致稳定的; 存在一个半径与 无关的吸引球 ,使得初始状 态 在 内的轨线关于 一致收敛于 0。t0RB0RB0t对 一致收敛是指对 ,使得对 有0t122112,:,(,)T0)(ttxx012(,)tT即从球 内
22、出发的状态轨线经过与时间 无关的时间段 之后,一致收敛到一个更小的球 内。1RB0 2RB一致渐近稳定总是蕴含渐近稳定,反之 则不然。例 3.1 考虑一阶系统15tx1它有通解 )()(0tt这个解渐近收敛到零,但不是一致收 敛。直观上:对于更大的 ,此解要 经过更长的时间才能接近于原点。0t通过用全空间替换吸引球 ,就可以得到 全局一致渐近 稳定的概念。0RB163.2 非自治系统的李雅普诺夫直接方法1 时变正定函数和具有无穷大上界的函数定义 3.6 标量时变函数 是局部正定的,如果 , 且存在一个时不变正定函数 ,使得 ()V,tx()0V,t0()Vx(3.5)0()(,tVx因此一个时
23、变函数是局部正定的,如果它 控制住一个时不 变局部正定函数。全局正定函数可以类似的定义。用同样的方法可以定义其他局部的或者全局的相关概念。 函数 是负定的,如果 是正定的;()V,tx()V,tx 是半正定的,如果它控制住一个时不变半正定函数; 是半负定的,如果 是半正定的。,t ,t定义 3.7 标量函数 具有无穷大上界,如果 ,且存在一个 时不变正定函数 ,使得(),tx()0,t1()Vx1()tVx换句话说,标量函数 具有无 穷大上界,如果 受一个时 不变正定函数的控制。V,t例 3.2 一个简单的时变正定函数 (),tx)(sin212xt因为它控制住函数 。0()x21这个函数也具
24、有无穷大上界,因 为它被函数 控制住。1()V2给定一个时变标量函数 ,它沿着系 统轨线的导数为()V,t(3.6),(tVttdxfx2 非自治系统稳定的李雅普诺夫定理定理 3.1 (非自治系统稳定的李雅普诺夫定理)如果在平衡点 0 的邻域球 内,存在一个具有 连续 偏导数的标量函数 ,使得0RB()V,tx1 是正定的,V2 是半负定的,那么平衡点 0 是李雅普诺夫意义下稳定的。而且,如果3 具有无穷大上界,那么原点是一致稳定的;如果条件 2)加强为 是负定的,那么平衡点是一致渐近稳定的。V如果球 用全空间代替,且 满足条件 1),加 强的条件 2),条件 3)和条件0RB4 是径向无界的
25、,()V,tx那么平衡点 0 是全局一致渐近稳定的。与自治系统类似,如果在平衡点的某个邻域内, 是正定的,沿着系统轨线的导数 是半负定的,那么 称VVV为这个非自治系统的李雅普诺夫函数。例 3.3 全局一致渐近稳定考查系统 )()(211txettx2为了确定平衡点 0 的稳定性, 选择下列标量函数17)1(),(22xextVt这个函数是正定的,因为它能控制住一个 时不变正定函数 。这个函数也具有无穷大上界,因 为它能被时不变正定函数 所控制住。而且,21)(2),(21text x这表明 21211)xV因此, 是负定的。所以平衡点 0 是全局一致渐近稳定的。V例 3.4 具有无穷大上界条
26、件的重要性 图 3.1 函数 2()gt令 是一个连续可微的函数,除了在峰点 处为 1 外,其他为 。 的图形如图 3.1,在 取整数处为)(tg e)(2tt的峰点。假设在横坐标 处的峰点宽度小于 。所以 的无穷积分满足2 ntn)(2001()rngrd因此标量函数(3.7)(3)(,(022tdrgtxtV是正定的( )。2),(xtV现在考虑一阶微分方程 (3.8)xtg)(如果选择(3.7)为候选李雅普诺夫函数, 发现 2xV即 是负定的。然而, (3.8)的通解为V )()(0tgtx因此,原点不是渐近稳定的。183.3 用 Barbalat 引理作类李雅普 诺夫分析问题:非自治系
27、统的渐近稳定分析探求: 的条件(,)0VtxBarbalat 引理是一个关于函数及其 导数的渐近性质的纯粹的数学结果。3.3.1 函数及其导数的渐近性质给定一个关于 的可微函数 ,有下面 3 个重要事实:tf 收ff0并不能推出当 时 存在极限。如 。)(t t)(tf )sin(log)ttf ff收当 时, 存在有限极限并不意味着 。如 。t)(t 0)(tf )si()(2ttef 如果 有下界且是递减的( ),那么 存在极限 。f 0f未表明曲线的斜率是否趋于零。3.3.2 Barbalat 引理引理 3.1(Barbalat) 如果可微函数 f(t),当 时存在有限极限,且 一致连续
28、,那么当 时 。ft()0ft函数 g(t)在0 ,)是连续的,如果0, 0, 0, 0,1tR1(,)tt R|g函数 g在0,)是一致连续的,如果0, 0, 0, 0,()1tt R1|t|()|g是一致连续的,如果总是可以找到一个与特殊点 t1无关的 。可微函数一致连续的一个简单的充分条件是它的导数是有界的。Barbalat 引理的一个推论:如果可微函数 f(t),当 时存在有限极限, 存在且有界,那么当 时,ft。()0ft19引理 3.2(类李雅普诺夫引理) 如果标量函数满足下面的条件 V(x,t)有下界; (x,t)是半 负定的; (x,t)对时间 是一致连续 的。那么 (x,t)
29、 。0下面考虑一个简单的自适应控制系统的渐近稳定分析。3.5 带有一个未知参数的一阶自适应控制系统的闭环误差动力系统为 ()ewt其中 e和 是闭环动力系统的两个状态,分别表示跟踪误差和参数误差,w (t)是有界的连续函数。考查有下界函数 2Ve其导数为022()()ewte因此,e 和 是有界的。为了利用 Barbalat 引理,我们验证 的一致连续性。 的导数为VV4()e这表明 是有界的。因此 是一致连续的。由 Barbalat 引理得 。V 0,et注意:虽然 e收敛于零,但是系统不是渐近稳定的,因 为这 里只能保证 是有界的。建立在 Barbalat 引理上的分析称 为类李雅普诺夫分
30、析。它与李雅普诺夫分析有两个微妙的但很重要的不同之处:1) 函数 V可以仅仅是一个关于 x和 t有下界的函数,而不要求是正定函数;2) 第二, 的导数一定是一致 连续的,且 为负或零。这里典型的做法是证明 是有界的。 V203.4 正线性系统3.4.1 正实和严格正实传递函数考查以下形式的 n 阶单输入单输出线性系统的有理函数 10()mnbpbhaa,假设分子和分母的多 项式的系数是实数,且 。分母的阶与分子的阶的差 称为系统jnmnm的相对阶。定义 3.8 如果(3.9)Re()0e0hpp则传递函数 是正实的;()hp如果对某个 ,0Re()0hp则传递函数 是严格正实的。()例 3.6
31、 严格正实函数考查有理函数 1()hp其中 ,相应于复变量 有0pj2()()jj如果 ,那么 , 是正实的;Re()0h选择 , 是严格正 实的。2p定理 3.2 传递函数 是严格正实的,当且 仅当()1) 是严格稳定的传递函数;()h2) 的实部沿着 是严格正的,即j(3.10)0Re()0hj传递函数 是严格正实的必要条件,即()p 是严格稳定的;h 的 Nyquist 图完全在右半复平面内,在正弦曲线输入下,系统响应的相位移总是少于 90;j 的相对阶为 0 或 1;() 具有严格最小相位(即它的所有零点都在左半开复平面内)例 3.7 严格正实和非严格正实传递函数考查下列系统 121(
32、)phab232()hpab412124211()jjjhj22Re正实与严格正实传递函数的根本不同:正实传递函数允许在 轴有极点, 严格正实传递函数在 轴没有极点。jj例 3.8 考查积分器的传递函数 1()hp当 时,pj 2()j例 3.9 考虑传递函数 5210()45ph判断 h5是否是严格正实的。注意,h 5可解释为是质量弹 簧阻尼器系统 4510xuy当输入为作用力,输出为速度 时的传递函数。 h5是严格正实 系统。3.4.2 Kalman-Yakubovich 引理引理 3.3(Kalman-Yakubovich)(正实引理)考查可控的线性时不变系统 uxAbTyc传递函数(3
33、.11)1()ThpcIAb是严格正实的,当且仅当存在正定矩 阵 P和 Q,使得(3.12a)P+=-Q(3.12b)224 模型参考自适应控制设计方法4.1 如何设计自适应控制器传统(非自适应)控制设计:首先确定的是控制器结构(即极点的位置),然后,根据已知的系统参数计算出控制器参数。自适应控制主要的不同:被控对象的参数未知,控制器参数必 须由自适应律提供。自适应控制设计附加的任务:选择自适应律并证明适应性系统的稳定性。自适应控制设计包括以下 3 个步骤:1) 选择含有变化参数的控制律;2) 选择校正这些参数的自适应律;3) 分析所得到的系统的收敛特性。MRAC 设计:首先猜 测李雅普诺夫函
34、数 ,并且 选择控制律和自适应律使得 下降。VV引理 4.1 考虑两个信号 和 ,它 们之间有如下动态关系:e(4.1)()()TetHpktv其中, 为标量输出信号, 是严正实的传递函数, 是符号已知的未知常数, 是关于时间 的 )(te)(pH()tt维向量函数, 是可以 测量的 维向量,如果向量 服从如下规律:1m()tv1m(4.2)()sgn()te其中 是正常数,那么 和 全局有界。而且,如果 有界,那么e()tv当 时,t0e图 4.1 含有 SPR 传递函数的系统证明:设(4.1)状态空间描述为(4.3a)TkxAbv(4.3b)ec因为 是严正实的,由 KY 引理知:对给定正
35、定矩阵 ,存在正定矩 阵 使得)(pHQPTPQbc取正定函数 如下V(4.4),TTkVxP其沿着(4.3)和(4.2)定义的系统轨线的导数为 ()2()2()0TTTTVkexPAbvQ因此, (4.1)和(4.2)定义的系统 是全局稳定的, 和 是全局有界的。e23如果信号 有界,那么由( 4.3a)知 也有界,故()tvx2VxQ有界,意味着 一致连续。由 Barbalat 引理, 渐进地收敛到零。V )(teMRAC 设计中 : 被控对象的输出和参考模型的输出之间的跟踪误差与参数估计误差存在形式如(4.1)的关系; (4.2)给出了一种校正控制器参数且同时保证系统稳定的方法。4.2
36、一阶系统的自适应控制讨论一阶系统的自适应控制。 过程可以近似地表示为一 阶微分方程(4.5)ubyap其中, 是系统输出, 是输入, 和 是系统参数。yupab1 问题描述在自适应控制中,假定系统参数 和 是未知的。所期望的自适应系统的性态设为一阶参考模型 p(4.6)(trbyamm其中, 和 是常数, 是有界的外部参考信号。参数 要求是严格正的, 也选为严格正数。mab)(tr参考模型可以用它的传递函数 表示为Mry其中 mapb且 是拉普拉斯变量。注意到 是严正实函数。p自适应控制的目的:寻找控制规律和自适应规律, 使得模型的跟踪 误差 渐近地收敛到零。myt)(需要假设参数 的符号已知
37、。pb2 控制律的选择图 4.2 一阶模型参考自适应控制系统选择如下控制律(4.7)ytartu)(其中 和 是时变反馈增益。闭环系统为ray(4.8)(trbyppy目标是使得系统可能实现精确模型匹配。如果被控 对象参数已知,那么选择下面的控制参数(4.9)pmrbapmya则相应的闭环系统为 y24它和参考模型动态相同,从而 有零跟踪误差。3 自适应律的选择记跟踪误差为 mye参数误差定义为自适应律提供的控制器参数与理想参数的差,即(4.10)()rryyat将(4.6)(参考模型)减去(4.8)(闭环系统)得到跟踪误差的动态(4.11)()()()mmpyprmpryebababa 它可
38、以表示为参数误差和跟踪误差之间的关系式(4.12)(1)( yrMeryrm其中 表示拉普拉斯变量。p由引理 4.1,得到下面的自适应 律(4.13a)ebapr)sgn(4.13b)yy其中 是表示自适应增益的正常数。 决定了搜索适当控制器参数的方向。 )sgn(pb4 跟踪收敛性分析用李雅普诺夫理论(或引理 4.1)来分析系统的稳定性和收敛性质。候选李雅普诺夫函数如下(4.14)221(,)()pryVeba沿系统轨线的导数为 2ma于是,自适应系统是全局稳定的,即信号 和 都有界。rae,y由 Barbalat 引理保证跟踪误差 全局渐近收敛。因 为 和 的有界性蕴含 的有界性,从而 是
39、)(t re,yeV一致连续的。25例 4.1 一阶系统设计自适应控制器控制不稳定系统 uy3假定对象参数 对于自适应控制器是未知的。3,1pba参考模型选择为 rxm4取自适应增益为 。两个控制器参数的初值均取为 0,这表明没有先验知识。系 统和参考模型的初始条件都2取为零。仿真中使用了两种不同的参考信号。从图 4.3 知跟踪 误差收敛到零,但参数误差不收敛。4)(tr。从图 4.4 知跟踪误差和参数误差都收 敛到零。t3sin图 4.3 跟踪性能和参数估计, 4)(tr图 4.4 跟踪性能和参数估计, ttr3sin4)(5 参数收敛性分析推测:参考信号的性质与参数收敛性之间有某种关系,即
40、只有当参考信号 满足一定条件时,估 计参数才)(tr会收敛到理想控制器参数。自适应机制的目标是寻找能使跟误差 趋于零的参数。如果参考信号 足够复杂,使得只有真 实的参数my)(t向量 能使跟踪误差收敛,那么参数才会收 敛 到真实值。Tyra,下面我们找出参数收敛的具体条件。稳定过滤器(4.12)的输出趋于零,于是必有 收敛 到零。当 时间 相当大时, 几乎是常数,且yarta0)(tt即(4.15)Tva其中Tryvrya参数收敛的问题简化为向量 应满足什么条件使得这个方程有惟一零解。Ttyr)(如果 是常数 ,那么 对于大的时间 ,有)(tr0t260()mytr其中 是参考模型的直流增益。
41、所以 1r方程(4.15)变为 yra这蕴涵着估计参数收敛到参数空间中的一条直线。“持续激励”(persistent excitation )条件:持续激励是指存在严格正常数 和 使得对任何 ,有1T0t(4.16)1tTdrvI直观上讲, 持续激励蕴 涵对应于不同时间 的 不能总是线性相关。()tvt()tv剩下的问题: 与持 续激励 之间的关系。r()tv对于一阶系统,如果 至少包含一个正弦部分,就可以保证 是持续激励。)(t ()tv6 推广到非线性系统由下面微分方程描述的一阶非线性对象(4.17)ubyfcaypp)(其中 为任意的已知非线性函数。f采用下面的控制规律(4.18)raf
42、uy)(其中第二项用来自适应地抵消非线性项。将控制律代入(4.17),然后减去( 4.6)(参考模型),得到 误差 动态为1()yfrreMaa其中,参数误差 定义为fapffbc选择自适应律(4.19a)eyay)sgn(4.19b)fpf(4.19c)rbr类似的,可以证明跟踪误差 趋于零,且参数 误差有界。e估计参数的收敛性质。对于常数参考输入 ,估 计参数收敛到三维空间中的一条直 线0r000()()ryfaar为了使参数收敛到理想值,信号向量 应当是持续激励的,即,存在正常数 和Ttv 1使得对任意 ,有Tt1tTdrI对于线性系统, 个参数的收 敛估计需要在参考输入 中至少有 个正
43、弦函数。m)(t2m然而,对于非线性系统, 和 之间的定性关系依 赖于特殊的非线性函数 。)(trtv )(yf2728例 4.2 一阶非线性对象的仿真假设非线性对象由下面的方程描述 (4.20)buy2使用和例 4.1 中相同的参考模型,初始参数和设计参数。对参考信号 ,仿真结 果见图 4.5。表明跟踪 误差收 敛到零,参数误差只是有界。4)(tr对于参考信号 ,仿真 结果见图 4.6,此 时跟踪 误差和 3 个参数误差都收敛到零。t3sin图 4.5 一阶非线性系统自适应控制, 4)(tr图 4.6 一阶非线性系统自适应控制, ttr3sin4)(注释: 中单个正弦信号使得三个参数得到估计
44、;)(tr 系统中的信号振动剧烈。29原因:非线性特性通常产生更多的频率,所以 可能比 中包含更多的正弦信号。()tv)(tr,信号向量 收敛到 ttr3sin4)(vssryf其中, 为稳态响应, 为相应的函数值。y)(tfs )3in(4)(tttymsA)26cos(18i16222 ttfs其中, 和 是参考模型在 时的幅度和相差。A3信号向量 包含两个正弦信号, 中包含一个两倍频率的正弦信号。直 观上讲,两倍频率部分是 3()tv)(yf个参数的估计收敛和估计参数振动更剧烈的原因。304.3 线性系统全状态反馈自适应控制1 问题描述考查 阶线性系统的自适 应控制n(4.21)uyay
45、ann0)1()(其中,状态分量 都是可量测的。假 设系数向量 是未知的,但是 符号)1(,ny T na已知。如质量弹簧阻尼系统: ukycm其位置和速度可测量。控制的目标是使得 跟踪下面稳定参考模型的响应y(4.22)()(1)0()nnmmyyrt其中, 是有界参考信号。)(tr2 控制律的选择定义信号 为)(tz(4.23)eeytznnm0)1()( 其中, 是使得 成为稳 定多项式的正常数。n,1 01nnp在(4.21) (被控对象)的两边加上 并整理,将被控对象动态改写为)(tzayaazuynnn 0)1(参数已知时,选择控制律为 (1)0nnzyy这表示极点配置控制器,它使得 极点位置由系数 确定,所以跟踪误差 mye满足闭环动态i()(1)0ne参数未知时,控制律为(4.24)(1)0()nTnuazyayt v其中,信号向量 ,且估 计参数向量 。(1)()nTtzyv 110nt跟踪误差 me满足闭环动态(4.25)()(1)0()nnTaeet va其中 3 自适应律的选择将闭环误差动态(4.25)改写为状态空间形式(4.26a)(1)TnaxAbv(4.26b)ec其中