1、1,第二部分:随机控制与鲁棒控制,具有随机干扰的系统估计与控制(随机控制) 被控对象模型具有不确定性的系统鲁棒控制,2,系统的数学描述,连续系统,若系统的干扰不能用确定性解析函数,而只能用随机过程描述时,该系统即为随机系统,输入随机信号是平稳过程,则输出信号也是平稳过程,且有如下谱传递函数:,互谱密度,自谱密度,自谱密度,3,函数的谱密度,其中,4,随机过程的谱密度,如果平稳随机过程的统计均值与时间均值相等,则该随机过程的均值具有遍历性; 如果平稳随机过程的自相关函数与相应时间均值相等,则称该随机过程的自相关函数具有遍历性; 如果平稳随机过程的均值和自相关函数都具有遍历性,则称该随机过程为遍历
2、性过程.,时间均值,自相关函数,5,随机过程的谱密度,因为,故,如果是平稳随机过程,均方值函数与时间无关, 有,故,6,相关函数与谱密度关系,随机过程的自相关函数的时间均值与谱密度是一对傅立叶变换对,若随机过程是平稳的,则它的自相关函数和谱密度是一对傅立叶变换对,7,相关函数与谱密度关系,自相关函数与谱密度是一离散型傅立叶变换对,8,随机过程的互谱密度,互谱密度函数是在频域上描述两个随机过程之间的相关性,常利用测定系统输入输出的互谱密度确定系统的特性,则互谱密度为,9,随机过程的互谱密度,互相关函数的时间均值与互谱密度是一对傅立叶变换对,10,白噪声,一般定义:,11,离散时间白噪声,当c为常
3、数时,则为平稳白噪声; 当c为c(k)时,则为非平稳白噪声; 当c(k)是高斯分布的,则为高斯白噪声.,12,连续时间白噪声,连续时间白噪声实际上是不存在的,仅是理想情况,因为其方差为无穷大.,13,带限白噪声和有色噪声,其自相关函数为,14,离散系统,15,谱分解定理-离散系统,16,表示性定理,则有一个渐进稳定的线性动态系统,当其输入是方差为,对于SISO连续时间随机过程,也有类似的谱分解定理与表示性定理,17,随机系统的数学模型,I/O模型 广义回归模型,系统差分方程,即,18,广义回归模型,加性随机有色噪声,当系统受到各种随机噪声干扰时,这些干扰的影响可用一个等价的作用在输出端的加性随
4、机噪声 来代替,正态白噪声序列,故,输出量观测值,19,广义回归模型,进一步,展开有,即,有色噪声,带外加输入的自回归滑动平均模型ARMAX,20,自回归滑动平均模型,当外加输入难以观测或系统缺少输入输出关系的了解时,则只能建立系统输出与干扰噪声的关系模型,即自回归滑动平均模型(ARMA),21,状态空间模型,确定性的离散时间系统的状态空间模型,当系统受到多种随机干扰时,这些噪声的影响可以用作用于状态变量的加性过程噪声和作用于输出观测量的加性观测噪声来代替,即,正态白噪声,其协方差矩阵与协方差分别为,在系统阶次确定后,系统辩识所需估计的参数有A,b,c(向量),和W,V,22,系统辩识概念及基
5、本方法,系统建模的目的,系统仿真 系统预测 系统分析与设计 系统控制 决策,方法,机理分析方法(白箱) 测试法(黑箱) 由系统的输入输出信号数据来推断系统的数学模型 两者的结合(灰箱),最优控制和自适应控制,23,系统辩识,定义,根据实际系统的输入输出数据,在一类模型中找出一个与实际系统逼近的模型,该模型能真实表示系统的本质特征并使某个准则函数极小(或极大).,24,辩识过程,25,模型参数估计_关键问题之一,在确定模型类型和结构参数之后,根据输入输出数据,为使某个准则函数极值而采用某种计算方法来估计模型参数.,典型的准则函数是系统与模型之间的误差平方和,即,其中,系统输出,模型输出,分别是系
6、统的真实参数和模型参数的函数,26,模型参数估计_关键问题之一,求解方法,直接估计法,迭代估计法,用梯度法等数值方法,通过多次迭代而算出使,的最小估计,数据处理方式,27,最小二乘法原理,设被辩识系统为单变量线性定常离散系统,模型为广义回归模型,其中,28,最小二乘法原理,进一步,写成向量形式,29,最小二乘法原理,式中,30,最小二乘法原理,31,最小二乘法原理,则拟合出的系统模型可表示为,其中,随机噪声带来的误差,参数误差带来的拟合误差,残差(方程误差),32,最小二乘法原理,动态系统参数的最小二乘估计,就是在下列残差二乘方准则函数极小的最优估计,即,33,最小二乘法原理,由于,2n*2n
7、维矩阵,2n*1维向量,(n+m)*(n+m)维,(n+m)*1维,当A(q-1)和B(q-1)的阶次分别为n和m时,34,最小二乘法原理几点说明,对输入信号的要求,任何辩识方法,都要求输入信号必须持续地激励被辩识过程的所有模态.,对于n阶系统,满足上述基本要求的输入信号称为n阶持续信号,35,最小二乘法原理几点说明,对不同时段的观测数据的要求不同时,若考虑到各次观测数据对参数估计的价值不同时,则在目标函数中引入权因子,即,式中,当现时刻的数据比过去时刻的数据更重要,则可取,36,最小二乘法原理几点说明,最小二乘估计的统计性质,无偏性,无偏估计是指估计值的均值等于被估计量的均值,对于广义回归模
8、型,其均值为,则,37,最小二乘法原理几点说明,有效性,在所有线性无偏估计中,估计误差的方差最小的那种估计,对于加权最小二乘估计,估计方差的方差阵为,加权阵W=R-1,马尔科夫估计,38,有效性,故最小二乘估计未必是有效估计方差,即为有效估计,39,最小二乘法原理几点说明,一致性,故,即,此时的最小二乘估计是一致估计,40,自适应控制概念与基本方法,特点:,控制系统在运行过程中,自身不断地认识被控对象的状态,参数和性能 将当前的系统性能与期望(或最优)的性能进行比较,做出使系统趋向期望(或最优)的决策 对控制器进行适当的修正,以驱使系统趋向期望(或最优)的状态,以上三方面的功能就是自适应控制系
9、统必须具备的功能,41,自适应控制概念与基本方法,基本形式:,模型参考自适应控制(模型匹配自适应控制) 自校正控制,42,自适应控制概念与基本方法,模型参考自适应控制:,43,自适应控制概念与基本方法,自校正控制:,44,模型匹配自适应控制,参数最优化设计方法,思路:,设控制器中有若干可调整的参数.当被控对象发生变化时,系统通过检测到的理想模型与实际系统输出之间的误差e,由自适应机构对控制器中的可调参数进行调整,使e极小.,现以增益可调的系统为例,理解参数最优化的基本思想,45,增益可调系统的参数最优化设计,发生变化而变化,且不能直接检测到它的变化.,性能变差,设置一个前馈比例放大器,可调参数
10、为可调增益Kc.,任务是设计自适应控制律,用以调整参数Kc,46,增益可调系统的参数最优化设计,性能指标为,自适应设计的任务就是调整参数Kc,使J极小,47,增益可调系统的参数最优化设计,因为,Kc应沿负梯度方向变化,其变化量为,为正的常数,其大小决定变化步距,上式对时间求导后,可得,调整Kc的自适应律,48,增益可调系统的参数最优化设计,故,转换成微分方程的时域算子形式,有,两边求导,有,比较两式,显然,故,由乘法器和积分器组成,49,增益可调系统的参数最优化设计,注意:按参数最优化法设计自适应律的计算比较简单,应用也比较广,但此法综合出来的自适应控制系统可能不是全局稳定的,50,李雅普诺夫
11、函数法,思路:,该方法可以保证自适应控制系统的全局稳定性,以一个状态空间模型为例,说明李雅普诺夫函数法的基本思想,设理想模型和被控系统的状态空间模型分别为,51,李雅普诺夫函数法,Q为前馈控制器可调增益,F为状态反馈控制器可调系数,Q,F均由自适应机构进行调整,52,李雅普诺夫函数法,条件,假设系统参数变化比较缓慢,在自适应机构调整过程中可认为,不变,则,53,李雅普诺夫函数法,选取李雅普诺夫函数为,均为正数,故,由于,54,李雅普诺夫函数法,故,55,鲁棒控制的基本概念,一个控制系统必须具有在实际环境中正常运行的特性,称为鲁棒性.从数学角度上看,意味着控制器不仅能对一个对象能满意工作,而且对
12、一族(或一系列)对象也能满意地工作.,如果我们设计一个控制器对系统某参数范围内所有的值都能使系统稳定,则称系统具有录棒稳定性.此外,如果系统同时又能在该参数范围内,满足特性指标(稳态误差,抑制干扰,速度响应要求等),则称系统具有录棒特性.如果设计的控制器使系统具有满意的鲁棒稳定性和鲁棒特性要求,则称之为鲁棒控制.,56,灵敏度与干扰抑制,控制理论的基本概念可以从反馈控制系统中引出.,反馈控制系统两个重要的性质(开环系统没有):,灵敏度和干扰抑制,利用灵敏度,反馈可以减少位于系统前向通道中元件的变化或不确定性,干扰抑制则是反映可以消除或减少在反馈环路中所出现的不希望的干扰,过去我们主要强调反馈系
13、统可以改善系统的特性,却忽略了上述两大优势.实际上,反馈系统具有更好的模型误差的容错能力,57,反馈系统的特性-单变量情况,其中:,为参考输入,为干扰输入,为传感器或测量器的测量误差,一个合适的所设计的控制系统必须在很小的误差下,且抑制干扰和噪声输入情况下,跟踪指定输入.,故,58,反馈系统的特性-单变量情况,其中定义:,开环传递函数或环路增益,环路恢复(return difference),灵敏度传递函数,补灵敏度传递函数(闭环传递函数),在所有的频率上,有,59,反馈系统的特性-单变量情况,分析:,参考信号响应(阶跃,斜坡等信号在低频段的响应),设,则当S(s)很小时,对给定的频率范围内,
14、有,干扰抑制,S(s)必须很小以减少干扰的影响,g(s)k(s)在所考虑的频段内很大,如果干扰是低频信号,则参考信号响应和干扰抑制是一致的要求,噪声抑制,T(s)必须很小以减少传感器噪声在输出端的影响,g(s)k(s)在所考虑的频段内很小,60,反馈系统的特性-单变量情况,综合上述三钟情况,得到设计合适的反馈系统对环路增益的一般要求,在低频段具有高的增益(对于合适的跟踪特性和干扰抑制),在高频段具有低的增益(噪声抑制),61,反馈系统的特性-单变量情况,希望的灵敏度和补灵敏度函数的形状为,以上的特性限制在灵敏度和补灵敏度传递函数的大小,即环路增益的大小,对SISO系统而言,传递函数的大小由它的
15、幅值来量度.,62,反馈系统的特性多变量情况,MIMO系统研究的是传递函数矩阵,而量度矩阵大小的方法有许多种,其中一种得到承认的方法是矩阵的奇异值.,对于MIMO反馈控制系统,有,同样定义有灵敏度函数矩阵S和补灵敏度函数矩阵T,显然,好的参考输入响应和干扰抑制要求小的S,而噪声抑制要求小的T 大的环路增益(GK)意味着小的S,而小的环路增益意味着小的T,63,反馈系统的特性多变量情况,奇异值图是MIMO系统的Bode图中幅频特性的推广,绘出与频率相关的曲线,类似于Bode图中的幅频特性,因为传递函数矩阵的元素都是复变量s的函数,因而它们的奇,64,经典问题的新型框架,控制系统设计的一种新型方法
16、是确定合适的S和T的界,对控制对象增加补偿器以整形S和T,使系统保持在设定的界内,该方法称”环路整形”.,环路整形对经典设计者是非常熟悉的,现代的贡献是将其应用到多变量系统中,即整形S和T的奇异值.,同时,65,经典问题的新型框架,传递函数WS和WT是权函数,用于框界(限制)S和T的,对所有的,对所有的,66,模型不确定性,模拟,加性不确定性,乘性不确定性,加性不确定性,标称系统,真实系统,加性不确定性,模型误差为,加性不确定性用于高频动态特性的模型误差.,67,模型不确定性,乘性不确定性,模型误差为,乘性不确定误差用于由于执行机构或传感器动态特性引起的模型误差.,在输入端的乘性不确定性,在输
17、出端的乘性不确定性,68,鲁棒稳定性,假设一个含有一个对象和一个补偿器的反馈系统,假设补偿器使名义对象G(s)稳定.如果闭环系统仍能使真实对象稳定,则我们说补偿器鲁棒稳定该系统.,小增益定理,考虑如图所示的反馈系统,假设对象和补偿器是稳定的,则如果:,则闭环系统将保持稳定.,又由于,则当,闭环稳定将得到保证.,小增益定理表明,对于闭环稳定性,环路增益必须很小.,69,鲁棒稳定性,考虑所示反馈系统,将其等效于两个方块图形式,利用梅逊公式,有,70,鲁棒稳定性,再利用小增益定理,有,所以:,即,由此,则闭环系统将稳定.,71,鲁棒稳定性,对于,为最小化上述不等式的右边,必须最大化T,T对所有频率的
18、最大值是其峰值,因此,最小的稳定的不确定性(乘性稳定增益MSM)为,其中,对于MIMO系统,则,此时,必须区分输入和输出乘性不确定性,因为二者定义的S和T不一样,72,H鲁棒控制的基本概念,符号和术语,指稳定和真的传递函数空间,对SISO系统,一个传递函数的-范数定义为:,Packed-matrix,一个用状态空间描述的系统(A,B,C,D),其传递函数为,其Packed-matrix符号为,73,符号和术语,考虑下面Riccati方程,则其稳定解可表示为,其中H是下面Hamilton矩阵,且(A-RX)是稳定的,故可以特定其Hamilton矩阵,而不用写出Riccati方程,74,符号和术语
19、,二端口框架,甚至原来是SISO系统(u和y是标量函数),在新的框架下却是MIMO系统.,大多数实际系统是MIMO系统,75,符号和术语,被控对象表示为分块矩阵,则系统的传递函数表达式为,调节输出z和外部输入w之间的传递函数可得,上述闭环传递函数Tzw表达式称做”线性分式传递函数”(LFT),76,符号和术语,被控对象P(s)用状态空间描述,利用Packed-matrix 符号,得,77,控制系统的二端口框架,某些标准控制问题,包括LGQ问题,可以转化为二端口框架,考虑单位反馈的经典调节问题,尽管有干扰和测量噪声施加于系统,但保持系统的输出要小,同时也希望执行机构的输出能量要小,目标:,78,
20、控制系统的二端口框架,改成二端口框架,系统的输入-输出关系,79,则有,故传递函数,其中,令,且,控制系统的二端口框架,80,H控制:问题的框架和解,问题的框架,考虑前述的二端口系统,对广义对象P(s),,发现一个内部稳定的控制器K(s),使闭环传递函数Tzw的范数,低于一个给定的正数,即标准H 控制问题:,而最优H控制问题为,81,H控制:问题的框架和解,问题的解 解必须满足一定的假设条件,(A,B2)是可稳定的,(A,C2)是可检测的 rankD12控制变量u的维数,rankD21=测量变量y的维数,系统的阶次+u的维数,对所有的频率,有,系统的阶次y的维数,有,对所有的频率,有,82,H
21、控制:问题的框架和解,H控制的解和LQG问题彼此非常相似,都用了一个状态估计器,并将估计的状态进行反馈估计器和控制器的增益都是从两个Riccati方程中解出来,不同之处是Riccati方程的系数,且H状态估计器多一项具体如下:,控制器为,状态估计器为,其中,写成Packed-matrix符号,83,H控制:问题的框架和解,并且,其中,84,H控制:问题的框架和解,闭环系统变成,显见,方程相当复杂和凌乱.,可以证明,存在一个稳定的控制器,当且仅当存在一个正的半定的两个Riccati方程的解,及下列条件成立.,85,设计H控制器的一般步骤,建立广义对象P(s) 检查假设条件是否成立,如果不成立,增加权函数或增加虚拟的输入和输出,重新构造广义对象 选择一个大的正的 值 解两个Riccati方程,确定解是否是正的半定的,也检查谱半径条件是否成立 如果所有上述条件都满足,降低 值,否则增加 值,重复4,5步,直到获得或是一个最优的解或是一个满意的解,