1、第五章 用变分法求解连续最优控制问题有约束条件的泛函极值,上节讨论没有约束条件的泛函极值问题。但在最优控制问题中,泛函J所依赖的函数总要受到受控系统状态方程的约束。解决这类问题的思路是应用拉格朗日乘子法,将这种有约束条件的泛函极值问题转化为无约束条件的泛函极值问题。,一、拉格朗日问题 考虑系统,n维连续可微的矢量函数。,(5-1),式中,;,;,设给定 ,初始状态为x(t0)=x0,,终端状态x(tf)自由。性能泛函为,寻求最优控制u(t),将系统从初始状态x(t0)=x0转移到终端状态x(tf),并使性能泛函J取极值。,(5-2),将状态方程式(5-1)写成约束方程形式,应用拉格朗日乘子法,
2、构造增广泛函,式中(t)待定的n维拉格朗日乘子矢量。,(5-3),定义纯量函数,称Hx,u,t为哈密尔顿函数。则,或,(5-4),(5-5),(5-6),式中,(5-7),对式(5-5)右边第二项作分部积分,得,将上式代入式(5-5),得,(5-8),使J取极小的必要条件是,对任意的u和x,都有J=0成立。,设u(t)和x(t)相对于最优控制u*(t)及最优轨线u*(t)的变分为u和x,计算由u和x引起的J的变分为:,因此得,(5-9),(5-10),(5-11),(5-12),式(5-9)称为动态系统的伴随方程或协态方程,又称为伴随矢量或协态矢量。式(5-10)即系统的状态方程。式(5-9)
3、与式(5-10)联立称为哈密尔顿正则方程。式(5-11)称为控制方程,,这个方程是在假设u为任意,控制u(t)取值不受约束条件下得到的。如果u(t)为容许控制,受到 的约束,u变分不能任意取值,那么,关系式 不成立,这种情况留待极小值原理中讨论。,(5-13),(5-14),式(5-12)称为横截条件。常用于补充边界条件。例如,若始端固定,终态自由时,由于x(t0)=0,x(tf)任意,则有,若始端和终端都固定时,x(t0)=0,x(tf)=0则以,作为两个边界条件。,(5-16),(5-15),实际上,上述泛函极值的必要条件,亦可由式(5-6)写出欧拉方程直接导出。即,(5-17),应用上述
4、条件求解最优控制的步骤如下:1) 由控制方程,解出,2) 将u*代入正则方程解两边边值问题,求x*、*。3) 再将x*、*代入得,为所求。,例1:有系统如图1所示。欲使系统在2s内从状态,转移到,,使性能泛函,,试求u(t)。,解:系统状态方程及边界条件为,由式(5-7),得,由欧拉方程,得,5个未知数x1, x2, 1, 2, u,由5个方程联立求得通解,4个积分常数C1, C2, C3, C4由4个边界条件,解得,因此,最优解为,最优控制u*(t)及最优轨线x*(t)如图2所示。,例2:设问题同例1。但将终端状态改为(2)=0,(2)自由,即终端条件改成部分约束、部分自由。重求u*(t)、
5、x*(t)。,解 正则方程及控制方程与例1完全相同,只是边界条件改成 时 , 时 ,代入例1的通解中可确定积分常数:,于是得,u*(t)和x*(t)的图像见图3。,比较上述结果可见,即使是同一个问题,如果终端条件不同,其最优解也不同。,二、波尔札问题 设系统状态方程,初始状态x(t0)= x0,终始状态x(tf)满足,式中Nq维向量函数,nq。,(5-18),(5-19),性能泛函,其中、L都是连续可微的数量函数,tf是待求的终端时间。 最优控制问题是寻求控制矢量u*(t),将系统从初态x(t0)转移到目标集Nx(tf), tf=0上,并使J取极小。,(5-20),在这类极值问题中,要处理两种
6、类型的等式约束。一是微分方程约束,一是终端边界约束。根据拉格朗日乘子法,要引入两面两个乘子矢量,一个是n维(t),另一个是q维,将等式约束条件泛函极值化成无约束条件泛函极值问题来求解。,为此,构造增广泛函,写出哈密顿函数,(5-22),(5-21),于是,(5-23),对上式中最后一次作分部积分,得,(5-24),(5-25),(5-26),(5-27),这是一个可变端点变分问题。考虑x(t),u(t),tf相对于它们最优值x*(t),u*(t),t*f的变分,并计算由此引起J的一次变分J。设,图4 可变终端各变分间的关系,从图4可知在端点处变分之间存在下列近似关系,式中x(t*f)x在t*f
7、时的一次变分; x(t*f+ tf)x在tf =t*f+ tf时的一次变分。式(5-28)描述了在可变终端情况下,x在这两个时刻上变分的近似关系,近似式中忽略了高阶无穷小量。,(5-28),考虑到式(5-24)右边第一项和第二项的一次变分各有两项:,因此,有,(5-29),注意到tf、x、u任意性,及泛函极值存在的必要条件J=0式(5-29)可得极值必要条件如下:,(5-30),式中Hx(tf), u(tf), (tf), tf函数H最优轨线终端处的值。,边界条件x(t0)= x0,(5-32),终端时刻由下式计算,(5-31),终端时刻由下式计算,式中Hx(tf), u(tf), (tf),
8、 tf函数H最优轨线终端处的值。上述总共个2n+r+q+1方程,可联解出2n+r+q+1个变量。,(5-32),最后,分析哈密尔顿函数沿最优轨线随时间的变化规律。哈密顿函数H对时间的全导数为,(5-33),如果u为最优控制,必满足,及,(5-34),因此,有,上式表明,哈密顿函数H沿最优轨线对时间的全导数等于它对时间的偏导数。,当H不显含t时,恒有,即,常数,(5-35),这就是说,对定常系统,沿最优轨线H恒为常值。,例4:给定系统状态方程为,设初始状态x(0)= 0,终端状态约束曲线x1(1)+x2(1)-1=0求使性能泛函,取极小时的最优控制u*(t)及最优轨线x*(t)。,解 这是个终端
9、时间tf给定,但终端状态受约束的拉格朗日问题。 哈密顿函数,由性能泛函取极值的必要条件,得,它们的通解为,由边界条件确定积分常数,代入解得,由终端约束方程 x1(1)+x2(1)=1可解出=-3/7。,最优解,结果如图5所示,例5:设一阶系统状态方程为,边界条件x(0)=1和x(tf)=0。终端时刻tf待定,试确定最优控制u*,使下列性能泛函,为极小。,解 这里,哈密顿函数为,控制方程,正则方程,由边界条件x(0)=1和x(tf)=0又由式(5-32)得,即,而u(tf)=-(tf)代入上式,得,其解为,由于,因此,有,最优控制,代入状态方程得,由初始条件x(0)=C=1,故最优轨线,再以终端条件x(tf)=0代入上式,得,故最优终端时刻,最优解如图6所示。,