1、 1 第 1 章 泛函和变分 1.1 引言 以前我们在微积分中遇到的都是类似下面的函数极值问题 : 一个足够光滑的连续函数12( , ,., )ny f x x x ,其在区域 nR 内任何一点 12( , ,., )Tnx x xx 都可以作以下的Taylor 展开 21212( ) ( ) ( ) ( ) ( | | )( ) , , . . . ,T T TTnf f f f of f ffx x x x x x x x x D x x xx(1.1.1) 2 2 221 1 2 12 2 2212.().nn n nf f fx x x x xff f fx x x x x Dx 函数
2、在某一点有 极值的必要条 件是 12, , ., 0Tnf f ff x x x 但是,我们这们课程中要讨论的则是另一类极值问题 泛函的极值问题 (泛函简单地讲, 就是函数的函数,详细见后面 )。 例 1.1 一个简单的变分问题 : 最短线问题 图 1.1 最短线问题 假设经过 ,AB两点距离最短的曲线方程为 * ()y y x (1.1.2) 另有一任意的连续可导函数 ()x , ()x 满足两端固定的边界条件 01( ) ( ) 0xx (1.1.3) 显然 ( ) ( )y y x x 依旧是过固定两点 ,AB的连续曲线,其对应的长度为 2 102( ) 1 ( ) dxxL y x (
3、1.1.4) 当 0 , ()y y x 时 ()L 取到极小值,也就是说 0d ( ) |0dL (1.1.5) 把 (1.1.4)代入 (1.1.5), 展开后有 1011100011000022 2 233222d ( ) ( ) | d |d 1 ( ) d | d1 1 1 dd1 1 1 0xxxxxxxxLyxyy y yxxy y yy y y y yxxy yy (1.1.6) 由于 (1.1.6) 对于任意的 ()x 都成立,根据变分引理 (见 2.2.2 节 ), 我们可以得到 32 01y y (1.1.7) 意味着 12y Cx C (1.1.9) 因此 , 在平面上
4、过固定两点距离最近的光滑曲线是直线。 下面我们来看几类比较典型的变分问题。 例 1.2 最速降线问题 图 1.2 最速降线问题 我们在该铅直平面上取一直角坐标系,以 A 为坐标原点,水平为 x 轴,向下为 y 轴。曲线的方程为 ()y y x , A 点坐标 00( , ) (0,0)xy , B 点坐标 11( , )xy 。曲线上任意一点 P时的速度为 d 2dsv gyt (1.1.10) 3 2 2 2d d 1 ( )dddd2 2 2x y ysstxv g y g y g y (1.1.11) 因此,重物沿该曲线从 A 点滑到 B 点所需要的总时间为 1021 ( ) d d2x
5、x yT y t xgy(1.1.12) Ty我们也称之为泛函。该曲线参数形式为 1122( s i n ) , (1 c o s )x C y C (1.1.13例 1.3 短程线问题 短程线问题可以描述为:给定一个光滑曲面 ( , , ) 0x y z ,在该曲面上有两个固定 A和 B,要求在曲面上找到一根连接该两点的最短曲线。 记 A 和 B 的坐标分别为 1 1 1( , , )x y z 和 2 2 2( , , )x y z ,连接该两点的曲线方程为 ( ), ( )y y x z z x (1.1.14) 它们满足 ( , , ) 0x y z (1.1.15) 那么该曲线的长度
6、为 2122 , 1 dxxL y z y z x (1.1.16) 因此,短程线问题所对应的变分问题为:在连接 A 1 1 1( , , )x y z 和 B 2 2 2( , , )x y z 而且满足( , , ) 0x y z 的光滑曲线 ()y y x , ()z z x 中,找到其中的一条,使得 (1.1.16)中的泛函 , Lyz 取到极小值。 和前面速降线问题中不同的是,这里的自变函数 ()y y x , ()z z x 不是自由的,它们受到约束条件 ( , , ) 0x y z 的限制,因此短程线问题对所应的是个泛函的条件极值问题,其约束条件是代数关系。 例 1.4 等周问题
7、 用参数表示的平面曲线方程为 ( ), ( )x x s y y s (1.1.17) 参数 s 可以理解为曲线从起点的长度。如果曲线的长度为 l ,那么 0, sl 。由 于曲线是封闭,所以有边界条件 (0 ) ( ), (0 ) ( )x x l y y l (1.1.18) 而该曲线的长度为 220 ( ) ( ) dll x y s(1.1.19) 该曲线所围成的面积为 (根据 Green 公式 ) 1212 , d d ( d d )( ) dA x y x y x y y xx y y x s (1.1.20) 因此 , 等周问题所对应的变分问题可以描述为 : 在所有满足 (0 )
8、 ( ), (0 ) ( )x x l y y l以4 及约束条件 220 ( ) ( ) dll x y s的曲线中 , 找到其中一根使得 (1.1.20)中 , Axy 取极大值。显然,等周变分问题是泛函的条件极值问题,其约束条件是个积分等式。 例 1.5 最优控制问题 状态方程为 0( ) ( ) , ( ) , , , ft t t t t t tx f x u (1.1.21) 其中 nRx 为状态向量 , 0()tx 为初始状态 , ()ftx 为终止状态 , mRu 为输入向量。要求寻找合适的 ( ) ( , )ttu g x ,使得 0 ( ) , ( ) , d m i nf
9、ttJ L t t t t xu (1.1.22) 其中 J 是一个性能泛函。 和上面几个问题不同的,这是一个带微分约束 (1.1.21)的泛函极值问题 . 1.2 泛函 定义 1.1 记 ( )C y x 是给定的函数集合,如果对于该集合中的任何一个函数 )(xy ,都有一个数 (在本讲义中全部为实数 )与之相对应,我们记为 )( xyJ 或者 yJ 。这样我们说yJ 是定义在函数集合 )( xy 上的一个 泛函 。 简单地讲, 泛函就是以函数集合为定义域的 实值映射。 泛函的定义域 是指泛函定义中的函数集合 。如例 1.2 中最速降线中的泛函 (1.1.12) 0 201 ( ) d d2
10、x yT y t xgy , 其定 义域为 1 0 1 0 0 1 1( ) ( , ) , ( ) , ( )C y y x C x x y x y y x y 此外,在等周问题中泛函 (1.1.31) 1 , ( ) d2A x y x y y x s 中的定 义域为 1, ( ) , ( ) (0 , ) , (0 ) ( ) , (0 ) ( )C x y x s y s C l x x l y y l 象 短程线问题中的 (1.1.26) 、 等周问题中的 (1.1.30) 、 最优控制问题中的 (1.1.32), 一般不被视为泛函定义域中对函数的限制,而被认为是一种外加的约束,这样
11、的约束称为 条件 。 以上定义还可以推广到依赖于多元函数或多个函数的泛函。举两个例子。 ( , ) ( , ) C z x y x y 是定义在区域 上连续函数的集合,那么下式就定义了一个泛函 2 ( )d dJ z z x , y x y 如果 1 ( ) , ( ) , , C y x z x y z C a b是定义在区间 , ab 上的一阶连续可微函数对的集合,那 么下式就定义了一个泛函 5 22 , ( ) ( ) dbaJ f g f x g x x当然 0 ( ) ( )J y x y x 也可视为一种泛函;不过,以后提到的泛函主要是指具有上述积分形式的泛函。 线性泛函 对于泛函
12、 J , 如果对于泛函定义域中任意两个函数 f 和 g 以及任意两个实数 a 和b ,始终成立 gbJfaJbgafJ 那么称泛函 J 为定义域上的 线性泛函 。 1.3 自变函数的变分 定义 1.2 在同一泛函定义域上的两个函数 )(xy 、 )(xm ,若彼此任意接近,那么 )(xm 与)(xy 之差 ( ) ( ) ( )y x m x y x 称为 函数 )(xy 的变 分 。 显然函数变分 y 也是关于 x 的函数,它和函数的增量 y 是有差别的。变分 y 反应了整个函数的变化,而函数增量 y 反应的是同一个函数由于自变量的取值不同所引起的变化。 图 2.1 变分 y 和函数的增量
13、y 自变函数变分的一个重要 性质 下面我们来讨论函数变分的一个重要性质:求变分和求导数可以交换次序 ( ) ( ) ( ) ( ) ( ) ( )y m x y x m x y x y (1.3.1) 如果自变函数 ),( yxw 是个多元函数,那么求偏导数和求变分也可以交换次序 , 就是说 ( ) ( )xwwx (1.3.2) ww )( , 2 2 22 2 2x y z (1.3.3) () , x y z i j k (1.3.4) 1.4 泛函的变分 6 对于一个足够光滑的函数,如果我们在某一点 x 附近作泰勒展开, 212!( ) ( ) ( ) “ ( ) ( | | )f x
14、 x f x f x x f x x o x 那么其增量的线性部分 d ( )f f x x 称为函数的一阶微分,而 22d “( )f f x x 称为函数的两阶微分。其中 df 是 x 的线性函数,而 2df 是 x 的两次函数。 对于任意一个泛函 yJ , 函数变分所引起的泛函增加量为 yJyyJJ 如果可以展开为 212! , , ( | | )J L y y Q y y o y (1.4.1) 其中 , yyL 是关于 y 的 线性泛函 ,也就是说 RCC 21, , 22112211 yyLCyyLCyCyCyL (1.4.2) 而 , yyQ 为 y 的 两次泛函 。那么,可以定
15、义 定义 1.3 泛函的一阶变分 为 , yyLJ (1.4.3) 而 泛函的两阶变分 为 ,2 yyQJ (1.4.4) 我们看下面一个比较简单的泛函 ( , , )dbaJ y F x y y x 如果给函数 )(xy 一个变分 y ,也就是说新的函数为 )()()( xyxyxy , 那么对应于新函数的泛函为 ( , , )d( , , )dbabaJ y F x y y xF x y y y y x 显然,泛函的变化量为 ( , , ) ( , , ) dbaJ J y J yF x y y y y F x y y x 假如 ),( yyxF 是充分光滑的, 那么根据多元函数 Tayl
16、er 展开公式,上式可以表示成 2 221 ( ) 2 ( ) . . . d2!.by y yy y y y yaJ F y F y F y F y y F y xJJ 其中 7 2 2 2 d ( ) 2 ( ) dby yabyy y y y yaJ F y F y xJ F y F y y F y x (1.4.5) 分别是关于变分 y 及其导数 y 的一次齐式和两次齐式。我们把 J 和 J2 分别称为泛函yJ 的一阶变分和两阶变分。在不引起混淆时,我们就把一阶变分称为泛函的变分。 泛函变分的另一种求法 对于任意给定的 一个齐次函数 )(x (当然该函数有一些其他诸如可微或者其他一些限
17、制条件,具体视泛函的定义域而定 ),也就是说它在边界上的值为零,那么对于任意小的一个实数 )1( ,显然 )()()( xxyxy 也 在 泛函的定义域 内 。那么 221002! 2 d d | | .ddJ J y J yJ y J yJ y J y 如果更进一步,令 )(x 就是函数的变分 y ,那么从泛函变分的定义中就可以知道,上式的第一部分就是泛函的一阶变分 J ,而第一部分就是泛函的两阶变分 J2 。 也就是说 0222102! 2d |dd |dJyJJyJ( 1.4.6) 1.5 泛函变分的性质 (1) 2121 )( FFFF (2) 212121 )( FFFFFF (3)
18、 FnFF nn 1)( (4) 22 212121 )( F FFFFFF (5) )()( )( nn FF (6) ( , , )d ( , , )dbbaaF x y y x F x y y x1 2 1 2 1( , , , . . . , , , , . . . , ) d dnn n i ii iiFFF x y y y y y y x y y xyy 这表明,求泛函变分可以用类似求复合函数求微分的方式进行。 下面我们来看两个例子: 例 1.6 已知泛函 222 2 ( , , ) d , ( , , )uuuJ u u f x y z V u u x y zx y z 8 求
19、J 。 解 2 ( ) ( , , ) d( ) ( ) ( )2 ( ) ( , , ) du u u u u uJ u f x y z Vx x y y z zu u u u u u u f x y z Vx x y y z z 这里被积函数内还包含着自 变函数变分的偏导数,需要进一步简化,我们在后面会详细进行讨论。 例 1.7 已知泛函 , ( , , , , )d , ( ) , ( )baJ y z F x y y z z x y y x z z x 求 J 解 : dd d d |ddbyzyzab y bzy z ayzaJ F y F y F z F z xF FF y F z
20、 y z x F y F zxx 这里已通过分部积分消去了积分号下自变函数变分的导数。 1.6 各种泛函的变分 (1) 最简单的泛函 dxyyxFyJ ba ),( d d( ) | ( ) d d babba aFFJ y y y xyyF F Fy y xy y x y (2) 含高阶导数的泛函 ( , , , )dbaJ y F x y y y x d d d ( ) d ( ) dd( ) | ( ) | ( ) ( ) d d d d ( ) | d d(dbababbbaaabaF F FJ y y y y xy y yF F Fy x y yy y yF F F F Fy y y
21、 y y xy y y x y x yF F Fy y yy y x yFFyyx 22d) ( ) d d baFy y xy x y如果 9 () ( , , , , . . . , )db naJ y F x y y y y x , 而且满足固定的边界条件 ( ) ( )01( ) , ( ) , 0 ,1 , , 1i i i iy a y y b y i n 那么 22 ( )d d d ( ) ( ) . . . ( 1 ) ( ) dd d dnb nnna F F F FJ y y xy x y x y x y (3) 含多元自变函数的泛函 22 ( , ) 2 ( , ) d
22、 dDuuJ u x y u f x y x yxy 22222 2 2 ( , ) d d( ) ( )2 2 2 ( , ) d d2 ( , )DDu u u uJ uf x y x yx x y yu u u uuf x y x yx x y yu u u uu u f x y ux x y y x y 2222dd2 ( , ) d d 2 d dDDDxyu u u uf x y u x y u y xx y x y 这里最后一个等式应用格林公式,消去了二维积分中的自变函数变分的导数 , 其作用相当于一元函数中的分部积分公式。至于 对三维积分情形,则需要用到高斯公式 (见附录 )
23、。 一般来说,对于 ( , , , , )d dxyJ w F x y w w w x y d dddddddddddddddddxyxyxyxyxyF F FJ w w w w x yw w wF F Fw w w x yw x w y wFFw x yx w y wF F Fwww x w y w ddddxyxyFFw y w xww式中如果需要将被求导函数视为仅仅是 ,xy的函数,则用 dd()ddxy代替 ()xy,以避免混10 淆,譬如 ( , , , , )ddxyx x x y xxyF F x y w w wF F F F Fw w wx x w w w (4) 含多个自变函
24、数 的泛函 1 1 1 , . . . , ( , , . . . , , , . . . , )dbn n naJ q q L t q q q q t 11d ddbnnbrra rrr r raL L LJ q t qq t q q 习题 1. 若 ( , , , )f x y y y 是关于 ,yy y 的二次齐次函数,求泛函 ( , , , )d , ( ) ( ) 0baJ y f x y y y x y a y b 的一、二阶变分。 2. 求 1.6 节中 各种泛函的 二阶 变分 。 11 第 2 章 泛函的极值 在讨论 泛函的极值以前 , 我们先来回顾一下函数的极值问题。 2.1
25、 函数的极值性质 2.1.1 函数的连续性 任意一个多元函数 12( ) , ( , , ., ) Tnnf x x x Rxx , 0 , 如果 0)( , 当0 xx (或者说 0( , )O xx)时 , 有 0( ) ( )ff xx 那么 , 我们称 ()f x 在 0x 处是 连续的 , 记为00( ) lim ( )ff xxxx。 2.1.2 函数的可 微 性 更进一步 , 如果存在 1( , , ) TnnA A R A , 使得 00 1 0 00( , , , , ) ( )l i m , 1iniiif x x x fA i nxx xxx 那么我们称 ()f x 在
26、0x 处是可 微的 , 或者说存在 (一阶 )导数 ,记为 ( )f xA 或者记为 12( ) , , . . . , Tnf f fff x x x x其中 为梯度算子 (或者 Hamilton 算子 , 见附 1)。 同理 , 可以定义该函数的两阶导数 “( )f x 2 2 221 1 2 12 2 222 1 2 22 2 2222“ ( )nnn n nf f fx x x x xf f fff x x x x xf f fx x x x x Dx 及更高阶导数 。 这里 fD 也称为 Jacobi 矩阵 。 如果函数 ()f x 在某点 0x 足够光滑 , 那么我们就可以在该点附
27、近把函数作以下的展开 22100 2!020( d ) ( ) d d ( d )d d ( )d d ( ) dTTf f f f offff x x x xxxx D x x 其中 ()o 为高阶小量 , 2d,dff分别为函数 ()f x 的一阶微分和两阶微分 。 12 换个角度来看 , 如果 210 0 0 02!( d ) ( ) ( , d ) ( , d ) ( d )f f L Q o x x x x x x x x 其中 0( ,d )Lxx为 dx 的线性函数 , 而 0( ,d )Qxx为 dx 的两次函数 , 那么 0( ,d )Lxx为 ()f x的一阶微分 , 0(
28、 ,d )Qxx为 ()f x 的两阶微分 。 2.1.3 函数的极值 对于足够小的 0 , 如果 0( , )O xx, 总有 0( ) ( )ffxx, 那么我们称 ()f x 在0x 有 极大值 。 如果 0( , )O xx, 总有 0( ) ( )ffxx, 那么我们称 ()f x 在 0x 有 极小值 。这里 00( , ) O x x x x为 0x 的 邻域 。 如果 ()f x 在某一点 0x 附近足够光滑 , 那么 ()f x 在 0x 有极值的必要条件为 0d d ( ) 0Tffxx 或者说 0( ) 0f x 更进一步 , 如果 0( ) 0f Dx , 那么 ()f
29、 x 在 0x 有极大 (小 )值的充 分 条件为 021 02!d d ( ) 0d d ( ) d 0 ( 0 ) , d 0TTffff xxx D x x x 或者说是 00( ) 0( ) 0 ( 0)ff xDx 其中 0( ) 0f Dx 表示是 负 定矩阵 。 2.2 泛函的极值 2.2.1 函数的邻域 定义在区间 (, )ab 上的 函数 )(0 xyy 的一阶 邻域定义为 : 对于 0, 始终满足 00( ) ( ) , ( , )( ) ( ) , ( , )y x y x x a by x y x x a b 我们称 同时满足上述两式的 函数 ()yx 的集合 是 0(
30、)yx的 一阶 邻域 。 同样可以定义函数 的高阶 邻域 。 2.2.2 泛函的极值 变分引理 : 如果函数 ,)( 0 baCxf , 对于在 , ba 上满足 0)()( ba 的、 足够光滑的任意函数 )(x , 如果总是成立 ( ) ( )d 0baf x x x 那么在 ( , )x a b 必有 13 0)( xf 证明 : 用反证法 。 假设有 ),(0 bax 使得 0)( 0 xf , 不失一般性 设 0)( 0 xf 。 由,)( 0 baCxf , 一定存在 0 , 使 00( ) 0 , , ( , )f x x x x a b 这样我们总可以 构造 下面一个连续函数
31、)(x 33( ) ( ) , ( , )()0 , ( , )x x xx x 其中 00,xx 可以证明 2( ) ( , )x C a b 这样 00( ) ( ) d ( ) ( ) d 0xbaxf x x x f x x x 显然 与引理条件 矛盾 , 所以对于任意的 , bax 都有 0)( xf 以上 结果容易推广到二维或更高维的情形 。 如果泛函 yJ 在 )(0 xyy 的一阶 邻域内都不大 (小 )于 0yJ , 那么我们称泛函yJ 在 )(0 xyy 有极大 (小 )值 。 也就是说 0 J y J y ()极 小 , 0 J y J y ()极 大 ( 2.2.1)
32、使 yJ 取到极值的函数称为极值函数 。 下面从最简单的泛函来讨论使泛函取到极值的必要条件 。 01 ( , , ) d , ( ) , ( )baJ y F x y y x y a y y b y 如果 *()y y x 使 ( , , )dbaJ y F x y y x 取到极值 , 则对于 *()y y x 的一阶 邻域内 的 函数 ()yx 应有 *J y J y ()极 小 或者 *J y J y ()极 大 现在用变分引理导出泛函取极值的必要条件。 取 *( ) ( ) ( )y x y x x 由于 10 )(,)( ybyyay , 因此 0)()( ba 当 足够小的时候 ,
33、 ()yx 属于 *()y y x 的邻域 。 当 *()y y x 以及 )(x 给定以后 , Jy应该是关于 的函数 * ( , , ) d ( )baJ y F x y y x J 14 因为 yJ 在 *()y y x 处取极值 , 0 应该是 ()J 的极值点 。 根据函数极值的必要条件 0d ( ) |0dJ 这就意味着 d ( ) ( )d 0dba FF xxy x y 如果令 y 那么有 d ( ) d 0dba FFJ y xy x y 考虑到 y 的任意性, 根据变 分引理 有 d ( ) 0dFFy x y( 2.2.2) 这就是该泛函极值问题的 Euler 方程 。
34、如果只限定 0()y a y 、而放松 xb 处的要求,则 定义域 1 , , ( ) 0 y C a b y a Y d ( ) d 0d b xba F F FJ y x yy x y y ( 2.2.3) 若 ()y y x 是 泛函 Jy在 Y 上的极值 , 限定 01 , , ( ) , ( ) ( ) o y C a b y a y y b y b y YY 则 ()y y x 必是 泛函 Jy在 oY 上的极值, 根据 ( 2.2.2) 有 d ( ) 0 , ( , )dFF x a by x y (2.2.4) 代入 ( 2.2.3) 并考虑 ()yb 的任意性可得 0 xb
35、Fy (2.2.5) 要使 Jy在 ()y y x 处取极值 , 那么意味着 必须同时满足 ( 2.2.4) 和 ( 2.2.5) 对于更一般的泛函我们同样可以得到 下面的泛函极值定理 。 定理 2.1 如果泛函 yJ 在 )(0 xyy 上达到极值,那么泛函在 )(0 xyy 上的一阶变分J 满足 0J 证明 : 根据泛函极值的定义,如果泛函 yJ 在 )(0 xyy 上达到极大值 , 那么必定存在 )(0 xy的一个领域 , 对于该领域内的任何一个函数 )(xy , 使得泛函的增量 0 yJyJJ 不变号 , 由前面的推导 (1.4.6) 212! .J J J 15 其中 0d |dJy
36、J 22202d |dJyJ 显然 , 当 充分小时 , J 的符号由 J 部分确定 。 如果 0J , 我们总是可以调整 的符号使得 J 改变符号 , 这与假设矛盾 。 因此 0J 是泛函有极值的 必要 条件 。 尽管 0J 不是泛函有极值的充分条件,但往往仍有意义。 对于 仅仅满足 0J 的泛函 J , 我们称 在该点取 驻值 。 2.2.3 泛函的 Euler 方程 由泛函 0J 所得到的微分方程 (包括边界条件) 称为泛函的 Euler 方程 。 例 2.1 ( , , )dbaJ y F x y y x 的 Euler 方程为 d ( ) 0dFFy x y例 2.2 2 2011d
37、 ( ) ( ) d , ( ) , ( )2dbayJ y p x q x y x y a y y b yx dd( ) ( ) ddddd( ) ( ) d 0ddbabayyJ p x q x y y xxxyp x q x y y xxx 得到 dd( ) ( ) 0yp x q x yxx 上式 称为 Sturm-Liouville 方程 。 结合边界条件 10 )(,)( ybyyay , 构成第一边值 问题 的Sturm-Liouville 问题 。 例 2.3 22 d dxyGJ y u u x y 上述 泛函可以写成 ( )d dGJ y u u x y 其一阶变分为 2
38、( ) d d2 ( ) ( ) d dGGJ u u x yu u u u x y 16 根据格林公式有 2 d 2 d d 0GGuJ u s u u x yn 当边界上值给定时 , 0Gu , 可以得到相应的 Euler 方程 0u 这是一个 Laplace 方程 。 如果只在部分边界 1G 上给定函数值,这里 12G G G , 则除上述的 Laplace 方程 外还应满足 2 0Gun 例 2.4 2 2 21 2 d d2x x x y y yGJ y u u u x y 其中 u 及其法向导数在 G 的边界 G 上给定 。 泛函的一阶变分为 2 d dx x x x x y x y y y y yGJ u u u u u u x y 由于 2 2 2222( 2 ) ( )()2( 2 ) ( ) ( 2 )( ) ( )()2x x x y y yx y x y y yx x xx x x x x y y x y y y yx y x y y y x y yx x x x x xyyyx x x x x x y y y y y yu u uu u ux x y yu u u uuuu u u u u ux y yu u u u u uu u u ux y y x xuuu u u u u uyux