1、第5章 矩阵的特征值估计 5.1 矩阵特征值界的估计 5.2 矩阵特征值的分布区域 5.3 Hermite 矩阵特征值表示 一、矩阵特征值界的估计 1. 矩阵的和分解 ( ) ( ) 11 , , 22 nn H H A B AA C AA =+= C 设 , 记 5.1 矩阵特征值界的估计 , , Hermite Hermite. HH B BC C BC ABC = = = + 则 即 是 矩阵, 是反 矩阵,且2. 一个基本引理 引理1 2 1, . nn n H m A y y y Ay A = CC 设 , , 且 则 证 ( ) 1 2 2 11 11 1, nn n H ij n
2、n n nn nn H ij i j ij i j ij ij A a y y yy y Ay a a = = = = = = = CC 设 , 且 则1, 11 max nn ij i j ij n ij a = = ( ) 2 2 1, 11 1 max 2 nn ij i j ij n ij a = = + 2 2 1, 11 11 1 max 2 nn nn ij i j ij n ij ij a = = = = = + 2 2 1, 11 1 1 1 max 2 nn nn ij i j ij n ji i j a = = = = = + 1, max ij ij n na = .
3、m A =3. 矩阵特征值界的估计 定理1 nn AA 设 , 是 的任意特征值, 则 C ( ) ( ) 1 1, 11 1 1 1 max 2 1 1 , max ,tr , max ,max , nn ij ij mm ij n ij n H ij F jn i n ij in j A a An a A AA A a A aA = = = = = = = = = = 其中 最 大奇异值 1 1 min , , , , . mm F A A A AA 定理2 ( ) ( ) ( ) 1 ; 1 2 Re ; 2 1 3 Im . 2 += = C 设 , 是 的任意特征值,则 nn m H
4、 m m H m m AA A AA B AA C 证 0, , nn A A xA x Ax x = C 设 , 是 的任意特征值, 是 属于 的特征向 量, 且2 2 , 1, . x y y Ay y x = = = 令 则 且 ( ) , , = = = = 于是 H H H H HH yy yA y yA y yAy Re , 22 + = = = H HH m AA y y y By B Im . 22 = = = H HH m AA y y y Cy C , = = HH m y y y Ay A推论1 Hermite 矩阵 的 特征 值都 是 实 数 , 反Hermite矩 阵
5、 的特 征 值 为 零或 纯虚 数. 证 Im 0 22 2 = = = = = 当 时, , 即 为实数. H H HH AA AA y yy yRe 0 22 2 = + = = = = 当 时, , 即 为零 或纯虚数. H H HH AA AA y yy y引理1 2 2 2 11 ,. n nn kk kk n = = 1 对于任意实数 恒有 证 22 22 2 1 1 11 1 Cauchy-Schwarz=1 1 . n n nn n k k kk k k kk k n = = = = = = 由 不 等式 ,得定理3 1Im . 22 nn H m AA n AA n R 设
6、, 是 的任一特征值,则 1 1 1. 2 n n n 时, 因此用定理3的结论可 得到特征值 的虚部的更 Rema 好的 rk. 一个界. 证明略. 例1 0 21 2 0 2 , 1 20 AA = 设 估计 的特征值的界. 解 1, max 3 2 6 = =, ij m ij n An a 11 0 0, 22 111 2 6, 222 += = H m m HH m mm AA AA AA A 2 6 Re 0 Im 6. = 由定理 知 , , ,A 由此可知, 的特征值为0或纯虚数. 31Im 3 4641 23 2 H m A AA 由定 理3 知 , 的 任一 特征 值 满
7、足 . 3 4641 2. A 故所给矩 阵 的特征值的模不超过 . . 由定理3 得到的 界要比定理 得到的界好 ( ) 12 3 0 3, 3, Im 3, . A ii = = = 实际上 ,矩 阵 的 特 征值 为 , 从 而 因此 ,由 估 计 式 确定 的 特 征 值 的 界 比 实 际 的 界要 大一 些二、Schur 不等式 定理4 ( ) 12 22 1. = = C 设 , 是 的 个 特征值 , 则 nn n n H i F i A An A t rAA 证 12 nn n A An U C 设 , 是 的 个特 征值, 则 由 Schur 分解定 理知, 存 在 酉矩
8、阵 使 得1 12 1 22 , = = 其 中 n n H n rr r A URU R ( ) 22 2 22 11 1. H FF nn i ij i i i jn i A R tr R R r = = = = =+ 于是一、圆盘定理 1. Gerschgorin 圆(盖尔圆) ( ) 1 1 , 1 1 , , 1 , 2 , , . + = = = =+ + + = C 设 , 记 nn ij nn n i ij i i i i i n i j j i Aa R aa a a a in 5.2 矩阵特征值的分布区域 定义1 1 , 1 11 , 1 , 2 , , . n j ij
9、j j jj ij j nj i R aa a a a jn + = = =+ + + = ( ) ( )1 , 2 , , Gerschgorin . = = C 称复平面上的圆域 为 的第 个 行 圆(盖尔圆) 称 为盖尔圆 的半径. ii i i i i G z za R G R in Ai ( )1 , 2 , , = = C 为 的第 个 盖尔圆 列 . jj j j R G z za j n Aj 1 2 3 1 0.02 0.11 0.01 0.14 0.02 0.01 0.51 0.13,0.15,0.5 0.03. = = = = C C C 如 的三个盖尔圆为: Ai Gz
10、 z G z zi Gz z 1 1 0.13 R = 0.5 3 0.03 R = i 2 0.15 R =2. 圆盘定理 ( ) 11, = = = = C C 设 , 是 的任 一 特 征 值 , 则 nn ij nn nn i ii i ii Aa A G z za R 定理1 ( 圆盘定理1 ) 11, = = = C 或 nn i ii i ii G z za R . An 即 的全 部特 征值都在它的 个 盖 尔圆的并 集 中证 ( ) ( ) 12 , . T ij n nn Aa x A = = 设 为 的 任 一 特征 值 , 为 的属 于特 征 值 的特 征 向 量 00
11、 00 0 1 max , 0 , i ii i n ij j i j i Ax x a = = = 选取 使得 则有 ,由于 所以 ( ) 00 0 0 0=. 即 n ii i i j j ji aa00 0 0 0 00 0 0 =. nn j j i i ij ij i ji ji i i aa a R 由此 可得 , 0 11 . nn i i ii i ii G G z za R = = = C 即 ,从而例 2 1 20 13 2 0 0 10 20 06 i A ii i = 估计矩阵 的特征值分布范围. 解 12 34 4 1 : 2 3; : 3 3; : 10 2; :
12、6 2. . = 的 四个 盖 尔圆 为: 的 特 征值 i i A Gz Gz Gz Gz i AG 10 3 G 2 1 G 6i 4 G 3 2 G12 34 4 1 : 23 ; : 32 ; : 10 4; : 6 1 = 的4个列盖尔圆为: 的4个特征值都在 中 i i A Gz Gz Gz Gz i AG 10 3 G 2 1 G 6i 4 G 3 2 G O Remark . An 的 个盖尔圆中不一定都有特征值 0 0.4 , 0.9 1 = 如 则 的 盖 尔圆为 : AA12 : 0 0.4, : 1 0.9, Gz Gz 2 1 1,2 , 1 0.44 , 2 i i
13、 AG A i = = 的特征值 事实上 的特征值 如图所示:有一个盖尔圆中有两个特征值. 1 2 G 1 G O 2 1 定义2 A 在矩 阵 的 盖 尔圆 中, 相交在 一 起 的 盖尔圆 构 成 的 最 大连 通 区域 称 为一 个 , 孤 立 的 一 个 盖 尔 圆也 是一个 连 连通 部 分 通 部 分. , nn A Ak D D Ak Ak D D Ak C 设 , 的 个盖尔圆形成一个连通区域 则在 内恰有 的 个特征值(按重数计算);或 的 个 列盖尔圆形成一个连通区域 ,则在 内恰有 的 个特征值. 定理2 ( 圆盘定理2 ) 34 12 1 , 根 据定 理2可知:例 中
14、 的孤 立盖尔圆 中 各有 的一 个特征 值.而连通 部 分 含有 的两个特 征值. GG A GG A 10 3 G 2 1 G 6i 4 G 3 2 G例2 , nn A An An R 设 矩 阵 且 的 个 盖 尔圆 都 是孤 立 的,则 有 个互 不 相 同的实 特 征 值. 证 ( ) 1, 2, , ii i A n Gi n G GA = 设 的 个 盖尔 圆为 .由于每 个 的圆心都在实轴上,所以 每个 都关 于实 轴对称. 由 于 它 们是孤立的,所以 中有且 仅有 的一 个 特征 值. i G An 根 据 实 矩阵 的复特 征值一 定成 对 共 轭 出 现 知: 关 于
15、 实轴 对称的 盖尔 圆 中 的特 征值 必为 实 数, 因此 有 个互 不 相同 的实 特 征 值.3. 特征值的隔离 ( ) ( ) 12 1, 0 , 1 , 2 , , , , , , , :, = = = = = CC 设 , 令 构造 与 相 似 的矩 阵 nn ij i i nn n i ij j nn Aa d d i n D diag d d d A B d B DAD a d 12 , , , . 则 与 有相同的特征值.适当选取正数 , 有可能使 的每一个盖尔圆仅包含 的一个特征值 n AB dd d BA12 , , , 选取正数 的一般原则: n dd d ( ) 1
16、, 1, 2 欲使 的第 个盖尔圆放大,可 取 其余取 此时 的 其余盖尔圆适量缩 小. i Ai d B例3 911 11 113 Ai = 应 用 盖 尔 圆 定 理隔 离 矩 阵 的特 征 值. 解 12 : 9 2; : 2; 的3 个盖 尔 圆 为 : A G z G zi 1 2 , 1 , 1 , 9 22 0.5 1 . 0.5 1 3 = = = 取 则 D diag B DAD i 9 3 G i 1 G 3 2 G 3 : 3 2. Gz12 3 : 9 4; : 1.5; : 3 1.5. 的3 个 盖 尔 圆 为 : B G z G zi Gz 9 3 G i 1 G
17、 3 2 G 12 3 , GG G B A 及 都 是孤立的 盖 尔圆,其 中各含 的 一 个特征值 ,它 们 也 是 的特征值. 12 3 , A GG G 综上可知: 的3个特征值分别位于 和 中.例4 2 032 2 10 4 4 0.5 0 A = 应用盖 尔 圆定 理隔离矩 阵 的 特征 值, 并 根据 实矩 阵特 征 值 的 性质改 进所得结 果. 解 1 2 3 : 20 5; : 10 6; : 4.5. 的3 个盖尔圆 为: A Gz Gz Gz 20 3 G 1 G 10 2 G 123 . GGG 易 知 , , 相交1 2 3 : 20 6; : 10 3.5; :
18、6. A Gz Gz Gz 的3个 列 盖 尔 圆为: 20 3 G 1 G 10 2 G 123 . GGG A 易 知 , , 都 是孤立的盖 尔圆, 其 中 各 含 的 一个特征 值 , , 1 , 2 , 3 , 6.5,13.5 , 6,6 . = R 因 且 关 于 实轴对 称 , 所以 其中 的 特征值 必 为 实数,因此 的3 个特 征 值分 别 在区 间 14,26 nn i A Gi A二、Ostrowski 定理 ( ) 1 110 1, . nn ij nn nn i ii i i ii Aa A O z z a RR = = = = C C 设 , 是 的任一特征值,
19、 则 定理3 ( Ostrowski 定理1 ) 11. = = = = 其中 , nn i ij i ji jj ji ji Ra Ra 证 ( ) ( ) 12 , . T ij n nn Aa x A = = 设 为 的任 一特 征值, 为 的 属于特 征 值 的 特征向 量 ( ) 1=, n ii i ij j j ji Ax x a a = = 由 得 11=. = = 故 nn ii i ij j ij j jj ji ji a aa 1 , 1 , 2 , , , 0 , 0 . = = = 设 则 当 时 由Holder 不等 式有: n ii i i ij j ji ai
20、n R a1 11 = = = nn ii i ij j ij ij j jj ji ji a a aa ( ) ( ) 1 11 1 1 11 nn ij ij j jj ji ji aa = = 1 1 1 11 nn ij ij j jj ji ji aa = = = 1 1 1 1 , = = n i ij j j ji Ra1 1 1 1 1 1 1. n ii i ij j j i ji a a R = 故 1 1 1 1 1 1 1 11n nn ii i ij j i ij i ji a a R = = = 于是 1 1 1 1 11 1 nn n ij j ii i ij i
21、 aa = = = = 1 1 1 1 11 1 nn n ij j ii i ji i aa = = = = 11 11 11 1 nn n ji i ii i ij i aa = = = = 11 11 11 1 nn n ji i ii i ij i aa = = = = 1 1 11 nn ji i ij ji a = = = 1 1 1 . = = n ii i R 00 0 0 1 1 0 1 , 2 , , , 所 以 , 存在 使得 ii i i a in R R 00 0 0 1 . ii i i a RR 即 1 1 . n ii i i i z z a RR = C 故
22、( ) ( ) 0 1, 1 , 1 , 2 , , . = = + = C C 设 , 则 的全体特征值都在 个圆盘 的并集之中 nn ij nn i ii i i Aa A n O z za R R i n 推论1 推论2 ( ) ( ) ( ) ( ) 10 1, max ;max 1 . nn ij nn ii i i i ii i i i Aa A a RR A aR R = + + + C 设 , 则 推论3 ( ) ( ) 1 110 1, max . nn ij nn nn ij ji i jj Aa A aa = = = C 设 , 则例5 2 1.1 1 0.8 3 2 1
23、.2 1.1 3 A = 估 计 矩 阵 的 特 征 值分布 区 域. 解 123 : 2 2.1, : 3 2.8, : 3 2.3, A G zG zG z 的3个盖尔圆为: 123 A GGG 从 而 的特 征值在 , , 的 并 集 之 中. 6 2 1 G 3 2 G1 2 3 : 2 2.1 2 2.049; : 3 2.8 2.2 2.48; : 3 2.3 3 2.65. A Oz Oz Oz 的3 个Ostrowski 圆 为 取 = 1 2 : ( ) 123 A OOO 从而 的特征值在 , , 的并集之中. 图中虚线所围区域 6 2 1 O 3 3 O 可见,由Ostr
24、owski定理给出的特征值包含区域比 盖尔圆定理给出的区域更精确. 1 2 3 1 11 : 2 2.1 1 2 2.05, 22 11 : 3 2.8 1 2.2 2.5, 22 11 : 3 2.3 1 3 2.65 22 A Oz Oz Oz + = + = + = 由推论 可知 的特征值在3个圆盘 取 = 1 2 : 的并集之中,这一包含区域介于前两者之间.( ) ( ) 1 ,1 ,1 1, 1 , 2 , , , , , 1 , 2 , , Cassini . nn ij nn n i ij i i i i i in j ji ij ii jj i j Aa R aa a a a
25、in z zaza R R i j i j n A + = = = =+ + + = = = C C 设 , 记 称复平面上的区域 为 的 卵形 定义3 ( ) 11 . nn ij nn ij ii jj i j i jn i jn Aa A z zaza R R = = C C 设 , 是 的任一特征值,则 定理4 (Ostrowski 定理2 ) ( ) 1 A nn 1 即 的全部特征值都在它的 个卵形构成 2 的并集中.一、Hermite 矩阵的最大与最小特征值 ( ) , Rayleigh . nn n H H Ax x Ax Rx xx A = CC 设 为Hermite 矩 阵
26、 ,0 称 为 矩阵 的 商 5.3 Hermite 矩阵特征值表示 定义1 ( Rayleigh商) 定理1 证 ( ) ( ) 12 12 1 0 0 Hermite , max , min . n n nn n n n x x x x A An Rx Rx = = C C C 设 是 矩阵 , , 是 的 个 特 征值 ,满 足则 2 Hermite nn n A An C 1 设 是 矩阵, 是 的 个特征值,于是存在酉矩阵( ) 2 1 12 , , H n n Q q q q Q AQ Q AQ = = = 1 使得 2 , n AQ Q = 1 即 从而 , 1 , 2 , ,
27、. i ii Aq q i n = = ( ) 12 11 22 12 1 , , , , . n n n ii n i nn x cc c cc cc x cq q q q Q cc = = = = C , 存在 使得 ( ) 1 2 12 , , , HH n n c c x Ax c c c Q AQ c = 于是,( ) 1 22 12 , , n nn c c cc c c = 1 2 1 . n ii i c = = ( ) 2 1 2 1 2 1 . 0, . n H i i n H ii i n H i i xx c x c x Ax Rx xx c = = = = = = 而
28、 故 若 则( ) ( ) ( ) 1 11 . , . n nn Rx Rq Rq = = 由此 可知 , 容 易 验 证 ( ) ( ) 0 0 max , min . n n n x x x x Rx Rx = = C C 1 所 以 Remark ( ) Hermite Rayleigh n A Rx 定 理1 表明, 矩阵 的 最 大与 最小特 征 值 就 是它 的 商 在 上的最大 值与 最小值. C定理2 ( ) ( ) ( ) ( ) ( ) ( ) 12 12 21 2 1 11 Hermite max 0, 0m a x 0 , , , min 0, 0m i n 0 ,
29、, . nn n n H n H nn n A An Rx x qx R x x span q q Rx x qx R x x span q q = = = = = = C 设 是 矩阵, , 是 的 个 特征值,满足 ,则二、Hermite 矩阵特征值最大最小原理 定理3 ( ) ( ) ( ) ( ) ( ) ( ) 12 12 1 11 1 2 1 Hermite max 0, 0m a x 0 , , , , , , 1 ;min 0, 0m i n 0 , , nn n n H s sn s H r A An Rx x Px R x x span q q P q q sn Rx x
30、Px R x x span q q = = = = = = = C 设 是 矩阵, , 是 的 个 特征值,满足 ,则其中 ( ) ( ) 21 , , , , 1 . r rn P q q rn + = 其中 定理4 ( ) ( ) ( ) ( ) 1 2 1 2 Hermite m i n m a x , 0 , 0 , 1 , m a x m i n , 0 , 0 , 1 . ns n nr nn n nH s P nH r P A An Rx x x Px s n Rx x x Px r n = = = = C C C C C 1 设 是 矩 阵, 是 的 个 特征值 ,则 极小极大 上两式分别称为特征值的 原理 极大极 与特征值 的 小原理.