1、关于多维正态分布 (共7页) 关于多维正态分布 定义 设,是阶实对称正定方阵,称n维随机向量Rn n X服从正态分布(,N ) ,如果X有以下形式的联合概率密度函数 111() exp ( ) ( )2(2 ) det( )Xnfx x x =教材相关内容:第 180 页例 3.4.12。 2n= 的情形,第 141 页二元正态分布。 性质 1:(正态分布在可逆仿射变换下仍是正态分布) 设维随机向量n(,)XN ),A是n阶实数可逆方阵,。则Rnb (,YAXb A bAAN = + 。证明:注意到 1()x AYb=,1()x AYA b =, 2det( ) det( ) det( ) d
2、et( ) det( ) det( )AA A A A= = 所以, 11111() ()1( )|det |11exp ( ( ) ) ( ( ) )2|(2 ) det11exp ( )( ) ( )2(2 ) det( )YAXbXnnfy f yfAybAAyb AybAybA AA ybAAA+=1det|)故 (,YAXbNA bAA =+ + 。 教材相关内容:第 162 页例 3.3.9。 1关于多维正态分布 (共7页) 性质 2:(具有独立分量的正态分布随机向量,边缘分布) 设 111220,0XXNX = 2其中X是n维随机向量,1X是维随机向量,1n2X是维随机向量;,2
3、n Rini ii是阶实数矩阵,。则in 1, 2i =ii是对称正定矩阵,1X与2X独立,并且(, )iiiXN ,i。 1, 2=证明:1、易见是对称矩阵,ii 1, 2i =。 ()11 11111 1220000 0xxx x= 而且 当且仅当 。因此11110xx=10x =11 是对称正定矩阵。类似可证 是对称正定矩阵。 222、对 , 112200=自然有 11 1111 221220,detdetdet0 = 从而 121 1,12 12221111(, ) exp (, )2(2 ) det11exp2(2 ) detiXXniiiiniiixfxx xxxxx= 易见 11
4、1() exp , 1,2.2(2 ) detiiXi iiiniifx x x i= 从而 12 1 2,12 1 2(, ) () ()XX X Xf xx f x f x= 故1,2X X 独立,且 (, )iiXNi 。 2关于多维正态分布 (共7页) 性质 3: (正态分布随机向量的分量的独立化,正态分布的边缘分布仍是正态分布) 设 1112221,XXNX = 122其中X是n维随机向量,1X是维随机向量,1n2X是维随机向量;,2n Rini ij是n阶实数矩阵,i。记 ijn 1, 2=11122120YIY = 12X其中是阶单位矩阵。则 iIin1. 1,从而1Y和2Y独立
5、。 11112 21 11 1 22 21 11 120,0YN 2. (, )iiiXN ,1, 2i =。 证明:根据性质 1, 11 11221221111112111221 11 2 2 21 11 2 21 22 21112 21 11 1 22 21 11 12000,00,0YI XYII INII IN = = 由性质 2 知, 和 独立,并且1Y2Y11 11(, )XYN= 。用类似的办法可以证明22(,XN2) 。 注记: 这里使用的变量变换是从不独立(1,2X X2H可能不独立)到独立(构造出来的 是独立的),而对正态分布随机向量的分量,独立与不相关是等价的(性质3)
6、,而不相关相当于几何上的垂直(关于 空间上的内积) ,因此这本质上就是内积空间中向量组的 Gram-Schmidt 正交化过程。 这方法在教材第 141 页例3.1.7、第 149 页例 3.2.5、第 174 页例 3.4.9、第 189 页例 3.5.4 中都有体现。另外,这里得到的结论对应教材第 149 页例 3.2.5(二元正态的边缘分布) 。 12,YY3关于多维正态分布 (共7页) 性质 1 :(正态分布在非退化仿射变换下的不变性,性质 1 的一般形式) 设n维随机向量(,)XN ,A是mn阶实数方阵,rankA m=(即的行向量A是线性无关的),。则YARmb (,NA b )A
7、AXb = +。 证明:因为 是满行秩矩阵,所以 A mn 。如果 mn= ,则 是可逆矩阵,这时结论如 b 中形式。 A如果 ,则 的 个 维行向量线性无关,我们可以将它们扩充为 n维空间的一组基,也就是说存在mn 记 1n=null,A C= , 则A是n阶可逆矩阵,于是。 2CC=2CC AA= =令1(YAX )=,则由性质 1 知道 11 1111(,)(nYAXA NA A AA N = = 0,I) 其中 I 是 n阶单位矩阵。于是 的联合概率密度函数为 nY2111 1() exp exp222(2 )nY knkf yyy = = y, 因此 ,于是 .1,., (0,1)i
8、idnYY N()0kEY = ,1, ;Cov( , )0, .ijijYYij=,即 () 0EY = , IYn = , 因此,由数学期望和协方差矩阵的性质,得到 () ( ) ()EX EAY AEY =+=+=, XYAA AA = = =。 上述证明给出的构造过程叫做正态分布的标准化过程(我们称 为 n维标准正态分布) 。 (0,I )nN教材相关内容:有了协方差矩阵就可以很容易地得到相关系数,对 的情形, 2n=5关于多维正态分布 (共7页) 211212 2 =, 所以 ( )2VariiX =,12 1Cov( , )XX2=, 从而 1212 1 2,1212Cov( ,
9、)Var VarX XXXXX= =是12,X X 的相关系数,这就是教材第 174 页例 3.4.9 的结论。 教材第 180 页例 3.4.12 中定义多维正态分布时,数学期望向量和协方差矩阵的说法本不应该写在定义的叙述中,因为它们是概率密度函数的自然推论。 性质 5:(对正态分布随机向量的分量,独立性与不相关性等价) 设 1112221,XXNX = 122其中X是n维随机向量,1X是维随机向量,1n2X是维随机向量;,2n Rini ij是n阶实数矩阵,i。则ijn 1, 2=1X与2X独立当且仅当12 210 = =; 证明:充分性就是性质 2。下证必要性。因1X 与2X 独立,所以
10、1X 的任何分量 U与2X 的任何分量 V 独立,于是 Cov( , )UV 0= ,而根据性质 4, 是 X 的协方差矩阵, 的元素是12 21=1X 的分量与2X 的分量的协方差,因此 。 12 210=教材相关内容:第 178 页性质 3.4.13。 6关于多维正态分布 (共7页) 性质 6:(正态分布的条件分布仍是正态分布) 设 。 1111222212,XXNX = 则 1. 在已知11X x=发生的条件下,2X的条件概率分布是正态分布 112 2111 1 1 2 2111 12(),Nx+ ) 2. 2X关于1X的线性回归与非线性回归相同:)EX121 2 211 1 1(|)
11、(X X =+ 。证明:由性质 3,我们知道 与12 2 21 11 1YX X=1YX1= 独立,并且 2 2 21 11 1 22 21 11 12(,YN) 于是在已知11X x= 的条件下,1222111X Y=+x2, X 的条件概率分布就是的概率分布,根据性质 1, 的分布是正态分布 12211Y+ 1x12211Y+ 1)1x, 112 2111 1 1 2 2111 12(),Nx+ 这就是在已知1X x= 的条件下2X 的条件概率分布。再有性质 4 知,这个条件分布的数学期望为 12 1 1 2 21 11 1 1(| ) (EX X x x ) =+ 。 由于它关于1x 是
12、一次的,所以这即是线性回归又是非线性回归。 教材相关内容:第 189 页例 3.5.4。第 193 页第 13 行的公式。 7关于多维正态分布 (共7页) 教材第 162 页例 3.3.9 设X与Y独立同分布,都服从正态分布2(, )N 。记 ,.UXYVXY= += 试求(,的联合密度函数,问U和V是否独立? )UV解:由于X与Y独立,都服从正态分布2(, )N ,所以 220,0XNY 由于 1111UXVY = 所以,由性质1, 2211 11 11 202,11 11 11 000UNNV = 02再根据性质2,U和V独立,2(2 ,2 )UN ,2(0,2 )VN 。 教材第 141
13、 页例 3.1.7 设二维随机变量22121 2(,) (,XY N ) ,求(,)X Y落在区域 22211221212() ()( )( )(, ): 2xxyyDxy = + 内的概率。 解:由已知 21 11222 12 2,XNY 我们先将X与Y进行标准化(使期望为0,方差为1),考虑变换 1122,.XUYV=即11122 21010UXVY =+ 8关于多维正态分布 (共7页) 所以,由性质1, 12111 11 11222 2 12 222200,01,01UNVN + = 20而 2222 211221212()()()()XXYYUUVV2 +=+ 进一步考虑变换 2211101Z UWV = 则 222 2221011101,11 11101 011010,001ZNWN = 所以,Z与W独立,都服从正态分布。而 (0,1)N122211110101UZVW = ZW, 所以 ( ) ( )()2222 222 221 11( )U UVV ZW ZWWWZW+=+ += +2, 于是所求概率为 9关于多维正态分布 (共7页) 222222222222222221212002(1 )02(1 )121121zwzwruP Z W e dzdwdeee+ + =dr10