1、第三章 多维随机变量及其分布,3.1 二维随机变量,到现在为止,我们只讨论了一维随机变量及其分布。 但有些随机现象用一个随机变量来描述还不够,而需要用几个随机变量来描述。,在射箭时,命中点的位置是由一对坐标( X, Y )来确定的。,飞机的重心在空中的位置是由三个随机变量( X,Y,Z )来确定的。,一般地,我们称n个随机变量的整体 X = (X1 , X2 , ,Xn ) 为n 维随机变量或随机向量。以下重点讨论二维随机变量。,请注意与一维情形的对照 。,设是随机试验E的样本空间, 若,定义,则称 ( X1, X2,Xn )为n维随机向量或n维随机变量。,设( X , Y )是二维随机向量,
2、 对于任意2个实数 x , y 二元函数:,定义,称为二维随机变量( X , Y )的分布函数。,( x, y),( X , Y ),基本性质,单调性 F(x , y )是 x , y 的不减函数。,有界性,右连续性 F( x , y ) 关于x , y 均右连续。,非负性,D,二维离散型随机变量的联合分布列,设二维离散型随机变量( X , Y )所有可能取到的值为:,可用如下表格表示:,例 1 X 在 1, 2, 3, 4 中等可能取一个值,Y 在 1 X 中等可能取一个整数值,试求 ( X , Y ) 的分布律。,解: X=i , Y=j 中 i= 1, 2, 3, 4 j 取不大于 i
3、的整数。,列表如下:,1/4,二维连续型随机变量的联合密度函数,对于二维连续型随机变量( X , Y )的分布函数F( x, y ) 如果存在非负可积函数 f ( x, y ) ,对于任意 x , y 有:,则称 ( X , Y ) 是二维连续型随机变量,f( x, y ) 称为二维随机变量( X , Y ) 的概率密度或随机变量 X 和 Y 的联合概率密度。,( X, Y ),几何意义,z = f ( x, y ),基本性质,( X , Y ),若 f ( x , y ) 在 ( x , y ) 处连续,则有:,以上关于二维随机变量的讨论,可以容易地推广到 n ( n 2 )维随机变量的情况
4、。,例2 设二维连续型随机变量( X , Y )具有概率密度为:,求常数 k ;,求 F( x , y ) ;,求 P X Y ,求常数 k ;,解:,求 F( x , y ) ;,求 P X Y ,x=y,x=0,下面我们介绍几个常见的多维分布。,进行n次独立重复试验,每次试验有r个结果:A1, A2, Ar ,且每次试验中P( Ai ) = pi , i=1,2, ,r p1 +p2 +pr =1 记 Xi 为n次独立重复试验中Ai出现的次数,i=1,2, ,r 则 ( X1 , X2 , ,Xr ) 取值 ( n1 , n2 , ,nr ) 的概率为(其中n1 +n2 +nr =n):,
5、称 ( X1 , X2 , ,Xr ) 服从多项分布.,多项分布,设D是 Rn 上的有界区域,其度量为SD.若多维随机变量( X1 , X2 , ,Xn )具有概率密度,则称( X1 , X2 , ,Xn )在D上服从均匀分布.,多维均匀分布,设G是平面上的有界区域,其面积为A.若二维随机变量(X , Y )具有概率密度,则称( X, Y )在G上服从均匀分布.,二维均匀分布,若二维随机变量( X,Y )具有概率密度:,二维正态分布,记作( X, Y )N ( ),核心:,等高线 :,二维正态,3.2 边际分布与随机变量的独立性,( X ,Y ) 的分布 已知,X 的分布 FX ( x ) =
6、 ?,Y 的分布 FY ( y ) = ?,称 FX( x ) ,FY( y ) 为 ( X,Y ) 的边缘分布函数。,F( x , y ),F( x , y ) 已知,同理:,二维离散型随机变量的边际分布列,对 ( X , Y ) 已知:,问:对 X,对 Y,例 3 试求例 1中 X , Y 的边缘分布律。,解:,二维连续型随机变量的边际密度函数,对 ( X , Y ) 已知 f ( x , y ),问:对 X fX( x ) = ?,对 Y fY( y ) = ?,例2 设 ( X,Y ) 的概率密度为:,求 (1) c的值;,(2)两个边缘密度。,解:(1),=5c/24=1,c =24
7、 /5,解: ( 2 ),解: ( 2 ),例3 多项分布的边际分布仍为多项分布,设 ( X, Y ) 是离散型随机变量,服从 M( n, p1 , p2 ) 即:,所以, X b ( n, p1 ) ;,同理, Y b ( n, p2 ) 。,二维正态分布,的两个边缘密度仍是正态分布:,设 X, Y 是两个 随机变量 ,若对任意的 x, y 有,则称 X, Y 相互独立 。,两事件 A, B 独立: 若 P(AB) = P(A) P(B),随机变量的相互独立性,若 ( X, Y ) 是离散型随机变量,则上述独立性的定义等价于:,则称 X 和 Y 相互独立.,对 ( X, Y ) 的所有可能取
8、值 ( xi , yj ), 有:,若 (X,Y)是连续型随机变量 ,则上述独立性的定义等价于:,几乎处处成立,则 称 X,Y 相互独立 .,对任意的 x, y, 有,解:,x0,y 0,即:,即:对一切x, y, 均有:,故 X, Y 独立,解:,解:,所以,X,Y 不独立。,因为 fX( x )fY( y ) f ( x, y ),3.3 多维随机变量函数的分布,设 X 和 Y 的联合密度为 f (x,y), 求 Z = X + Y 的密度,一、Z=X+Y 的分布,方法: 分布函数法,FZ(z)=P(Zz)=,P(X+Y z),D = (x, y): x+y z ,z = x + y,FZ
9、(z)=,由X和Y的对称性, fZ (z)又可写成,特别,当X和Y独立,设(X,Y)关于X,Y的边缘密度分别为fX(x) , fY(y) , 则上述两式化为:,这两个公式称为卷积公式。,例1 若X和Y 独立,具有共同的概率密度,求 Z=X+Y的概率密度 。,解: 由卷积公式,解法1:,解法2:,=z,=2-z,二、Z1=max X,Y , Z2=min X,Y 的分布,设 X, Y 独立,概率密度函数分别为 fX(x), fY(y),一般地, Z1=max X1 , X2 , Xn , Z2=min X1 , X2 , Xn 。,例4 设系统L由两个相互独立的子系统L1,L2联接而成,联接的方
10、式分别为: 1.串联, 2. 并联, 3. 备用。 如图所示:,设L1,L2的寿命分别为X,Y,已知它们的概率密度分别为:,解: (i)串联,L1,L2中有一个损坏,系统L就停止工作,所以这时L的寿命为:,X,Y的分布函数分别为:,故得Z= min (X , Y ) 的分布函数为:,于是Z=min (X , Y ) 的分布函数为:,于是Z=min (X , Y ) 的概率密度为:,解 (ii)并联,当且仅当L1,L2都损坏时,系统L才停止工作,所以这时L的寿命为:,Z= max ( X , Y ) 的分布函数为:,Z = max (X , Y ) 的概率密度为:,解 (iii)备用,当系统L1
11、损坏时系统L2才开始工作,因此整个系统L的寿命Z为 L1,L2两者寿命之和,即:,z0,(i)串联时,(ii)并联时,(iii)备用时,3.4 多维随机变量的数字特征,设 Z 是连续型随机变量 X, Y 的函数 Z = g( X,Y ),(g 为连续函数),则有:,设 Z 是离散型型随机变量 X, Y 的函数 Z = g( X,Y ),(g 为连续函数),则有:,3.4.1 多维随机变量函数的数学期望,例 设随机变量 ( X , Y )的概率密度为:,解:,3.4.2 期望与方差的基本性质,E ( X1+X2 ) = E ( X1 ) + E ( X2 ),设 X、Y 独立,则 E ( XY
12、) = E (X) E (Y),若X1与X2 独立,则:D ( X1 + X2 ) = D ( X1 ) + D ( X2 ),D ( X1 X2 ) = E ( X1 X2 )2 E ( X1 X2 ),= E ( X1 X2 )2 ( E X1 E X2 ),前面我们介绍了随机变量的数学期望和方差,对于多维随机变量,反映分量之间关系的数字特征中,最重要的,就是,协方差和相关系数,1.定义:任意两个随机变量X和Y的协方差,记为Cov ( X, Y ) , 定义为 :,Cov( X, Y )= E ( X-EX ) ( Y - EY ) ,2.简单性质, Cov ( X,Y ) = Cov (
13、 Y, X ), Cov(aX,bY) = ab Cov(X,Y) a,b是常数, Cov(X1+X2, Y )= Cov( X1,Y ) + Cov( X2,Y ),协方差,3. 计算协方差的一个简单公式,由协方差的定义及期望的性质,可得,Cov ( X,Y )=E ( X-EX)(Y- EY ) ,=E(XY)-E(X)E(Y)-E(Y)E(X)+E(X)E(Y),=E(XY)-E(X)E(Y),即,Cov ( X, Y ) = E(XY) -EX EY,可见,若 X 与 Y 独立, Cov(X,Y)= 0 .,4. 随机变量和的方差与协方差的关系,= DX+DY+ 2Cov( X, Y
14、),若 X1, X2, , Xn 两两独立,,上式化为:,一般地,,协方差的大小在一定程度上反映了X和Y相互间的关系,但它还受X与Y本身度量单位的影响. 例如:,Cov(kX, kY)=k2Cov(X,Y),为了克服这一缺点,对协方差进行标准化,这就引入了相关系数 。,为随机变量X和Y的相关系数 。,在不致引起混淆时,记 为 。,相关系数,引理3.4.1 Schwarz 不等式,对二维随机变量 ( X , Y ),若方差DX,DY 存在,则:,证明: 令,性质3.4.11,性质3.4.12,X和Y独立时, =0,但其逆不真.,由于当 X 和 Y 独立时,Cov ( X,Y ) = 0.,= 0
15、,例1 设X服从(-1/2, 1/2)内的均匀分布,而Y = cos X,因而 =0 ,,即 X 和Y 不相关 .,但 Y 与 X 有严格的函数关系,即 X 和 Y 不独立。,= 0,相关系数刻划了X和Y间“线性相关”的程度.,相关系数的直观意义,X Y =0 称 X,Y 不相关,以下几个命题等价:,Cov( X, Y )=0 ;,D( X+Y )=DX+DY ;,E(XY )=EXEY ;,X Y =0 ;,X,Y 不相关 。,前面,我们已经看到:,若X与Y独立,则X与Y不相关,但由 X 与 Y 不相关,不一定能推出 X 与Y 独立。,但对下述情形,独立与不相关等价,协方差矩阵的定义,将二维
16、随机变量(X1, X2)的四个二阶中心矩,排成矩阵的形式:,称此矩阵为(X1, X2)的协方差矩阵。,三、 协方差矩阵,类似定义n维随机变量 ( X1, X2, , Xn ) 的协方差矩阵:,称矩阵:,为 ( X1, X2, , Xn ) 的协方差矩阵。,下面给出n维正态分布的概率密度的定义.,设 = ( X1, X2, , Xn ) 是一个n维随机向量,若它的概率密度为:,f ( x1, x2, ,xn ),则称 X 服从n元正态分布。,其中C是( X1, X2, ,Xn ) 的协方差矩阵。,|C|是它的行列式, 表示C的逆矩阵,,X 和 是n维列向量, 表示 X 的转置。,n元正态分布的几
17、条重要性质,1. X=(X1,X2, ,Xn)服从n元正态分布,2. 若 X = ( X1, X2, , Xn ) 服从n元正态分布,,Y1, Y2, , Yk 是 Xj(j=1,2,n)的线性函数,,则( Y1,Y2, , Yk )也服从多元正态分布.,这一性质称为正态变量的线性变换不变性。,3. 设 ( X1, X2, , Xn ) 服从n元正态分布,则,“ X1, X2, , Xn 相互独立 ”,等价于,“ X1, X2, , Xn 两两不相关”,例2 设随机变量X和Y相互独立且 X N( 1, 2 ), Y N( 0 , 1 ) 。试求 Z=2X-Y+3 的概率密度。,解: XN(1,
18、2),YN(0,1),且X与Y独立,故X和Y的联合分布为正态分布,X和Y的任意线性组合是正态分布。,即 : Z N ( * , * ),EZ = 2EX-EY+3 = 2+3 = 5,DZ = 4DX+DY = 8+1 = 9,Z N( 5, 32 ),3.5 条件分布与条件期望,推广到随机变量,设有两个随机变量 X, Y 。 在给定Y 取某个或某些值的条件下,求X 的概率分布。,这个分布就是条件分布.,3.5.1 条件分布,例如,考虑某大学的全体学生,从其中随机抽取一个学生,分别以X和Y 表示其体重和身高。则X和Y都是随机变量,它们都有一定的概率分布。,现在若限制1.7Y1.8(米), 在这
19、个条件下去求X的条件分布,这就意味着要从该校的学生中把身高在1.7米和1.8米之间的那些人都挑出来,然后在挑出的学生中求其体重的分布.,容易想象,这个分布与不加这个条件时的分布会很不一样.,一、离散型r.v的条件分布,定义1: 设 (X,Y) 是二维离散型随机变量,对于固定的 j,若P(Y=yj)0,则称:,P( X=xi | Y =yj ) =,i=1,2, ,为在 Y=yj 条件下随机变量X的条件概率函数。,条件分布是一种概率分布,它具有概率分布的一切性质. 正如条件概率是一种概率,具有概率的一切性质.,i = 1,2, ,例如:,例1 一射手进行射击,击中目标的概率为 p,(0p1),
20、射击进行到击中目标两次为 止。以 X 表示首次击中目标所进行的射击次数,以 Y 表示总共进行的射击次数。试求 X 和 Y 的联合分布及条件分布.,P X=m , Y=n =,n=2, 3, ; m =1,2, , n-1,解:1),2) 为求条件分布,先求边缘分布:,m = 1,2, ,n=2,3, ,于是可求得:,当 n =2, 3, 时,,m = 1, 2, , n-1,n=m+1,m+2, ,当 m =1, 2, 时,,二、连续型r.v的条件分布,设(X,Y)是二维连续型 r.v,由于对任意 x, y, P X=x = 0, P Y=y = 0 ,所以不能直接用条件概率公式得到条件分布,下面我们直接给出条件概率密度的定义。,同样,对一切使 的 y, 定义已知 Y=y下,X的条件密度函数 :,定义的含义:,例2 设(X,Y)的概率密度为:,求 P X1|Y=y ,为此, 需求出,对y0,对y0,P X1| Y=y ,例3 设( X, Y )服从单位圆上的均匀分布,概率密度为:,求,解:,当|x|1时,有,前面,我们已经知道,二维正态分布的两个边缘密度仍是正态分布。,可以证明,对二维正态分布,已知 X=x下,Y 的条件分布,或者已知 Y = y下,X 的条件分布都仍是正态分布。,再看,二维正态分布,课 间 休 息,