1、第三章 随机向量及其分布3.1 随机向量的概念及其分布函数3.2 二维离散型随机向量3.3 二维连续型随机向量3.4 二维随机向量函数的分布,许多随机试验的结果,需要用n(n2)个的随机变量X1,X2,Xn同时来描述,这n个的随机变量一起构成随机向量(二维或多维随机向量)。例如,一次射击的弹着点的平面坐标可看作是二维随机向量(X,Y);气象观测站观测每天某整点的天气状况,可将温度、湿度、风力和风向等观测值可看作多维随机向量(X1,X2,Xn);又如学生体检时的各项检查指标值可看作多维随机向量。由于同一个随机试验结果的各个随机变量之间一般有某种联系,因而需要把这些随机变量作为一个整体(即多维随机
2、向量)来研究。,需要讨论多维随机向量的各个随机变量分量,更需要研究这些分量与多维随机变量整体性质的联系。从几何角度看,一维随机变量就是第2章讨论的随机变量,它可看作是直线(一维空间)上的随机点;二维随机变量可看作是平面(二维空间)上的随机点;三维随机变量可看作三维空间中的随机点。由一维到多维的讨论会增添许多新问题,但二维与n维(n3)没有本质上的区别。本章由随机向量的联合分布与边缘分布的一般概念入手,然后重点讨论二维离散型和二维连续型随机向量的联合分布与边缘分布,最后介绍二维随机向量函数的分布。n(n3)维的情况可以类推。,3.1 随机向量的概念及其分布函数 3.1.1 随机向量的定义和联合分
3、布 定义 3.1.1 设(,F,P) 为概率空间,如果Xi为随机变量(i=1,2,n),则称向量(X1,X2,Xn)为随机向量。 说明随机向量(X1,X2,Xn)是基本事件空间到n维实数空间Rn的一个映射: 即随机向量是一个取向量值的随机变量的有序集合。也称随机向量为多维随机变量。随机向量的统计特性(分布规律)由随机向量的联合分布函数来刻画。,定义3.1.2 设(,F,P) 为概率空间,(X1,X2,Xn)为其上的随机向量,它的联合分布函数定义为说明:分布函数在点(x1, x2, xn)处的值是一个事件的概率,该事件由使得随机向量(X1(),X2(),Xn()落入以(x1, x2, xn)为顶
4、点的半无限区域(-,x1)(-,x2),(-,xn)的构成。以下定理说明了可用联合分布函数刻画随机向量的统计特性。,定理3.1.1 设(,F,P) 为概率空间,随机向量(X1,X2,Xn)的联合分布函数为 ,则,定理3.1.1的(1)(3)易于理解,对于(4)以n=2为例证明。,对任意两点(x1, x2), (x1+h1, x2+h2), x1x2, h10, h2 0,则 F(x1+h1, x2+h2)-F(x1+h1, x2)-F(x1, x2+h2)+F(x1, x2)0 说明随机点落在(阴影)矩形区域里的概率非负。,关于二维随机变(X,Y)的联合分布函数F(x,y)的说明:如果将二维随
5、机变量(X,Y)看成是平面上随机点的坐标,则分布函数F(x,y)在(x,y)处的函数值,就是随机点(X,Y)落在右图所示的以(x,y)为顶点而位于该点左下方的无穷矩形区域内的概率。,由此,可证明n阶差分定理3.1.1中的四条性质称为随机向量分布函数的特征性质。若有定义于Rn上的实函数满足上述四条性质,则能构造一个概率空间(,F,P)和其上的随机向量(X1,X2,Xn),使 定理3.1.1称为柯尔莫哥洛夫存在定理。,联合分布与边缘分布关系的讨论:柯尔莫哥洛夫存在定理告诉我们,随机向量(X1,X2,Xn)的联合分布函数 刻画了随机向量的整体统计特性。根据整体与各个分量的关系,随机向量每个分量的统计
6、特性也应当由其联合分布函数完全刻画。由于随机变量的具体取值是有限的,可由随机向量(n维随机变量)的联合分布函数唯一确定k维随机变量(1kn)的分布函数,称其为联合分布的(k维)边缘分布。,例如,若已知二维随机向量(X,Y)的联合分布函数F(x,y),则称随机变量X、Y各自的概率分布函数FX(x)、FY(y)为F(x,y)的(一维)边缘分布函数,且FX(x)=F(x,+), FY(y) =F(+,y) 由上述定义可知,FX(x)由F(x,y)中y+唯一确定, 同样FY(y)由F(x,y)中x+唯一确定。但其逆不一定成立。,同样,可由随机向量的联合分布得到各二维随机变量的边缘分布,如此外,由联合分
7、布函数的定义可知,联合分布函数具有对称性,即,联合分布函数性质的推广:,3.1.2 随机变量的独立性 定义3.1.3 设(,F,P) 为概率空间,X1,X2,Xn为其上的随机变量,如果定义3.1.4 (离散型与连续型随机向量定义)设(,F,P) 为概率空间,( X1,X2,Xn )为其上的随机向量。 (1) 若( X1,X2,Xn )取有限或可列无限个不同的值,则称之为离散型随机向量。,定理3.1.2 设(,F,P) 为概率空间,X1,X2,Xn为其上的随机变量,如果,(2) 若X1,X2,Xn都为连续型随机变量,联合密度函数为,定理3.1.2表明:离散型随机变量独立的充要条件是其联合分布等于
8、各边缘分布的乘积;连续型随机变量独立的充要条件是其联合概率密度等于各边缘概率密度的乘积。,3.2 二维离散型随机向量 3.2.1 二维离散型随机向量的联合分布列与边缘分布列若二维随机向量(X,Y)的所有不同的取值是有限对或可列无限多对, 则称(X,Y)是二维离散型随机向量。设二维离散型随机向量(X,Y)的取值为(xi , yj), (i , j1,2,),其联合分布律为P(X=xi,Y=yj)=pij , (i,j=1,2,),二维离散型随机向量(X,Y)的联合分布律满足如下两个条件:,边缘分布,边缘分布,例 袋中有五件产品,其中两件次品,三件正品,从袋中任意依次取出两件,每次取出的产品进行检
9、查后放回袋中,设每次取出产品时,袋中每件产品被取到的可能性相等,定义下列随机变量。求(X,Y)的分布律。,解 (X,Y)的分布律为(X,Y)的联合分布律为: pij= pipj (i, j = 0,1) X,Y相互独立。,例 上例中如果每次取出后不放回,求(X,Y)的分布律。 解 (X,Y)的分布律为这时(X,Y)的联合分布律为: 可见p11 p1 p1, 故X,Y不相互独立。,例3.2.1 已知一批10件产品中有3件一等品,5件二等品,2件三等品,现从这批产品中任意抽出4件,求其中一等品件数X与二等品件数Y的联合分布。 解 在任取的4件产品中,一等品件数X的取值范围:i=0, 1, 2, 3
10、;二等品件数Y的取值范围:j=0, 1, 2, 3, 4;三等品件数4-X-Y的取值范围:0,1,2; 即2X+Y4由于是任取4件,可按古典概型计算联合分布,具体计算结果如下:,例3.2.2(三项分布) 设随机试验只有A、B和C三个结果,各结果出现的概率分别为p、q和1-p-q。现将该随机试验独立地做n次,记X和Y分别是n次试验中A和B发生的次数,试求(X,Y)的联合分布与边缘分布。 解 X和Y可能的取值为0,1,2,。试验是独立的,按独立试验概型计算得,3.2.2 二维离散型随机向量的条件分布列设(X,Y)为二维离散型随机向量,其联合分布列为P(X=xi,Y=yj)=pij , i , j=
11、1,2,。 已知事件Y=bj发生条件下,X的分布列称为条件分布列。,例3.2.3 设(X,Y)的联合分布如下表所示。 (1)试求Y=1条件下,X的条件分布列。 (2)试求X=2条件下,Y的条件分布列。,例 在整数15中任取一数X, (1)取X后放回去再取另一数Y。 (2)取X后不放回去再取另一数Y。 在这两种情况下分别求(X,Y)的联合分布律PX,Y 、边缘分布律PX和PY以及条件分布律PX|Y=2。,3.3 二维连续型随机向量 3.3.1 二维连续型随机向量的联合概率密度函数及边缘概率密度函数对二维随机向量(X,Y),若存在函数f(x,y)0, (x,y)R2,使得(X,Y)的联合分布函数F
12、X,Y(x,y)是二元连续函数,且可表示为积分的形式:则称(X,Y)是二维连续型随机向量。 称被积函数f(x,y)为二维随机变量(X,Y)的联合概率密度。,联合分布函数与联合密度函数的性质及边缘概率密度函数定义:,=以任给平面区域D为底,密度曲面为顶的曲顶柱体体积 (二维连续随机向量落在区域D中的概率的几何意义) (5) X和Y的边缘概率密度函数定义为,说明:性质2表明介于空间曲面f(x,y)和xOy平面间的空间区域的体积为1。由性质3,在f(x,y)的连续点处有,例 设二维连续型随机变量(X,Y)的分布函数为F(x,y)=(A+Barctgx)(C+arctgy) (1) 求常数A,B,C;
13、 (2) 求(X,Y)的概率密度; (3) D=(x,y):x-y0,x1 ,求P(X,Y)D。 解 (1) 由二维分布函数性质,得,由以上三式解得(2) (X,Y)的概率密度(3),例3.3.1 已知二维随机向量(X,Y)的联合密度函数为(1) 试确定k的数值。 (2) 试求(X,Y)落在区域D=(x,y)|x2yx, 0x1的概率。 (3) 试问X与Y是否相互独立?,(2) (X,Y)落在区域D=(x,y)|x2yx,0x1的概率(3),例3.3.2 (二维均匀分布定义) 设D为平面上的一个有界区域,面积为SD。若随机向量(X,Y)的概率密度函数为则称(X,Y)服从D上的二维均匀分布。在几
14、何概型中,若(X,Y)为落点在D内的坐标,则(X,Y)服从D上的均匀分布。,例 设二维随机变量(X,Y)在区域D: 0x1,y2x内服从均匀分布,求联合概率密度函数。 解,例 设(X,Y)在椭圆 所围成的区域上服从均匀分布。即其联合概率密度为求X,Y的边缘概率密度X(x),Y(y),并证明它们不独立。 解 当xa时,,当xa时,,同理,可得关于Y的边缘密度,显然,(x,y)X(x)Y(y),由连续随机变量独立的充要条件知, X,Y不相互独立。,例3.3.3 在某一分钟内的任何时刻,信号进入收音机是等可能的。若收到的两个相互独立的信号的时间间隔小于0.5秒,则信号将相互干扰。求一分钟内两信号相互
15、干扰的概率。 解 把一分钟取作区间0, 1,设两信号进入收音机的时刻分别为X、Y(单位: 分钟)由于X和Y相互独立,所以(X,Y)的联合概率密度为,例3.3.4 (二维正态分布) 若随机向量(X,Y)的概率密度函数为则称(X,Y) 服从参数是的正态分布,记为,由(X,Y)的联合密度函数计算X和Y的边缘密度函数;并证明X与Y相互独立的充要条件是参数=0。,由此可见,二维正态分布的边缘分布是一维正态分布。但联合密度中的取不同数值时,得到不同的二维正态分布,而这些不同的二维正态分布却有相同的边缘密度X(x),Y(y)(即边缘密度与无关)。这表明,关于X,Y的边缘分布不能确定(X,Y)的联合分布;但联
16、合分布可以唯一地确定边缘分布。实际上,当X,Y 相互独立时,边缘分布可唯一地确定联合分布。,证X,Y独立的充分性 若=0,由有x,y=XxYy,即X,Y相互独立。,证X,Y独立的必要性 设X,Y相互独立,则对任意点(x,y),有fX,Yx,y = fXxfYy 取 x=1,y=2,有,是X与Y的相关系数,定义(n维正态分布(非退化情形) 设=(1, 2, ,n)T, 为n阶正定矩阵,记X=(x1,x2,xn)T, 若则称(X1, X2,Xn)T服从n维正态分布,记作XN(,)。实际上,对二维正态分布,3.3.2 二维连续型随机向量的条件概率密度函数设(X,Y)为二维连续型随机向量,其联合密度函
17、数和边缘密度函数分别为fX,Y(x,y),fX(x)和 fY(y)。若fX,Y(x,y) 和fY(y)连续,则对使 fY(y)0的点y,可定义在Y=y发生的条件下X的条件概率密度函数为对使 fX(x)0的点x,可定义在X=x发生的条件下Y的条件概率密度函数为,例 设(X,Y)的联合密度函数和边缘密度函数分别为,例 设X在区间(0,1)上服从均匀分布, 而当X=x(0x1)时,Y在(x,1)上服从均匀分布,试求: (1) (XY)的联合密度函数f(x,y); (2) 关于Y的边缘密度; (3) 概率P(X+Y1)。 解 X的密度函数为:Y的条件密度函数为:,(1) (2) Y的边缘密度 y0或y
18、1时,0y1时,,(3),3.4 二维随机向量函数的分布二维随机向量(XY)的函数Z=f(XY)一般也是随机向量,其分布的求取是不容易的。它涉及到随机向量的分布类型和函数的复杂程度。对离散型随机变量仅讨论其和函数的分布函数;对连续型随机变量则讨论其和、差、积、商等类函数的分布函数。 3.4.1 离散型随机向量的和函数的分布设离散随机向量(XY)的联合分布为则和函数ZXY的所有可能取值仍为非负数0,1,2,,其分布列为,例 已知XP(1),YP(2),且X,Y相互独立,求Z=X+Y的分布。 解 因为 XP(1),Y P(2)则Z=X+Y的取值为z=0,1,2,3,k,3.4.2 连续型随机变量函
19、数的分布若二维连续随机型向量(XY)的联合密度为fX,Y(x,y), 若随机变量(XY)的函数Zf(XY),可先求Z分布函数FZ(z),再确定Z的密度函数fZ(z)。 (式中的积分是由不等式f(x,y)z所确定的平面区域。),连续型随机变量和函数 Zf(XY)=X+Y的分布函数FZ(z)当XY为独立随机变量时,有,独立的连续型随机变量和函数 ZX+Y的概率密度函数:一般将积分 称为f(x)与g(x)的卷积,记作:卷积可交换,即 f(x)g(x)=g(x)f(x)。所以结论:两个独立的连续随机变量之和的概率密度是其边缘概率密度的卷积。,例 已知XY独立且同服从标准正态分布,求Z=X+Y的密度函数
20、。 解,一般有X1, X2独立且X1N(1,12), X2N(2,22), 则X1+X2 N( 1+ 2 , 12+ 22),即 = 1+ 2 , 2 = 12+ 22,独立的正态分布随机变量的线性函数仍服从正态分布。若X1 ,X2, Xn相互独立,且XiN(i,i2) (i=1,2,n),则 Z=X1 +X2+Xn N( 1+ 2+ n, 12+ 22+ n2 )更一般地,若X1 ,X2, Xn相互独立,且XiN(i,i2) (i=1,2,n),对线性函数Y=a1X1+a2X2+anXn+b,(n为有限值) ,仍有 YN(,2) 其中 =a1 1+a2 2+an n+b2=a1 12+a2
21、22+an n2,命题3.4.1 随机向量X=(X1,X2,Xn)T服从n维正态分布的充要条件是对任k=(k1,k2, , kn)T Rn, kTX服从一维正态分布。 命题3.4.1随机向量X=(X1,X2,Xn)T服从n维正态分布,期望向量为=(1, 2, , n)T ,协方差矩阵为,则对任意实矩阵Amn,有 AXN(A, AAT),连续型随机变量的差函数ZX-Y的分布函数FZ(z),连续型随机变量积的函数Z=XY的分布函数,连续型随机变量的商函数 的分布函数,M=max(X,Y)及N=min(X,Y)的分布设X,Y是相互独立的随机变量,其分布函数分别为FX(x)和FY(y),求M=max(
22、X,Y)及N=min(X,Y)的分布函数。由于M=max(X,Y)不大于z等价于X和Y都不大于z,故有PMz= PXz,Yz 又由于X和Y相互独立,得M=max(X,Y)的分布函数为Fmax(z)=PMz= PXz,Yz=PXz PYz 即 Fmax(z)= FX(x) FY(y)类似可求N=min(X,Y)的分布函数为Fmin(z)=PNz= 1-PNz=1-PXz,Yz=1-PXzPYz=1-1-PXz1-PYz 即 Fmin(z)= 1-1-FX(x)1-FY(y),将以上结果推广到n个独立的随机变量的情况:设X1,X2,Xn是n个相互独立的随机变量,其分布函数分别为,例 设系统L由两个
23、相互独立的子系统L1,L2分别按(1)串联,(2)并联,(3)备用(当系统L1损坏时,系统L2开始工作),如图所示。设L1,L2的寿命分别为X,Y,已知它们的概率密度分别为,解 (1)串联情况 由于L1,L2中有一个损坏时,系统L就停止工作,所以这时L的寿命为Z=min(X,Y) 由已知的密度函数,X,Y的分布函数分别为,(2)并联情况由于当且仅当L1,L2都损坏时,系统L才停止工作,所以这时L的寿命为Z=max(X,Y) 按Fmax=FX(z)FY(z),得Z=max(X,Y)的分布函数为,(3)备用情况由于这时系统L1损坏时系统L2才开始工作,因此整个系统L的寿命Z是L1, L2两者寿命之和,即Z=X+Y 按 ,当z大于0时, Z=X+Y的概率密度为,书面作业 (P65P68)3. 13. 23. 63. 83. 113. 133. 163. 19,