1、,在第一章中,我们介绍了条件概率的概念 .,在事件B发生的条件下事件A发生的条件概率,推广到随机变量,设有两个r.v X,Y , 在给定Y取某个或某些值的条件下,求X的概率分布.,这个分布就是条件分布.,条件分布,第二讲 条件分布与随机变量的独立性,例如,考虑某大学的全体学生,从其中随机抽取一个学生,分别以X和Y 表示其体重和身高 . 则X和Y都是随机变量,它们都有一定的概率分布.,体重X,身高Y,体重X 的分布,身高Y 的分布,现在若限制1.7Y1.8(米), 在这个条件下去求X的条件分布,这就意味着要从该校的学生中把身高在1.7米和1.8米之间的那些人都挑出来,然后在挑出的学生中求其体重的
2、分布.,容易想象,这个分布与不加这个条件时的分布会很不一样.,例如,在条件分布中体重取大值的概率会显著增加 .,一、离散型r.v的条件分布列,实际上是第二章讲过的条件概率概念在另一种形式下的重复.,定义1 设 (X,Y) 是二维离散型随机变量,对于固定的 j,若P(Y=yj)0,则称,为在Y=yj条件下随机变量X的条件分布列.,类似定义在X=xi条件下 随机变量Y 的条件分布列.,作为条件的那个r.v,认为取值是 给定的,在此条件下求另一r.v的 概率分布.,条件分布列是一种概率分布列,它具有概率分布列的一切性质. 正如条件概率是一种概率,具有概率的一切性质.,例如:,i=1,2, ,例1 一
3、射手进行射击,击中目标的概率为 p,(0p1), 射击进行到击中目标两次为 止. 以X 表示首次击中目标所进行的射击次数,以Y 表示总共进行的射击次数. 试求X 和Y的联合分布列及条件分布列.,解:依题意,Y=n 表示在第n次射击时击中目标,且在前n-1次射击中有一次击中目标.,X=m表示首次击中目标时射击了m次,n=2,3, ; m=1,2, , n-1,由此得X和Y的联合分布列为,不论m(mn)是多少,P(X=m,Y=n)都应等于,每次击中目标的概率为 p,P(X=m,Y=n)=?,为求条件分布,先求边缘分布.,X的边缘分布列是:,m=1,2, ,Y的边缘分布列是:,n=2,3, ,于是可
4、求得:,当n=2,3, 时,,m=1,2, ,n-1,联合分布列,边缘分布列,n=m+1,m+2, ,当m=1,2, 时,,二、连续型r.v的条件分布,设(X,Y)是二维连续型r.v,由于对任意 x, y, P(X=x)=0, P(Y=y)=0 ,所以不能直接用条件概率公式得到条件分布,下面我们直接给出条件概率密度的定义.,同样,对一切使 的 y, 定义,为已知 Y=y下,X的条件密度函数 .,我们来解释一下定义的含义:,将上式左边乘以 dx , 右边乘以 (dx dy)/dy即得,运用条件概率密度,我们可以在已知某一随机变量值的条件下,定义与另一随机变量有关的事件的条件概率.,定义在已知 Y
5、=y下,X的条件分布函数为,特别,取,即: 若(X,Y)是连续型r.v, 则对任一集合A,,求 P(X1|Y=y),例2 设(X,Y)的概率密度是,为此, 需求出,由于,于是对y0,故对y0,P(X1|Y=y),例3 设(X,Y)服从单位圆上的均匀分布,概率 密度为,求,解:X的边缘密度为,当|x|1时,有,例4 设r.vX在区间(0,1)均匀分布,当观察到 X=x(0x1)时,r.vY在区间(x,1)上均匀分布. 求Y 的概率密度.,解:依题意,X具有概率密度,对于任意给定的值x(0x1),在X=x的条件下,Y的条件概率密度为,X和Y的联合密度为,于是得Y的概率密度为,已知边缘密度、 条件密
6、度,求 联合密度,我们已经知道,,由条件密度的定义:,可知,当X与Y相互独立时,,也可用此条件判别二维连续型r.v(X,Y)的两个分量X与Y是否相互独立.,对离散型r.v有类似的结论,请同学们 自行给出.,随机变量的独立性是概率论中的一个重要概念,两事件A,B独立的定义是: 若P(AB)=P(A)P(B) 则称事件A,B独立 .,两随机变量独立的定义是:,它表明,两个r.v相互独立时,它们的联合 分布函数等于两个边缘分布函数的乘积 .,若 (X,Y)是连续型r.v ,则上述独立性的定义等价于:,若 (X,Y)是离散型r.v ,则上述独立性的定义等价于:,解:,x0,即:,对一切x, y, 均有
7、:故X,Y 独立,y 0,解:,0x1,0y1,由于存在面积不为0的区域,,故X和Y不独立 .,例2 甲乙两人约定中午12时30分在某地会面.如果甲来到的时间在12:15到12:45之间是均匀分布. 乙独立地到达,而且到达时间在12:00到13:00之间是均匀分布. 试求先到的人等待另一人到达的时间不超过5分钟的概率. 又甲先到的概率是多少?,设X为甲到达时刻,Y为乙到达时刻,以12时为起点,以分为单位,依题意,XU(15,45), YU(0,60),解:,所求为P( |X-Y | 5) 及P(XY),甲先到 的概率,由独立性,先到的人等待另一人 到达的时间不超过5分钟 的概率,解一:,P(|
8、 X-Y| 5),=P( -5 X -Y 5),=1/6,=1/2,P(XY),解二:,P(X Y),=1/6,=1/2,被积函数为常数, 直接求面积,=P(X Y),P(| X-Y| 5),类似的问题如:,甲、乙两船同日欲靠同一码头,设两船各自独立地到达,并且每艘船在一昼夜间到达是等可能的 . 若甲船需停泊1小时,乙船需停泊2小时,而该码头只能停泊一艘船,试求其中一艘船要等待码头空出的概率.,在某一分钟的任何时刻,信号进入收音机是等可能的. 若收到两个互相独立的这种信号的时间间隔小于0.5秒,则信号将产生互相干扰. 求发生两信号互相干扰的概率.,把长度为a的线段在任意两点折断成为三线段,求它
9、们可以构成三角形的概率.,随机变量独立性的概念不难推广到两个以上r.v的情形.,1. 分布函数,称为 的分布函数。,2. 概率密度,则称 为连续型随机变量,称为n维随机变量的概率密度。,3. n个随机变量的独立性,则称 是相互独立的。,对连续型随机变量,设 的概率 密度分别为 ,则相互独立的充要条件是:,定理1 若连续型随机向量(X1, ,Xn)的概率密度函数f(x1, ,xn)可表示为n个函数g1, ,gn之积,其中gi只依赖于xi,即 f(x1, ,xn)= g1(x1) gn(xn) 则X1, ,Xn相互独立,且Xi的边缘密度fi(xi)与gi(xi)只相差一个常数因子.,最后我们给出有
10、关独立性的两个结果:,这一讲,我们介绍了条件分布与随机变量独立性的概念和计算,并举例说明对离散型和连续型随机变量如何计算条件分布及判断随机变量是否独立. 请课下通过练习进一步掌握.,第三讲 二维随机变量函数的分布,在第三章中,我们讨论了一维随机变量函数 Y=g(X)的分布,现在我们进一步讨论二维随机变 量函数Z=g(X, Y)的分布。具体说,已知( X, Y )的分布,求Z=g(X, Y) 的分布。,例1 若X、Y独立,P(X=k)=ak , k=0,1,2, P(Y=k)=bk , k=0,1,2, ,求Z=X+Y的分布列.,解:,=a0br+a1br-1+arb0,由独立性,此即离散 卷积
11、公式,r=0,1,2, ,. 离散型随机变量和的分布Z=X+Y,依题意,由卷积公式,i=0,1,2,j=0,1,2,解:,由卷积公式,即Z服从参数为 的泊松分布.,r =0,1,,例3 设X和Y相互独立,XB(n1,p),YB(n2,p),求Z=X+Y 的分布.,回忆第二章对服从二项分布的随机变量所作的直观解释:,我们给出不需要计算的另一种证法:,同样,Y是在n2次独立重复试验中事件A出现 的次数,每次试验中A出现的概率为p.,若X B(n1,p),则X 是在n1次独立重复试验中事件A出现的次数,每次试验中A出现的概率都为p.,故Z=X+Y 是在n1+n2次独立重复试验中事件A出现的次数,每次
12、试验中A出现的概率为p,于是Z是以(n1+n2,p)为参数的二项随机变量,即Z B(n1+n2, p).,例4 设X和Y的联合密度为 f (x,y),求Z=X+Y的概率密度.,解: Z=X+Y的分布函数是:FZ(z)=P(Zz)=P(X+Y z),这里积分区域D=(x, y): x+y z 是直线x+y =z 左下方的半平面.,二. 连续性随机变量和的分布Z=X+Y,化成累次积分,得,固定z和y,对方括号内的积分作变量代换, 令x=u-y,得,变量代换,交换积分次序,由概率密度与分布函数的关系, 即得Z=X+Y的概率密度为:,由X和Y的对称性, fZ (z)又可写成,以上两式即是两个随机变量和
13、的概率密度的一般公式.,特别,当X和Y独立,设(X,Y)关于X,Y的边缘密度分别为fX(x) , fY(y) , 则上述两式化为:,这两个公式称为卷积公式 .,下面我们用卷积公式来求Z=X+Y的概率密度,为确定积分限,先找出使被积函数不为0的区域,解: 由卷积公式,也即,为确定积分限,先找出使被积函数不为0的区域,如图示:,也即,于是,教材上例4 请自已看. 注意此例的结论:,此结论可以推广到n个独立随机变量之和的情形,请自行写出结论.,有限个独立正态变量的线性组合仍然服从正态分布.,更一般地, 可以证明:,下面介绍求Z=g( X, Y ) 概率密度的通用方法,分布函数法:设( X, Y )是
14、二维随机变量,其概率密度为f(x, y), Z=g(X,Y)。为求Z的密度 ,设Z的分布函数为,则,例7. 设XN(0,2),Y N(0,2),且相互独立,求 的分布函数。,解:,此分布称为瑞利分布。,三、M=max(X,Y)及N=min(X,Y)的分布,设X,Y是两个相互独立的随机变量,它们的分布函数分别为FX(x)和FY(y),我们来求M=max(X,Y)及N=min(X,Y)的分布函数.,又由于X和Y 相互独立,于是得到M=max(X,Y)的分布函数为:,即有 FM(z)= FX(z)FY(z),FM(z)=P(Mz),=P(Xz)P(Yz),=P(Xz,Yz),由于M=max(X,Y)
15、不大于z等价于X和Y都不大于z,故有,分析:,P(Mz)=P(Xz,Yz),类似地,可得N=min(X,Y)的分布函数是,下面进行推广:,即有 FN(z)= 1-1-FX(z)1-FY(z),=1-P(Xz,Yz),FN(z)=P(Nz),=1-P(Nz),=1- P(Xz)P(Yz),设X1,Xn是n个相互独立的随机变量,它们的分布函数分别为,我们来求 M=max(X1,Xn)和N=min(X1,Xn)的分布函数.,(i =0,1,, n),用与二维时完全类似的方法,可得,特别,当X1,Xn相互独立且具有相同分布函数F(x)时,有,N=min(X1,Xn)的分布函数是,M=max(X1,Xn
16、)的分布函数为:,FM(z)=F(z) n FN(z)=1-1-F(z) n,若X1,Xn是连续型随机变量,在求得M=max(X1,Xn)和N=min(X1,Xn)的分布函数后,不难求得M和N的密度函数.,留作课下练习.,当X1,Xn相互独立且具有相同分布函数F(x)时,有,FM(z)=F(z) n FN(z)=1-1-F(z) n,需要指出的是,当X1,Xn相互独立且具有相同分布函数F(x)时, 常称,M=max(X1,Xn),N=min(X1,Xn),为极值 .,由于一些灾害性的自然现象,如地震、洪水等等都是极值,研究极值分布具有重要的意义和实用价值.,下面我们再举一例,说明当X1,X2为
17、离散型r.v时,如何求Y=max(X1,X2)的分布.,那么要问,若我们需要求Y=min(X1,X2)的分布,应如何分析?,留作课下思考,这一讲,我们介绍了如何求r.v函数的分布.但有时我们无法精确求出此分布.,当这个积分无法精确求出时,一个可取的方法是采用计算机模拟.,例如,想求两个独立连续型r.v 之和X+Y的分布函数. X的分布函数为F,Y的分布函数为G,在理论上,可以求得:,其中f (x)是 X 的密度函数.,这一讲,我们介绍了求随机向量函数的分布的原理和方法,需重点掌握的是:,请通过练习熟练掌握.,1、已知两个随机变量的联合概率分布,会求其函数的概率分布; 2、会根据多个独立随机变量
18、的概率分布求其函数的概率分布,在第二章中,我们介绍了条件概率的概念 .,在事件B发生的条件下事件A发生的条件概率,推广到随机变量,设有两个r.v X,Y , 在给定Y取某个或某些值的条件下,求X的概率分布.,这个分布就是条件分布.,第六讲 条件分布,例如,考虑某大学的全体学生,从其中随机抽取一个学生,分别以X和Y 表示其体重和身高 . 则X和Y都是随机变量,它们都有一定的概率分布.,体重X,身高Y,体重X 的分布,身高Y 的分布,现在若限制1.7Y1.8(米), 在这个条件下去求X的条件分布,这就意味着要从该校的学生中把身高在1.7米和1.8米之间的那些人都挑出来,然后在挑出的学生中求其体重的
19、分布.,容易想象,这个分布与不加这个条件时的分布会很不一样.,例如,在条件分布中体重取大值的概率会显著增加 .,一、离散型r.v的条件分布列,实际上是第二章讲过的条件概率概念在另一种形式下的重复.,定义1 设 (X,Y) 是二维离散型随机变量,对于固定的 j,若P(Y=yj)0,则称,为在Y=yj条件下随机变量X的条件分布列.,类似定义在X=xi条件下 随机变量Y 的条件分布列.,作为条件的那个r.v,认为取值是 给定的,在此条件下求另一r.v的 概率分布.,条件分布列是一种概率分布列,它具有概率分布列的一切性质. 正如条件概率是一种概率,具有概率的一切性质.,例如:,i=1,2, ,例1 一
20、射手进行射击,击中目标的概率为 p,(0p1), 射击进行到击中目标两次为 止. 以X 表示首次击中目标所进行的射击次数,以Y 表示总共进行的射击次数. 试求X 和Y的联合分布列及条件分布列.,解:依题意,Y=n 表示在第n次射击时击中目标,且在前n-1次射击中有一次击中目标.,X=m表示首次击中目标时射击了m次,n=2,3, ; m=1,2, , n-1,由此得X和Y的联合分布列为,不论m(mn)是多少,P(X=m,Y=n)都应等于,每次击中目标的概率为 p,P(X=m,Y=n)=?,为求条件分布,先求边缘分布.,X的边缘分布列是:,m=1,2, ,Y的边缘分布列是:,n=2,3, ,于是可
21、求得:,当n=2,3, 时,,m=1,2, ,n-1,联合分布列,边缘分布列,n=m+1,m+2, ,当m=1,2, 时,,二、连续型r.v的条件分布,设(X,Y)是二维连续型r.v,由于对任意 x, y, P(X=x)=0, P(Y=y)=0 ,所以不能直接用条件概率公式得到条件分布,下面我们直接给出条件概率密度的定义.,同样,对一切使 的 y, 定义,为已知 Y=y下,X的条件密度函数 .,我们来解释一下定义的含义:,将上式左边乘以 dx , 右边乘以 (dx dy)/dy即得,运用条件概率密度,我们可以在已知某一随机变量值的条件下,定义与另一随机变量有关的事件的条件概率.,定义在已知 Y
22、=y下,X的条件分布函数为,特别,取,即: 若(X,Y)是连续型r.v, 则对任一集合A,,求 P(X1|Y=y),例2 设(X,Y)的概率密度是,为此, 需求出,由于,于是对y0,故对y0,P(X1|Y=y),例3 设(X,Y)服从单位圆上的均匀分布,概率 密度为,求,解:X的边缘密度为,当|x|1时,有,例4 设r.vX在区间(0,1)均匀分布,当观察到 X=x(0x1)时,r.vY在区间(x,1)上均匀分布. 求Y 的概率密度.,解:依题意,X具有概率密度,对于任意给定的值x(0x1),在X=x的条件下,Y的条件概率密度为,X和Y的联合密度为,于是得Y的概率密度为,已知边缘密度、 条件密度,求 联合密度,我们已经知道,,由条件密度的定义:,可知,当X与Y相互独立时,,也可用此条件判别二维连续型r.v(X,Y)的两个分量X与Y是否相互独立.,对离散型r.v有类似的结论,请同学们 自行给出.,这一讲,我们介绍了条件分布的概念和计算,并举例说明对离散型和连续型随机变量如何计算条件分布. 请课下通过练习进一步掌握.,