1、第二章 随机变量及其分布,随机变量 离散型随机变量及其概率分布 随机变量的分布函数 连续型随机变量及其概率密度 随机变量的函数的分布,在第一章中,我们用样本空间的子集,即基本事件的集合来表示随机试验的各种结果,这种表示方式对全面讨论随机试验的统计规律性及数学工具的运用都有较大的局限。在本章中,我们将用实数来表示随机试验的各种结果,即引入随机变量的概念。这样,不仅可以更全面揭示随机试验的客观存在的统计规律性,而且可使我们用(数学分析)微积分的方法来讨论随机试验。,在随机试验中,如果把试验中观察的对象与实数对应起来,即建立对应关系X,使其对试验的每个结果e,都有一个实数X(e)与之对应,,试验的结
2、果e,实数X(e),对应关系X,则X的取值随着试验的重复而不同, X是一个变量,且在每次试验中,究竟取什么值事先无法预知,也就是说X是一个随机取值的变量。由此,我们很自然地称X为随机变量。,关于随机变量(及向量)的研究,是概率论的中心内容这是因为,对于一个随机试验,我们所关心的往往是与所研究的特定问题有关的某个或某些量,而这些量就是随机变量也可以说:随机事件是从静态的观点来研究随机现象,而随机变量则是一种动态的观点,一如数学分析中的常量与变量的区分那样变量概念是高等数学有别于初等数学的基础概念同样,概率论能从计算一些孤立事件的概念发展为一个更高的理论体系,其基础概念是随机变量,2.1随机变量,
3、定义1 设E是一个随机试验,S=e是试验E的样本空间,如果对于S中的每一个样本点,有一实数X()与之对应,这个定义在S上的实值单值函数X(e)就称为随机变量。,由定义可知,随机变量X(e)是以样本空间S为定义域的一个单值实值函数。,有关随机变量定义的几点说明: (1)随机变量X是样本点的函数,常用大写字母X、Y、Z 或小写希腊字母、 等表示。 (2)随机变量X随着试验结果而取不同的值,因而在试验结束之前,只知道其可能的取值范围,而事先不能预知它取什么值,对任意实数区间(a,b),“aXb”的概率是确定的; (3)随机变量X()的值域即为其一切可能取值的全体构成的集合; (4)引入随机变量后,就
4、可以用随机变量描述事件,而且事件的讨论,可以纳入随机变量的讨论中。,例如,某城市的120急救电话每小时收到的呼叫次数X是一个随机变量, 事件收到不少于20次呼叫可表示为X20 事件收到恰好为20次呼叫可表示为X=20,例2.2 将一颗骰子投掷两次,观察所的点数,以X表示所得点数之和,则X的可能取值为2,3,4,12,而且 X=2=(1,1), X=3=(1,2),(2,1), X=4=(1,3),(2,2),(3,1), X=12=(6,6)。,随机变量X的取各个可能值的概率列于下表:,P(X=2)=1/36,P(X=3)=2/36,P(X=4)=3/36,P(X=12)=1/36,例2.4
5、一个地铁车站,每隔5分钟有一列地铁通过该站。一位乘客不知列车通过该站的时间,他在一个任意时刻到达该站,则他候车的时间X是一个随机变量,而且X的取值范围是 0,5,?,请举几个实际中随机变量的例子,练 习 引入适当的随机变量描述下列事件:将3个球随机地放入三个格子中, 事件A=有1个空格, 事件B=有2个空格, 事件C=全有球。进行5次试验, 事件D=试验成功一次, 事件F=试验至少成功一次, 事件G=至多成功3次,随机变量的分类:随机变量,2.2 离散型随机变量及其概率分布,一、 离散型随机变量及其概率分布( 分布律),1、离散型随机变量的概念,若某个随机变量的所有可能取值是有限多个或可列无限
6、多(可数无穷)个,则称这个随机变量为离散型随机变量。讨论随机变量的目的是要研究其统计规律性,要知道离散型随机变量X的统计规律必须且只须知道X的所有可能取值以及X取每一个可能值的概率。,2、概率分布(分布律或概率函数),设离散型随机变量X,其所有可能取值为x1, x2, , xi, , 且取这些值的概率依次为p1, p2, , pi, , 即,则称P(X=xi)=pi (i=1, 2, ) 为随机变量X 的概率分布或称分布律,也称概率函数。 分布律可用表格形式表示为:,P(X=xi)=pi (i=1, 2, ) 而且满足(1)P(X=xi)=pi0 (i=1, 2, )(2),一般地,X是离散型
7、随机变量,其概率分布律为 P(X=xi)=pi, (i=1, 2, ) 则,例2.5 设袋中有5只球,其中有2只白球,3只黑球。现从中任取3只球(不放回),求抽得的白球数X为k的概率。,解,X=k的所有可能取值为0,1,2,X是一个随机变量,解 设Ai 第i次射击时命中目标,i=1,2,3,4,5 则A1, A2,A5相互独立,且 P(Ai)=p,i=1,2,5。SX=0,1,2,3,4,5,例2.6 某射手对目标独立射击5次,每次命中目标的概率为p,以X表示命中目标的次数,求X的分布律。,二、几个常用的离散型随机变量的概率分布律 1. 两点分布,若随机变量X只有两个可能的取值 ,且其分布为则
8、称X服从x1,x2处参数为p的两点分布。,特别地,,(0-1)分布若随机变量X的分布律为: P(X=k)=pk(1-p)1-k, k=0,1,(0p1) 则称X服从以p为参数的0-1分布,记为XB(1,p)。,0-1分布的分布律也可写成,即随机变量只可能取0,1两个值,且取1的概率为p,取0的概率为1-p (0p1),亦即 P(X=1)=p, P(X=0)=1-p。,若某个随机试验的结果只有两个,如产品是否合格,试验是否成功,掷硬币是否出现正面等等,它们的样本空间为S= 1, 2,我们总能定义一个服从0-1分布的随机变量,即它们都可用0-1分布来描述,只不过对不同的问题参数p的值不同而已。,2
9、、二项分布,(1)贝努里(Bernoulli)试验模型。设随机试验满足: 1在相同条件下进行n次重复试验; 2每次试验只有两种可能结果,A发生或A不发生; 3在每次试验中,A发生的概率均一样,即P(A)=p; 4各次试验是相互独立的, 则称这种试验为贝努里概型或n重贝努里试验。在n重贝努里试验中,人们感兴趣的是事件A发生的次数。,(2)二项分布定义,若随机变量X具有概率分布律,其中p+q=1,则称随机变量X服从以n,p为参数的二项分布(或称贝努里分布),记为XB(n,p) 或 Xb(n,p) 。 可以证明:,正好是二项式(p+q)n展开式的一般项,故称二项分布。 特别地,当n=1时P(X=k)
10、=pkq1-k(k=0,1)即为0-1分布。,例2.8 某厂长有7个顾问,假定每个顾问贡献正确意见的概率是0.6,且设顾问与顾问之间是否贡献正确意见相互独立。现对某事可行与否个别征求各顾问的意见,并按多数顾问的意见作出决策,试求作出正确决策的概率。,解 设X=k表示事件“7个顾问中贡献正确意见的人数”, 则X可能取值为0,1,2,7。 (视作7重贝努里实验中恰有k次发生,k个顾问贡献出正确意见),XB(7,0.6)。 因此X的分布律为,所求概率为,例2.9 某人独立地射击,设每次射击的命中率为0.02,射击400次,求至少击中目标两次的概率。,解 每次射击看成一次试验,设击中次数为X, 则 X
11、B(400,0.02), X的分布律为,所求概率为,例2.9告诉我们两个事实:1虽然每次射击的命中率很小(0.02),但射击次数足够大(为400次),则击中目标至少两次是几乎可以肯定的(概率为0.997)。一个事件尽管在一次试验中发生的概率很小,但在大量的独立重复试验中,这事件的发生几乎是必然的,也就是说小概率事件在大量独立重复试验中是不可忽视的。2若射手在400次独立射击中,击中目标的次数不到2次,则P(X2)=1-P(X2)0.003,即命中目标次数不到两次是一件概率很小的事件,而这事件竟然在一次试验中发生了。则根据实际推断,我们有理由怀疑“每次射击命中率为0.02”是否正确,即可以认为命
12、中率达不到0.02。,3、泊松(Poisson)分布,若随机变量X所有可能取值为0,1,2,,且,其中0是常数,则称X服从参数为的泊松分布,记为XP()。,例2.10 某商店出售某种商品,具历史记录分析,每月销售量服从参数=5的泊松分布。问在月初进货时,要库存多少件此种商品,才能以0.999的概率充分满足顾客的需要?,解 用X表示每月销量,则XP()= P(5)。由题意,要求k,使得P(Xk)0.999,即,这里的计算通过查Poisson分布表得到,=5,i=k+1=14时,i=k+1=13时,k+1=14,k=13 即月初进货库存要13件。,例2.11 设某国每对夫妇的子女数X服从参数为的泊
13、松分布,且知一对夫妇有不超过1个孩子的概率为3e-2。求任选一对夫妇,至少有3个孩子的概率。,解 由题意,泊松(Poisson)定理 设0,n是正整数,若npn=,则对任一固定的非负整数k,有,即当随机变量XB(n, p),(n0,1,2,),且n很大,p很小时,记=np,则,泊松定理表明,泊松分布是二项分布的极限分布,当n很大,p很小时,二项分布就可近似地看成是参数=np的泊松分布。,例2.9可用泊松定理计算。 取 =np=4000.028, 近似地有 P(X2)1 P(X0)P(X1)1(18)e80.996981,4、几何分布,设随机变量X的可能取值是1,2,3,且 P(X=k)=(1-
14、p)k-1p=qk-1p,k=1,2,3, , 其中0p1是参数,则称随机变量X服从参数p为的几何分布。,几何分布背景:,随机试验的可能结果只有2种,A与,试验进行到A发生为止的概率P(X=k),即k次试验,前k-1次失败,第k次成功。,例2.12 进行独立重复试验,每次成功的概率为p,令X表示直到出现第m次成功为止所进行的试验次数,求X的分布律。,解 m=1时,m1时,X的全部取值为:m,m+1,m+2,P(X=m+1)=P(第m+1次试验时成功,并且在前m次试验中成功了m-1次),作业 Page 41,2,4,10,12,2.3 随机变量的分布函数,前一节介绍的离散型随机变量,我们可用分布
15、律来完整地描述。而对于非离散型随机变量,由于其取值不可能一个一个列举出来,而且它们取某个值的概率可能是零。例如:在测试灯泡的寿命时,可以认为寿命X的取值充满了区间0,+),事件X=x0表示灯泡的寿命正好是x0,在实际中,即使测试数百万只灯泡的寿命,可能也不会有一只的寿命正好是x0,也就是说,事件(X=x0)发生的频率在零附近波动,自然可以认为P(X=x0)=0。由于许多随机变量的概率分布情况不能以其取某个值的概率来表示,因此我们往往关心随机变量X取值落在某区间 (a,b上的概率(ab)。由于axb=xb-xa,(ab),因此对任意xR,只要知道事件Xx发生的概率,则X落在(a,b的概率就立刻可
16、得。因此我们用P(Xx)来讨论随机变量X的概率分布情况。P(Xx):“随机变量X取值不超过x的概率”。,定义 设X是一随机变量,x是任意实数,则实值函数 F(x)P Xx, x(-,+) 称为随机变量X的分布函数。有了分布函数定义,任意x1,x2R, x1x2,随机变量X落在(x1,x2里的概率可用分布函数来计算: P x1X x2PX x2PXx1 F(x2)F(x1).,在这个意义上可以说,分布函数完整地描述了随机变量的统计规律性,或者说,分布函数完整地表示了随机变量的概率分布情况。,一、分布函数的概念,二、分布函数的性质,1、单调不减性:若x1x2, 则F(x1)F(x2);2、归一 性
17、:对任意实数x,0F(x)1,且,3、右连续性:对任意实数x,,反之,具有上述三个性质的实函数,必是某个随机变量的分布函数。故该三个性质是分布函数的充分必要性质。,事件(X=c)并非不可能事件,它是会发生的,也就是说零概率事件也是有可能发生的。如X为被测灯泡的寿命。若灯泡寿命都在1000小时以上,而P(X=1000)=0,但事件(X=1000)是一定会发生的,否则不会出现事件(X1000),所以不可能事件的概率为零,但概率为零的事件不一定是不可能事件。 同样,必然事件的概率为1,但概率为1的事件不一定是必然事件。,例2.13 设随机变量X具分布律如下表,解,试求出X的分布函数。,例2.14 设
18、一汽车在开往目的地的道路上需经过3盏信号灯。每盏信号灯以概率1/2允许汽车通过或禁止汽车通过。以X表示汽车首次停下时,它已通过的信号灯的盏数(各信号灯工作相互独立)。求X的分布律、分布函数以及概率,解 设p为每盏信号灯禁止汽车通过的概率,则P(X=k)=p(1-p)k,k=0,1,2;P(X=3)=(1-p)3,故X的分布律为:,X的分布函数:,所求概率为,一般地,X是离散型随机变量,其概率分布律为 P(X=xk)=pk, (k=1, 2, ) 则X的分布函数F(x)为,F(x)的图像:非降,右连续,且在x1,x2 ,xk,处跳跃。,例2.15 离散型随机变量X的分布函数为,求a,b及X的分布
19、律。,解 因P(X=2)=a+b-(2/3-a)=1/2 ,a+b=1于是a=1/6,b=5/6X的分布律为,例2.16 (自学)向0,1区间随机抛一质点,以X表示质点坐标。假定质点落在0,1区间内任一子区间内的概率与区间长成正比,求X的分布函数。 解 F(x)=P(Xx),当x1时,F(x)=1,当0x1时,特别,F(1)=P(0x1)=k=1,用分布函数描述随机变量不如分布律直观, 对非离散型随机变量,是否有更直观的描述方法?,?,a,b,作业 Page 45,6,2.4 连续型随机变量及其概率密度,1、概念 设F(X)是随机变量X的分布函数,若存在非负可积函数f(x),(-x+),使对一
20、切实数x,均有,则称X为连续型随机变量,且称f(x)为随机变量X的概率密度函数,简称概率密度或密度函数。常记为X f(x) , (-x+),一、连续型随机变量及其概率密度,X连续型随机变量,则X的分布函数必是连续函数。,(1) 非负性 f(x)0,(-x+);,2、密度函数的性质,(2),(3) 归一性,事实上,(4) 若f(x)在x0处连续,则有,(5) f(x)在x0处连续,且h充分小时,有,f(x)称为概率密度的原由。,对任意实数c,若Xf(x),(-x+),则 P(X=c)=0,连续型随机变量X取任一固定值的概率为0,证明,令,即得P(X=c)=0。,因此,对连续型随机变量X,有,密度
21、函数的几何意义为,密度函数曲线位于Ox轴上方。,即 y=f(x),y=a,y=b,x轴所围成的曲边梯形面积。,例2.17 设,求:(1)常数K;(2)X的分布函数;(3),解 (1)由性质,得,解之得,(2)X的分布函数为,(3),练习 已知随机变量X的概率密度为,(1)求X的分布函数F(x), (2)求PX(0.5,1.5),二、几个常用的连续型随机变量的分布,若随机变量X具有概率密度函数,1. 均匀分布,则称X在a, b上服从均匀分布,记作 XU(a, b)。,对任意实数c, d (acdb),l=d-c,都有,若XU(a, b),则X具有下述等可能性:X落在区间(a, b)中任意长度相同
22、的子区间里的概率是相同的。 即X落在子区间里的概率只依赖于子区间的长度,而与子区间的位置无关。,X的分布函数,f(x),F(x)的图像分别为,O a b x,f(x),O a b x,F(x),1,例2.20 设随机变量XU(1, 6) ,求一元两次方程t2+Xt+1=0有实根的概率。,解 当=X2-40时,方程有实根。所求概率为,而X的密度函数为,另解,例2.21 长途汽车起点站于每时的10分、25分、55分发车,设乘客不知发车时间,于每小时的任意时刻随机地到达车站,求乘客候车时间超过10分钟的概率。,解 设A乘客候车时间超过10分钟, X乘客于某时X分钟到达,则XU(0,60),则称X服从
23、参数为0的指数分布。 其分布函数为,2、指数分布,设连续型随机变量X具有概率密度,则称X服从参数为的指数分布。 其分布函数为,指数分布的另一种表示形式,例2.25 电子元件的寿命X(年)服从参数为3的指数分布 (1)求该电子元件寿命超过2年的概率; (2)已知该电子元件已使用了1.5年,求它还能使用2年的概率为多少?,解,正态分布是实践中应用最为广泛,在理论上研究最多的分布之一,故它在概率统计中占有特别重要的地位。,3、正态分布,A,B,A,B间真实距离为,测量值为X。X的概率密度应该是什么形态?,则称X服从参数为 ,2的正态分布,记为XN(, 2)。,若随机变量X的概率密度函数为,(其中 ,
24、为实数,0),f(x)的图像为,(1) 单峰对称 密度曲线关于直线x=对称,即 f( +x)=f( -x),x(-,+),正态分布密度函数f(x)的性质,(2)x= 时, f(x)取得最大值f()= ;,(3)x= 处有拐点;(直观地说拐点是使切线穿越曲线的点(即曲线的凹凸分界点)),(4)的大小直接影响概率的分布,越大,曲线越平坦,越小,曲线越陡峭。(如图),正态分布也称为高斯(Gauss)分布,(5)曲线f(x)以x轴为渐近线。,易知,且,事实上,令,正态分布随机变量X的分布函数为,其图像为,O x,F(x),1,标准正态分布当参数0,21时,称随机变量X服从标准正态分布,记作XN(0,
25、1)。,分布函数表示为,其密度函数表示为,O x,1,(x),标准正态分布的密度函数与分布函数的图像分别为,可得,对于标准正态分布的分布函数(x)的函数值,书后附有标准正态分布表)。表中给出了x0的函数值。当x0时,可利用(-x)=1- (x)计算得到。,例2.22 已知XN(0, 1),求P(-X-3), P(|X|3),解 P(-X-3)= (-3) = 1-(3),标准正态分布表,P(|X|3)= P(-3X 3)= (3) - (-3) = (3) -1-(3) =2(3)-1=20.9987-1=0.9974,=1-0.9987=0.0013,一般地, XN(0, 1), P(Xx)
26、=(x),P(|X|x)=2(x)-1,对于一般正态分布的随机变量XN(, 2),可通过将其分布函数标准化的方法来计算其分布函数值(即概率)。,设随机变量XN(, 2),其分布函数为FX(x),则有,证明,一般有,例2.23 已知XN(1, 4),求P(5X7.2), P(0X1.6),解,分位数的概念,XN(, 2),p(0,1),若实数up满足P(X up)=p, 则称up为标准正态分布的p分位点。,标准正态分布表,O Up x,p,正态随机变量的3原则:设XN(,2),在工程应用中,通常认为P|X|31,忽略|X|3的值。 如在质量控制中,常用标准指标值3作两条线,当生产过程的指标观察值
27、落在两线之外时发出警报,表明生产出现异常。,在一次试验中,正态分布的随机变量X落在以为中心,3为半径的区间(-3, +3)内的概率相当大(0.9973),即X几乎必然落在上述区间内,或者说在一般情形下,X在一次试验中落在(-3, +3)以外的概率可以忽略不计。,作业 P53,3,5,6; 7,10,14;,内容回顾,连续性随机变量及其概率密度; 已知概率密度函数求分布函数; 均匀分布; 正态分布;标准正态分布; 指数分布;,一、离散型随机变量的函数的分布律,2.5 随机变量的函数的分布,设X一个随机变量,分布律为 XP(Xxk)pk, k1, 2, 则当Yg(X)的所有取值为yj(j1, 2,
28、 )时,随机变量Y有如下分布律: P(Yyj)qj, j1, 2, 其中qj是所有满足g(xi)= yj的xi对应的X的概率P(Xxi)pi的和,即,例2.25 设离散型随机变量X有如下分布律,试求随机变量Y=(X-3)2+1的分布律,解 Y的所有可能取值为 1,5,17,故,Y的分布律为,二、连续型随机变量的函数的分布,1、一般方法设连续型随机变量X的概率密度函数为fX(x),(-x+), Y=g(X)为随机变量X的函数,则Y的分布函数为FY (y) P(Yy)P(g(X) y),从而Y的概率密度函数fY (y)为,此法也叫“分布函数法”,例2.26 设随机变量,求Y=3X+5的概率密度。,
29、解 先求Y=3X+5的分布函数FY(y),Y的概率密度函数为,例2.27(自学) 设XU(-1,1),求Y=X2的分布函数与概率密度。,当y0时,,当0y1时,当y1时,解,2、公式法:一般地若XfX(x), y=g(x)是严格单调可导函数,则,注 1、只有当g(x)是x的单调可导函数时,才可用以上 公式推求Y的密度函数; 2、注意定义域的选择; 3、勿忘加绝对值。,其中h(y)为yg(x)的反函数。,例2.28 (自学)设X的概率密度为fX(x),y=g(x)关于x处处可导且是x的严格单减函数,求Y=g(X)的概率密度。,FY(y)=P(Yy)=P(g(X)y)=P(Xg-1(y)= 1-P
30、(Xg-1(y)=1-FX(g-1(y),Y的概率密度为fY(y)=F(g-1(y)=fX(g-1(y) g-1(y),解 Y的分布函数为,例2.29 已知XN(,2),求,解,的概率密度,关于x严格单调,反函数为,故,结论重要(选择,填空):,例2.30 设XU(0,1),求Y=aX+b的概率密度。(a0),解 Y=ax+b关于x严格单调,反函数为,故,而,所以,作业 P59,1,3,7(计算小心,易错),小结.,习题,一、填空: 1.设随机变量X服从参数为(2,p)的二项分布,随机变量Y服从参数(3,p)的二项分布,若 , 则P(Y1)= 。,2.设随机变量X服从(0,2)上的均匀分布,则随机变量Y=X2在(0,4)内的密度函数为fY(y)=,3.设随机变量XN(2,2),且P(2X4)=0.3,则P(X0)=_。,二、已知随机变量X的概率密度为,求:Y=1-X2的概率密度,