1、第3章 一维随机变量随机变量的产生一维随机变量的分布函数离散型随机变量二项分布与泊松分布连续型随机变量正态分布一维随机变量函数的分布,3.1 随机变量的产生样本空间太任意,难以把握,需要将其数量化。要求问题涉及的随机事件与变量相关,这样可以将概率和函数建立联系。正如随机事件是“其发生与否随机会而定”的事件; 随机变量就是“其值随机会而定”的变量。其机会表现为试验结果,一个随机试验有许多可能的结果,到底出现哪一个要看机会,即有一定的概率。,如掷骰子,掷出的点数X是一个随机变量,它可以取1,6这6个值中的1个,到底是哪一个,要等掷了骰子后才知道。因此,随机变量是试验结果的函数。从这一点看,它与通常
2、的函数概念没有什么不同,把握这个概念的关键在于试验前后之分:在试验前,无法预知它将取何值,这要凭机会,“随机”的意思就在这里,一旦试验完成后,取值就确定了。,例1 在某厂大批产品中随机地抽出100个,其中所含废品数X是随机变量。可能结果 wi=“100个产品中有i个废品” i=0,1,100 样本空间=w0, w1, w2, , w100 随机变量是可能结果的函数:X=X(w) wX=X(w0)=0,X=X(w1)=1,X=X(w2)=2,X=X(w100)=100所以,X=0,1,2,100,事件“废品数少于50”=w:X(w)50=w0, w1, , w49=X50 事件30X50=w30
3、, w31, , w49 例2 用天平秤量某物体重量的误差X是随机变量。可能结果 w=“某物体重量的误差为x” x(0,)X=X(w)=x w 所以,随机变量 X(0,)随机事件这个概念包含在随机变量这个更广的概念之内。随机事件从静态的观点研究随即现象;随机变量则是从动态的观点去研究。,定义 称定义在样本空间上的单值实函数X=X(w) w 是随机变量,如果对任意实数 x 有w:X(w)x F (F是事件域)通常用英文字母X,Y来表示随机变量,用英文字母x、y表示其取值。,即: w:X(w)x 是一个事件,说明:设X=X(w),w,X是定义在样本空间上的单值实函数,对于任一实数x,基本事件w的集
4、合w:X(w)x都是一随机事件,则称X=X(w)为随机变量。随机变量X=X(w)是基本事件w的函数,w是自变量,在不必强调w时,简记X(w)为X,而w的集合w:X(w)x 所表示的事件简记为Xx 。定义中要求对任一实数x,Xx都是事件,表明Xx是所讨论问题的样本空间上一个适当确定的事件域F中的事件。,定义随机变量后,随机事件可以用随机变量来描述。例如对任意实数x,x1,x2可以证明,形如 w:X(w)=x, w:X(w)x, w:X(w)x, w:X(w)x, w:x1X(w)x2, w:x1X(w)x2, 等等,都是随机事件,在不必强调w时,简记w:x1X(w)x2为x1Xx2。,3.2 一
5、维随机变量的分布函数我们不仅关心X取哪些值,更关心X以多大的概率取那些值。即关系X取值的概率规律(通称为X的分布)。根据随机变量X的定义,对于每一个实数x,都有一个确定的随机事件w:X(w)x与x对应,因此,概率Pw:X(w)x是x的函数,该函数在理论和应用中都很重要,为此引进随机变量的分布函数定义。 定义 设X是一个随机变量,x是任意实数,函数F(x)=Pw:X(w)x 称为随机变量X的分布函数。X的分布函数也常简记为F(x)=PXx,任一随机变量X的分布函数F(x),x(-, ),具有下列性质: (1) 单调不减性。若x1x2,则F(x1)F(x2) 。证 若x1x2, 则有Xx1 Xx2
6、 根据概率的性质,得PXx1 PXx2 即 F(x1) F(x2) (2)(3) 左连续性。对任意实数 x0,有,如某实函数具有上述3个性质,则它可作为某随机变量的分布函数。由分布函数,可以计算如下概率:,3.3 离散型随机变量随机变量全部的可能值只有有限个或至多可列,则称其为离散型随机变量。对于离散型随机变量,除了关心它全部的可能值之外,还要知道它以怎样的概率取这些值,对于一个以 为其全部不同可能值的离散型随机变量X,若则称式(3-1)或称 p1, p2 ,为X的概率分布(律),简称分布。,称为离散型随机变量X的概率分布列,简称分布列。离散型随机变量的概率分布p1,p2,pn,必须满足两个条
7、件:,说明:这里的求和是对一切xix进行的(如果这样的xi不存在,便规定F(x)=0),此时, F(x)等于X取小于x的所有xi的概率之和或累积,因此分布函数也叫累积概率。离散型随机变量的分别函数F(x)的图象为阶梯状,点x1,x2,xn都是F(x)的第一类(跳跃)间断点。,随机试验:接连进行两次射击,表示未击中目标,表示击中目标。样本空间:现在我们设定随机变量X表示击中目标的次数,则 我们设定随机变量X表示击中目标的次数,则随机试验:观察某电话交换台单位时间内接到的呼唤次数。样本空间=0,1,2,,以X表示接到的呼唤次数,那么,X=X()=,是离散型随机变量。,例3 设射手进行计分打靶练习,
8、有如下规定:射入区域e1得2分,射入区域e2得1分,否则就得0分)。一射手进行一次射击的得分是随机变量,其可能取得的值为0,1,2。不同的射手在射击之前,他们进行一次射击的得分值都是不可预知的。 射手甲在一次射击中得分X的概率分布为: 射手乙在一次射击中得分Y的概率分布为:,X的概率分布(律)为: 计算X的分布函数F(x)=P(Xx): 当x0时, F(x)=P(Xx)=P()=0 当0x1时, F(x)=P(Xx)=P(X=0)=0 当1x2时, F(x)=P(Xx)=P(X=0)+P(X=1)=0.2 当2x时, F(x)=P(Xx)=P(X=0)+P(X=1)+P(X=2)=0+0.2+
9、0.8=1,0-1分布(两点分布):若随机变量X只能取两个值,其分布列为:退化分布(单点分布):若随机变量只取常数值C,即,例4 已知离散型随机变量X的概率分布为试求出常数a 解 由于,3.4 二项分布与泊松(Poisson)分布 3.4.1 二项分布 在1次试验中事件A出现的概率是p,则n重伯努利试验中,事件A出现的次数X是二项分布随机变量,其可能取得的值是 0, 1, 2, , k, , n 有分布律 这个值也被记作b(k ; n,p),它正是二项式(px+q)n的展开式中xk 的系数,因而得名“二项分布” B(n,p)。 记为 X B(n , p),二项分布列是:所以,特别地,n=1时,
10、二项分布为二值分布,其分布列为,定理1 在n重伯努利试验中,事件A发生的次数在k1和k2之间的概率是在n重伯努利试验中,事件A至少发生r次的概率是 特别是在n重伯努利试验中,事件A至少发生1次的概率是,例5 医生对5个人作某疫苗接种试验,设已知对试验反映呈阳性的概率为p=0.45,且各人的反映相应独立。若以X表示反映为阳性的人数。(1)写出X的分布律。(2)求恰有3人反映为阳性的概率;(3)求至少有2人反映为阳性的概率。 解 将观察1人对该接种疫苗试验的反映呈“阳性”(发生A)或“阴性”(发生 )看作是1次伯努利试验,对5个人试验看作是5重伯努利试验,则XB(5,0.45) (1) X的分布律
11、: X=0,1,2,3,4,5,(2)求恰有3人反映为阳性的概率:(3)求至少有2人反映为阳性的概率:,例6 已知发射一枚地对空导弹可“击中”来犯敌机的概率是0.96,问在同样条件下需发射多少枚导弹才能保证至少有一枚导弹击中敌机的概率大于0.999? 解 设需要发射n枚导弹,则击中敌机的导弹数是随机变量XB(n,0.96),则取n3,即需要发射3枚导弹。,例7 一个完全不懂阿拉伯语的人去瞎蒙一场阿拉伯语考试。假设考试有5道选择题,每题给出n个结果供选择,其中只有一个结果是对的。试问他居然能答对3题以上而及格的概率。 解 每做1题是1次p=1/n的伯努利试验,这里A是“答题正确”,则考试是p=1
12、/n的5重伯努利试验,在5题中恰好答对题数XB(5,1/n),此人及格的概率为:当n=3时,此值=0.29 当n=4时,此值=0.10,定理2 设XB(n,p),则当k=ent(n+1)p)时, b(k;n,p) 的值最大。若(n+1)p为整数,则b(k;n,p)=b(k-1;n,p)同为最大值。,证明:当k1, 则b(k; n, p)b(k-1; n, p), 概率随k的增大而增大;当(n+1)p是整数且等于k时,r=1, 则b(k;n,p) =b(k-1;n,p)当k(n+1)p时,r1, 则b(k; n, p)b(k-1; n, p), 概率随k的增大而减小;,综上所述,可得如下结论:
13、(1)当(n1)p恰为正整数,记为k0,则b(k0; n, p)=b(k0-1;n, p)同为二项分布概率的最大值; (2)当(n+1)p不是整数时,记k0=ent(n+1)p),ent表示数之整数部分;则b(k0;n, p)为二项分布概率的最大值。,例8(渔佬问题)渔佬想知道自己承包的鱼塘中鱼的条数。 解 设鱼的总数为N,渔佬先从塘 中网起100条鱼做上记号后放回塘 里,过一段时间(使其均匀)再 从中网起100条,发现其中有记号 者为2条,经此劳作则可用统计方 法来估计鱼的总数N。在第二次打鱼时,由于塘中有记号的鱼有100条,在渔佬所网起的鱼中可能有记号,也可能没有记号。设有记号的条数为X,
14、则X服从二项分布 。,由定理2,当X=k0=ent(n+1)p)时,其概率最大。 此时,这里n=100,p=100/N,k0=2,由此解得N5050(条),并可估计鱼佬的收入。 值得注意的是: X=2时取得最大概率只有:,3.4.2 泊松(Poisson)分布若随机变量X以全体自然数为其一切可能值,X=0,1,2,其分布律其中参数0 为强度。 则称X服从参数的泊松分布,记为XP()。,n=10, p=0.4, =np=4 n=40, p=0.1 =np=4 随着n增大,若np不变, 则二项分布与泊松分布逐渐接近,因为0 ,故有P(X=k)0 。(k=0,1,2, )即泊松分布的分布律,具备概率
15、函数两性质。,在实际问题中,有很多随机变量都近似服从泊松分布。例如:在任给一段固定的时间间隔内,来到公共设施(公共汽车站、商店、电话交换台等)要求给予服务的顾客个数;炸弹爆炸后落在平面上某区域的碎弹片个数;落在显微镜片上的某种细菌个数。,定理(泊松定理)设随机变量X服从二项分布B(n,p)(p(0,1),并与n有关),且满足 ,则证明,在应用中,当很大(n10 ),很小0.1) ,我们有下面的泊松近似公式其中=np,例9 设每次击中目标的概率为0.001,且各次射击是否中目标可看作相互没有影响,如果射击5000次,试求:()击中12弹的概率;()至少击中12弹的概率。 解 设X为击中目标的弹数
16、,则XB(5000,0.001) , 下面用近似公式计算。其中=np=50000.001=5 ()击中12弹的概率为:()至少击中12弹的概率为:,例10 由商店的销售记录知,某商品的月售出量X服从=10的泊松分布。为能以95%以上的概率保证不脱销,问在无库存的情况下月底应进货多少? 解 商店备货过多将明显地提高成本,而长期货源不足则会影响商誉。因此需用概率方法确定合适的备货量,依照问题的要求,若月底进货量为Q,则应使P(XQ)0.95,P(X14) 0.95 取Q=15故月底进货该商品15件,可有95%以上的把握该商品在下个月的经营中不会脱销。,例11(合作问题) 设有同类设备80台,各台工
17、作是相互独立的,发生故障的概率都是0.01,并且一台设备的故障可由一个人来处理,试求: (1) 由1个人负责维修指定的20台设备,设备发生故障而不能及时维修的概率; (2) 由3个人共同负责维修80台设备时,设备发生故障而不能及时维修的概率。 解 (1)由一个人负责维修20台设备时,设X表示同一时刻发生故障的设备台数,则XB(20,0.O1)。因为一个人在同一时刻只能处理1台发生故障的设备,所以设备发生故障而不能及时处理,即是在同一时刻至少有2台设备发生故障,于是所求概率为,也可用泊松公式近似:=np=200.01=0.2,(2) 由3个人共同负责维修80台设备时,设80台设备中发生故障的台数
18、为X,则XB(80, 0.01)。当同一时刻至少有4台设备发生故障时,故障不能及时维修。由泊松近似公式=np=800.01=0.8,所求概率为可见,由三个人共同负责维修80台,即每人平均约维修27台,比一个人单独维修20台更好,既节约了人力又提高了工作效率。,3.4.3 几何分布 如果随机变量的分布律为则称随机变量服从参数为p的几何分布。 几何分布主要描述这样的情形:独立地连续做试验,直到事件A首次出现为止。此时首次出现A时的试验次数为随机变量X,P(A)=p, 则X服从参数为p的几何分布。 如:某射手的命中率为p,此射手向一目标独立地连续进行射击,直到命中目标为止。若用X表示首次命中目标时的
19、射击次数,则X服从参数为p的几何分布。,这是p=0.3的几何分布:,例12 在石头、剪子、布的游戏中,问:(1) 甲方提出“若一次能决出胜负,则甲方赢;否则乙方赢”,乙方能同意吗?(2) 比赛三次能决出胜负吗? 解 (1) P(甲方赢)=P(第一次就能决出胜负)=P(甲胜或乙胜)=P(甲胜)+P(乙胜)=1/3+1/3=2/3P(乙方赢)=1-P(甲方赢)=1/3 乙方不能同意。,比赛三次能决出胜负吗?设X为首次决出胜负所需的比赛次数,则X的取值为1,2,3,此为重复独立试验。 P(在1次比赛中能决出胜负)=2/3,于是X服从p=2/3的几何分布。即,例13 一个人要开门,他共有n把钥匙,其中
20、仅有一把是能开此门的,现随机地从中取出一把钥匙来试开门,在试开时每一把钥匙均以1/n的概率被取用,问此人直到第S次试开时方才成功的概率是多少? 解 A=试开门成功,几何分布具有如下特征:如X的分布律为g(k;p),则对任意正整数s、t,有P(Xs+tXs)= P(Xt) 称几何分布具有“无记忆”性。 证明,超几何分布 例14 在一箱N件装的产品中混进了M件次品,今从中抽取n件(nM) ,求从中查出次品的件数X的概率分布。 解,负二项分布在“成功”概率是p的贝努利试验中,出现第r次成功时所作的试验次数X所服从的分布称为负二项分布。由于f(k;r,p)是负指数二项式 展开式中的项,故X所服从的分布
21、称为负二项分布。由此也可以证明,证明,例15 两个同类型的系统,开始时各有N个备件,一旦出现故障,就要更换一个备件。假定两个系统的运行条件相同,不同时发生故障。试求当一个系统需用备件而发现备件已用光时,另一系统尚有r个备件的概率Pr。 (r=0,1, ,N) 解 只考虑出故障的时刻故障的出现看作是贝努利试验,有,要第一个系统缺备件而第二个系统剩r件,应该是A出现N1次(前N次用去所有N个备件,最后一次故障发生时缺乏调换的备件),而A出现Nr次,这事件的概率为:对于第二个系统先缺备件的情况可同样考虑,因此所求概率Pr为:,3.4 连续型随机变量 当一个随机变量X的分布函数FX(x)可写成“变上限
22、积分”的形式:称X为连续型随机变量,称为fX(x)为X的概率分布密度,简称密度函数。可以证明,连续型随机变量 的分布函数是连续函数。,分布函数的性质 :(3)而分布函数F(x)的导函数(在连续点上)就是其密度函数,即,对任意类型的 随机变量均成立,证明 ()由定义知,显然f(x) 0。()分布函数性质知,由广义积分概念与定义知,,(4) 密度函数f(x)并不直接表示概率值的大小。但在区间很小时,f(x)的数值还是能反映出随机变量在x附近取值的概率大小的。上式表明,在小区间x-x,x内的概率值大约为密度值与区间长度x的乘积。,(5) 可见,连续型随机变量X取一个固定值的概率为0。并且有,对任意类
23、型的 随机变量均成立,例16 设随机变量X的分布函数为()求常数、; ()判断X是否是连续型随机变量; ()求 P-1X1/2 解 ()由分布函数性质得,()因为 所以F(x)不是连续函数,从而X不是连续型随机变量。,例17 设已知连续型随机变量Y的密度函数是(1) 确定a的值; (2) 求Y的分布函数F(x); (3)求概率P(Y21)。 解 (1)根据密度的性质,有a0以及并称该随机变量服从柯西(Cauchy)分布。,(2) 求Y的分布函数F(x):(3)求概率P(Y21):,例18 向半径为R的圆形靶射击,假定不会发生脱靶的情况,弹着点落在以靶心O为中心,r为半径(rR)的圆形区域的概率
24、与该区域的面积成正比。设随机变量X表示弹着点与于靶心的距离,试求X的分布函数F(x)及其密度函数f(x) 解 因为不会发生脱靶,所以X的一切可能值是0, R当x0时,F(x)=P(Xx)=0当0xR时,F(x)=P(Xx)=kx2由于F(R)=P(XR)=1, kR2 =1,当xR时,F(x)=P(Xx)=P(必然事件)=1由于所以,密度函数为:,均匀分布最简单的连续型随机变量是密度函数在某有限区间取正的常数值,其余皆取零的随机变量,称为均匀分布。 均匀分布密度函数f(x)为,其分布函数F(x)为,例19 随机地向区间(-1,1)投掷一点,X为其横坐标,试求关于t的二次方程 t2+3Xt+1=
25、0 有实根的概率。 解 X在(-1,1)上服从均匀分布,其密度函数为方程t2+3Xt+1=0 有实根的的充要条件是9X2-4 0 则方程有实根的概率为,3.5 正态分布 在实际问题中,有许多随机变量都服从或近似服从正态分布,例如,测量误差;各种产品的质量指示(零件的尺寸、材料的强度、电子管的寿命);生物学中,同一群体的某种特征(某种动物的身长、体重;某种植物的株高、单位面积产量,)等等。在理论上可以证明,若X是某一随机试验的随机变量,如果决定试验结果的是大量的偶然因素的总和,各个偶然因素之间近乎相互独立,并且每个偶然因素的单独作用相对于作用的总和来说均匀地小,那么X就近似服从正态分布。正态分布
26、又叫高斯(Gauss)分布,它是最重要的连续型分布,在概率论中占有极其重要的地位,在实际中有着十分广泛的应用。,称概率密度为的随机变量X服从正态分布(或高斯分布),记作XN( , 2 ),其中,0,与是常数。 其分布函数是,特别地称N(0,1)为标准正态分布,其概率密度常记为 其分布函数记为,若 XN( 2 ),则证明,一般正态分布的概率可由标准正态分布计算。 若 XN( 2 ), 作标准变换: 则新的随机变量X*N(0 1),正态分布的密度函数与分布函数有下列性质: (1) f(x)和F(x)处处大于零,且具有各阶连续导数; (2) f(x) 在区间(,)内单调增加,在区间(,+)内单调减少
27、,在x=处取得最大值当x-或x+时,f(x)0,即x轴是f(x)的渐近线。 且f(x)的图形关于直线x=对称,是X的数学期望(平均值),即特别有,固定时,越小,密度曲线越是尖狭;越大,密度曲线越是平宽。是X的标准差(发散程度)。,(3) F(-x)=1-F(u+x)特别有 (4) (5) 如果XN(0,1),则P |X|x=2 1- (x) 证明,例20 设XN(0,1),借助于标准正态分布的分布函数 (x)的表计算:,例21 设XN(0,1),求使P|X|x=0.1的x。,例22 设XN(-1 4 ),试求P(-5X1), P(-2X2),P(|X|1), P(|X|3/2) 解 =-1,2
28、=4, =2,由于-x=1-(x),例23 设已知测量误差XN(0,102),现独立重复进行100次测量,求误差绝对值超过19.6的次数不少于3的概率。 解 这个问题既涉及正态分布,又涉及二项分布。第一步:以A表示一次测量中“误差绝对值超过19.6” 的事件,则有,第二步:以Y表示100次独立重复测量中,事件A发生的次数,则YB(100,0.05). 误差绝对值超过19.6的次数不少于3的概率为P(Y3)=1-P(Y3) 第三步:由于n100较大而p0.05很小,故二项分布可用 np 5的泊松分布近似代替,查泊松分布表可得 P(Y3)=1-P(Y3) =1-P(Y=0)-P(Y=1)-P(Y=
29、2),例24 公共汽车车门的高度是按男子与车门顶碰头的机会在0.01以下来设计的。设男子身高X服从=170cm, =6cm的正态分布,即XN(170,62),试确定车门的高度。 解 设车门的高度为hcm,根据设计要求应有P(Xh)0.01则 1-P(Xh)0.01 即 P(Xh)0.99由于XN(170,62),,例25 从南郊某地乘车前往北区火车站搭火车有两条路线可走,第一条穿过市区,路程较短,但交通拥挤,所需时间(单位为分钟)服从正态分布N(50,100),第二条沿环城公路走,路线较长,但意外堵塞较少,所需时间(单位为分钟)服从正态分布N(60,16)。 (1)如有70分钟可用,问应走哪一
30、条路线? (2)如只有65分钟可用,问应走哪一条路线?,解,指数分布 若一个连续型随机变量X具有概率密度函数:则称X为带参数a(0)的指数分布随机变量,记作 XE(a),其分布函数为,例26 设到某服务窗口办事,需要排队等候,若等待的时间X是指数分布随机变量(单位:分钟),则其概率密度为某人到此窗口办事,在等待15分钟后仍未能得到接待时,他就愤然离去,若此人在一个月内共去该处10次,试求:(1) 有2次愤然离去的概率;(2) 最多有2次愤然离去的概率;(3) 至少有2次愤然离去的概率。,解 首先求出他在任一次排队服务时,以愤然离去而告终的概率。在10次排队中愤然离去的次数YB(10, p) 有
31、2次愤然离去的概率 P(Y=2)= 最多有2次愤然离去的概率 至少有2次愤然离去的概率 P(Y2),3.6 一维随机变量函数的分布当随机变量X的分布已知时,怎样求出它的函数Yg(X)的分布。为了使Y有分布,要求Y是随机变量,因此对函数y=g(x)也必须有一定的要求。为简单起见,只讨论g(x)是连续、分段连续或单调的情形,在这些情形下,如果是X随机变量,则Yg(X)也是随机变量。在一些具体的分布中,可以了解解决这类问题的基本方法。,例27 设X的分布律为试求函数YX2,2X-1,|X|+1 的分布 解 由X的分布律可列出下表:将表中取相同值的部分作适当并项,得YX2的分布律:,2X-1的分布律:
32、|X|+1 :将表中取相同值的部分作适当并项, 得|X|+1的分布律为,一般情况下,已知离散型随机变量X的分布律:则函数g(X)的分布(若某些g(xi)相等,合并同值项):,对连续型随机变量X,求其函数g(X)的分布。 例28 设随机变量X具有连续的分布密度Xx,试求Y=aX+b的(其中a,b是常数,且a0)分布密度Y(y)。 解 设Y的分布函数为FY(y) 当a0时,,当a0时,,例29 设随机变量XN(,2),求 的密度函数Y(y)。 解 由于XN(,2),的密度函数是利用上例结果,得可见,当XN(, 2)时,则 服从任一正态分布的随机变量必定可以标准化。,例30 (习题3-28) 设XN(a , 2),求 的密度函数。 解 先求的分布函数FY(y)=P(Y0时, FY(y)=P(eX y)=P(Xlny),则有密度函数:,证明,作业评讲,3-1、解,3-2解,3-12、解,以X表示300台分机中,向总机要外线的分机数。,3-14、解,3-15、解,3-16、解,3-18、解,3-19、解,3-23、解,3-25、解,3-27、解,3-28、解,3-29、解,3-30、解,