1、4 连续型随机变量及其概率密度,第二章 随机变量及其分布,概率密度及其性质常用的连续型随机变量,4 连续型随机变量及其概率密度,一、概率密度函数的导出,我们已经计算并展示了仅当简单事件是有限个时的概率.现在讨论样本空间连续的情形.如同导数和积分,关键在于将连续情形看成越来越小、离散单元的极限.,理想:一个好的“随机数生成器”按照相等的概率给出0到1(但不是精确的数值1.0)之间所有可能数据中的一个数字.选取0.5的可能性和选择0.2345或任何一个无理数(如 )的可能性是相同的.因为此时有无穷多可能的事件(可选数字),我们无法使用直方图描述结果;直方图将需要无限多个条形.而且,正如我们将要看到
2、的,任何特定简单事件的“概率”(例如恰好选择0.2345的概率)是0.我们如何才能描述有无限多数的概率,取到每一个数的概率为零,而它们的概率的和必须为1.0?,4 连续型随机变量及其概率密度,近似:科学地讲,通过考虑一个更为现实的情形,我们克服了这个明显的悖论,因为随机数生成器仅给出一个有有限位精度的数字.另外,我们可以设想随机数生成器自身产生一个无限位的数字,但是我们仅观察到其前一个、两个、四个或八个位置.,4 连续型随机变量及其概率密度,例1 完美的随机数和不完美的测量,下表给出用一个理想的随机数生成器得到的精确的数据,以及通过给定小数位数得到的观察数据.,这些数据都没有舍入到最近的值,而
3、是通过去除后续的数位进行了截断.当有两位小数精度时,我们注意到 的值为0.70,它仅仅是将后续的数字简单删去.,4 连续型随机变量及其概率密度,这些不完美的测量值仅得到有限多个可能的结果.当有一位小数精度时,有10个简单事件(数值0.0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9);而当用两个小数精度时,有100个简单事件.,4 连续型随机变量及其概率密度,因为随机数生成器给出任何给定数据的可能性都是相同的,第一个小数位置为0的可能性和为1,2或任何其他直到9的数字的可能性都是一样的.因此这十个概率都是相等的.为使得它们的和为1.0,则其每一个概率
4、必然恰为0.1(图6.6.57).,例2 有一个小数位的随机数的直方图,4 连续型随机变量及其概率密度,因为随机数生成器用相等的可能性得到任何给出的数据,其前两个小数位恰为00的可能性和19,82,或任何直到99的数对的可能性都是相同的.这100个概率互相相等,且为使得它们的和相加为1.0,则每一个必等于0.01.现在在直方图中有许多极窄的短条(图6.6.58).,例3 有两个小数位的随机数的直方图,4 连续型随机变量及其概率密度,新型直方图:为使直方图有更强的可读性,我们 将绘制一种新型的直方图,用面积(而不是用 高度)来表示概率.,4 连续型随机变量及其概率密度,对有一位小数精度的情形,每
5、一个数值的概率都是0.1,且例2中的直方图将其表示为条形的高度为0.1.然而,每一个条形的宽度也是0.1.于是,对面积为0.1的条形区域,它的高度必须为1.0(图6.6.59).,例4 有一个小数位的随机数的新型直方图,4 连续型随机变量及其概率密度,当有两位小数精度时,每一个情况的概率均为0.01,且例3中的直方图显示这些概率为高度为0.01的微小条形.每一个条的宽度也为0.01,且对面积为0.01的条形,其高必然为1.0(图6.6.60).,例5 有两个小数位的随机数的新型直方图,4 连续型随机变量及其概率密度,考虑从一个细胞扩散出的单个分子,并考虑测量的是离开的时刻. 对任何正数t,简单
6、事件为“分子恰在时刻t离开”.分子恰在时刻 离开的概率是什么? 严格地讲,这个概率是0.一个微小的不同,即使在第一百万位小数位置上存在,也将意味着完全不同的简单事件.而且这个逻辑对任何时刻t都是成立的.因此分子恰好在任何特殊的时刻离开的概率均为0.,观察关于概率密度函数的另外一个例子:,4 连续型随机变量及其概率密度,近似:通过考虑不完美的测量设备,来克服这个显然的矛盾. a.如果我们的设备的精度仅有10秒,我们无法区分从0到10,10到20,且以此类推区间内部的值.例如,3.14159的真实值无法和2.71828的真实值进行区分.我们可以将0到50的区间分为五个宽度为10的块.其结果为,4
7、连续型随机变量及其概率密度,我们再次绘制新的直方图,其中用条形的面积而不是高度表示离开时间位于区间内的概率(图6.6.61a).例如,分子在时刻0到10之间分子离开的概率为0.63,因此我们绘制一个高度为0.063且宽度为10的条形.,4 连续型随机变量及其概率密度,b.使用一个精度为2.0秒的更为精确的设备,我们将可能性划分为从0到2,2到4,等以此类推,并发现,4 连续型随机变量及其概率密度,c.当精度为0.5秒时(图6.6.62a),其直方图看起来更像图6.6.62b中给出的曲线.这个曲线什么意义?假设我们想求分子在时刻0到10之间离开的概率.当精度为10秒时(图6.6.61a),它为第
8、一个条形下面的面积.,我们可以再次绘制面积等于概率的条形(图6.6.61b).分子在时刻2到4离开的概率为0.148.因为条形的宽度为2.0,因此条形的高度必为0.074以使其面积为0.148.,4 连续型随机变量及其概率密度,当精度为2秒时(图6.6.61b),它是其下面五个条形面积的和.这些面积为曲线下面积的近似值.利用数学上精确的方法,概率等于在0到10之间曲线下的面积.如果我们知道曲线的公式,我们可以利用积分求得概率.指数分布!,4 连续型随机变量及其概率密度,学习如何使用概率密度函数之前,我们首先看看什么曲线可以作为概率密度函数.,假设简单事件可以用实数x为指标.令a为一个最小可能的
9、简单事件,而b为最大的.一个函数 f (x) 若满足条件:1. 对所有 a x b 的 x, f (x) 0.2. 则称其为概率密度函数.,第一个要求说明概率必为非负的,第二个说明它们的和相加必然为1.该定义不要求函数的取值如在概率分布中的定义一样小于1.,4 连续型随机变量及其概率密度,(我们将积分中的t改写为s以避免使用相同的字母表示两个不同的含义.),对一个离开时刻具有概率密度函数,的分子在某一给定时间t之前离开的概率是什么?为求其在时刻t = 10之前离开的概率,我们求积分,而分子在某一般时刻t之前离开的概率为,4 连续型随机变量及其概率密度,分布函数,二.连续型随机变量的概念与性质,
10、则称 X 为连续型随机变量,其中函数 称为X 的概率密度函数,简称概率密度或密度函数.,定义 如果对于随机变量X 的分布函数 ,存在非负实函数 ,使得对于任意实数 ,有,4 连续型随机变量及其概率密度,说 明,这两条性质是判定一个 函数 f(x)是否为某r.vX的 概率密度函数的充要条件.,概率密度 具有以下性质:,4 连续型随机变量及其概率密度,我们如何利用概率密度函数呢?由于概率为曲线下的面积,而一个曲线下的面积可由积分表达.因此,若f 为概率密度函数,则,4 连续型随机变量及其概率密度,对 f(x)的进一步理解:,1:,概率密度的功能正如通常的密度(比如g/cm3).尽管在一个给定点上精
11、确地没有质量,但其整体质量可通过积分求得.,4 连续型随机变量及其概率密度,若不计高阶无穷小,有,它表示随机变量 X 取值于 的概率近似等于 .,2:,4 连续型随机变量及其概率密度,连续型r.v取任一指定值的概率为0.,即,a为任一指定值,这是因为,3:,所以有,4 连续型随机变量及其概率密度,由此得,,1) 对连续型 r.v X,有,2) 由P(X=a)=0 可推知,而 X=a 并非不可能事件,可见,,并非必然事件.,由P(B)=1, 不能推出 B=,由P(A)=0, 不能推出,4 连续型随机变量及其概率密度,要注意的是,密度函数 f (x)在某点处a的高度,并不反映X取值的概率.但是,这
12、个高度越大,则X取a附近的值的概率就越大.也可以说,在某点密度曲线的高度反映了概率集中在该点附近的程度.,4:,4 连续型随机变量及其概率密度,(图6.6.67).其纵轴的取值高于1.这在数学上是相容的,因为高度并不等于概率,而仅仅是和它成比例.,例6 (取值超过1的概率密度函数),若一个分子离开细胞非常快, 概率密度函数可能为,4 连续型随机变量及其概率密度,尽管概率密度函数的值大于1,但其面积小于1.,在时刻 t = 0 时概率密度函数的值较大表示在时刻 t = 0 附近分子更趋向于离开细胞,这和离开的速度很大是相容的.一个分子在时刻0.1和0.2之间离开的概率为,4 连续型随机变量及其概
13、率密度,说 明,由上述性质可知,对于连续型随机变量,我 们关心它在某一点取值的问题没有太大的意义; 我们所关心的是它在某一区间上取值的问题,4 连续型随机变量及其概率密度,例7,设 X 是连续型随机变量,其密度函数为,解: 由密度函数的性质,4 连续型随机变量及其概率密度,例 7(续),4 连续型随机变量及其概率密度,例 7(续),4 连续型随机变量及其概率密度,例 7(续),4 连续型随机变量及其概率密度,4 连续型随机变量及其概率密度,例8,例 9,4 连续型随机变量及其概率密度,4 连续型随机变量及其概率密度,例10,由分布函数的性质,有,解得,4 连续型随机变量及其概率密度,例10(续
14、),例 11,某电子元件的寿命X(单位:小时)是以,为密度函数的连续型随机变量求 5 个同类型的元件在使用的前 150 小时内恰有 2 个需要更换的概率.,解:设A= 某元件在使用的前 150 小时内需要更换,4 连续型随机变量及其概率密度,例 11(续),检验 5 个元件的使用寿命可以看作是在做一个5 重Bernoulli试验以Y记5 个元件中使用寿命不 超过150小时 的元件数.则,B= 5 个元件中恰有 2 个的使用寿命不超过150小时 ,4 连续型随机变量及其概率密度,练 习,1.设随机变量的密度函数为,且概率,求常数a,b的值。,解:,a = 3/4, b = 3/4.,4 连续型随
15、机变量及其概率密度,二.一些常用的连续型随机变量,4 连续型随机变量及其概率密度,1均 匀 分 布,记作 X U a , b.,若随机变量 的密度函数为,密度函数的验证,4 连续型随机变量及其概率密度,X,X,a,b,x,l,l,0,类似地,我们可以定义,4 连续型随机变量及其概率密度,均匀分布的概率背景,4 连续型随机变量及其概率密度,如在数值计算中,由于四舍五入,小数点后某一位小数引入的误差,例如对小数点后第一位进行四舍五入时,那么一般认为误差服从(-0.5, 0.5)上的均匀分布。,均匀分布的应用:,某一时间间隔内汽车站上乘客到站的时间, 等均认为服从均匀分布。,4 连续型随机变量及其概
16、率密度,均匀分布的分布函数,a,b,x,F (x),0,1,4 连续型随机变量及其概率密度,例 12,设公共汽车站从上午7时起每隔15分钟来一班车,如果某乘客到达此站的时间是 7:00 到7:30之间的均匀随机变量试求该乘客候车时间不超过5分钟的概率解: 设该乘客于7时X分到达此站,4 连续型随机变量及其概率密度,例 12(续),令B= 候车时间不超过5分钟 ,4 连续型随机变量及其概率密度,例 13,4 连续型随机变量及其概率密度,例 13(续),4 连续型随机变量及其概率密度,2指 数分布,如果随机变量 X 的密度函数为,4 连续型随机变量及其概率密度,指数分布的分布函数,指数分布最常见的
17、场合是寿命分布: 指数分布常作为各种“寿命”分布的近似分布,如:“灯泡的寿命”,“动物的寿命”,“电话问题中的通话时间”,“随机服务系统中的服务时间”都常假定服从指数分布。,注意:,4 连续型随机变量及其概率密度,指 数分布的重要性质:,设X服从指 数分布,则,若把X解释为寿命,则上式表明:如果已知某人活了 s 年,则他至少再活 t 年的概率与年龄s 无关,所以人们风趣地称指 数分布的这一性质为“永远年轻”,又称“无记忆性”-即把过去的年龄忘记了。,4 连续型随机变量及其概率密度,例 14,4 连续型随机变量及其概率密度,例 14(续),令B= 等待时间为1020分钟 ,4 连续型随机变量及其
18、概率密度,正态分布是应用最广泛的一种连续型分布.,正态分布在十九世纪前叶由 高斯(Gauss)加以推广,所以通常称为高斯分布.,德莫佛,德莫佛(De Moivre)最早发现了二项分布的一个近似公式,这一公式被认为是正态分布的首次露面.,3.正态分布,高斯,4 连续型随机变量及其概率密度,正 态 分 布,x,f (x),0,4 连续型随机变量及其概率密度,密度函数的验证,4 连续型随机变量及其概率密度,密度函数的验证(续),4 连续型随机变量及其概率密度,密度函数的验证(续),4 连续型随机变量及其概率密度,密度函数的验证(续),4 连续型随机变量及其概率密度,密度函数的验证(续),4 连续型随
19、机变量及其概率密度,密度函数的验证(续),4 连续型随机变量及其概率密度,(I)、正态分布 的图形特点,正态分布的密度曲线是一条关于 对称的钟形曲线.,特点是“两头小,中间大,左右对称”.,4 连续型随机变量及其概率密度,决定了图形的中心位置, 决定了图形中峰的陡峭程度.,正态分布 的图形特点,4 连续型随机变量及其概率密度,故f(x)以为对称轴,并在x=处达到最大值,令x=+c, x=-c (c0), 分别代入f (x), 可得,f (+c)=f (-c),且 f (+c) f (), f (-c)f (),4 连续型随机变量及其概率密度,这说明曲线 f(x)向左右伸展时,越来越贴近x轴。即
20、f (x)以x轴为渐近线。,当x 时,f(x) 0,用求导的方法可以证明,x = ,为f (x)的两个拐点的横坐标。,4 连续型随机变量及其概率密度,实例 年降雨量问题,我们用上海99年年降雨量的数据画出了频率直方图。,从直方图,我们可以初步看出,年降雨量近似服从正态分布。,4 连续型随机变量及其概率密度,下面是我们用某大学大学生的身高的数据画出的频率直方图。,红线是拟合的正态密度曲线,可见,某大学大学生的身高应服从正态分布。,4 连续型随机变量及其概率密度,人的身高高低不等,但中等身材的占大多数,特高和特矮的只是少数,而且较高和较矮的人数大致相近,这从一个方面反映了服从正态分布的随机变量的特
21、点。,4 连续型随机变量及其概率密度,除了我们在前面遇到过的年降雨量和身高外,在正常条件下各种产品的质量指标,如零件的尺寸;纤维的强度和张力;农作物的产量,小麦的穗长、株高;测量误差,射击目标的水平或垂直偏差;信号噪声等等,都服从或近似服从正态分布.,4 连续型随机变量及其概率密度,正态分布的重要性,正态分布是概率论中最重要的分布,这可以由以下情形加以说明:,正态分布是自然界及工程技术中最常见的分布之一,大量的随机现象都是服从或近似服从正态分布的可以证明,如果一个随机指标受到诸多因素的影响,但其中任何一个因素都不起决定性作用,则该随机指标一定服从或近似服从正态分布,正态分布有许多良好的性质,这
22、些性质是其它许多分布所不具备的,正态分布可以作为许多分布的近似分布,4 连续型随机变量及其概率密度,4 连续型随机变量及其概率密度,(III)、标准正态分布,的正态分布称为标准正态分布.,其密度函数和分布函数常用 和 表示:,4 连续型随机变量及其概率密度,它的依据是下面的引理:,标准正态分布的重要性在于,任何一个 一般的正态分布都可以通过线性变换转化为 标准正态分布.,引理2.4.1,(2)则,4 连续型随机变量及其概率密度,证:(1)分别记Y的分布函数和概率密度为,4 连续型随机变量及其概率密度,将上面两式分别对X求导整理得,4 连续型随机变量及其概率密度,根据引理2.4.1,只要将标准正
23、态分布的分布函数制成表,就可以解决一般正态分布的概率计算问题.,4 连续型随机变量及其概率密度,书末附有标准正态分布函数数值表,有了它,可以解决一般正态分布的概率计算查表.,(IV)、正态分布表,表中给的是x0时, (x)的值.,当-x0时,4 连续型随机变量及其概率密度,若,N(0,1),若 XN(0,1),4 连续型随机变量及其概率密度,由标准正态分布的查表计算可以求得,,这说明,X的取值几乎全部集中在-3,3区间 内,超出这个范围的可能性仅占不到0.3%.,当XN(0,1)时,,P(|X| 1)=2 (1)-1=0.6826,P(|X| 2)=2 (2)-1=0.9544,P(|X| 3
24、)=2 (3)-1=0.9974,(V)、3 准则,4 连续型随机变量及其概率密度,将上述结论推广到一般的正态分布,时,,这在统计学上称作“3 准则”(三倍标准差原则).,4 连续型随机变量及其概率密度,例 15,4 连续型随机变量及其概率密度,例16,4 连续型随机变量及其概率密度,例16(续),4 连续型随机变量及其概率密度,例16(续),4 连续型随机变量及其概率密度,例17,4 连续型随机变量及其概率密度,例18,4 连续型随机变量及其概率密度,例 19,4 连续型随机变量及其概率密度,例 19(续),4 连续型随机变量及其概率密度,例20 (1)假设某地区成年男性的身高(单 位:cm
25、)XN(170,7.692),求该地区成年 男性的身高超过175cm的概率。,解: (1) 根据假设XN(170,7.692),则,故事件X175的概率为,P X175=,=0.2578,4 连续型随机变量及其概率密度,解: (2) 设车门高度为h cm,按设计要求,P(X h)0.01,或 P(X h) 0.99,,下面我们来求满足上式的最小的 h.,(2)公共汽车车门的高度是按成年男性与车门顶头碰头机会在0.01以下来设计的,问车门高度应如何确定?,4 连续型随机变量及其概率密度,因为XN(170,7.692),故 P(X h)=,0.99.,查表得 (2.33)=0.99010.99,所
26、以 =2.33,即 h=170+17.92 188,设计车门高度为 188厘米时,可使 男子与车门碰头 机会不超过0.01.,4 连续型随机变量及其概率密度,0,4 连续型随机变量及其概率密度,0,4 连续型随机变量及其概率密度,1.设随机变量X在区间(-3,6)上服从均匀分布,求 的方程 有实根的概率。,练 习,解:,X的概率密度函数,4 连续型随机变量及其概率密度,2.设随机变量X的分布函数为 求:(1)A,B的值;(2)X的概率密度; (3),解:(1),4 连续型随机变量及其概率密度,3.设随机变量X的概率密度函数,(1)试确定常数k; (2)求 的分布函数; (3)求,X,解:,(1)1=,4 连续型随机变量及其概率密度,P46-47 12. 14. 17. 18. 20. 22. 23.,作 业,4 连续型随机变量及其概率密度,