1、勤学好问必有所获,第二章 随机变量的分布及其数字特征,随机变量与分布函数,离散型与连续型随机变量的概率分布,常用的几个随机变量的概率分布,随机向量及其分布函数 边际分布,二维离散型与连续型随机向量的概率分布,条件分布 随机变量的独立性,随机变量函数的概率分布,概率论,随机变量与随机变量分布函数 一、随机变量为了更有效的研究随机现象的规律,需要引入微积分作为工具,这就需要用变量的形式来表达随机现象。先考察下列两个随机试验的例子例2.1 某人抛掷一枚骰子,观察出现的点数。试验结果的事件表达形式: 出现1点;出现2点;出现3点; 出现4点;出现5点;出现6点。 如果令 表示出现的点数,则 的可能取值
2、为 于是,试验结果的变量表示为:“出现1点” ; “出现2点”“出现3点” ; “出现4点”“出现5点” ; “出现6点”例2.2 某人掷硬币试验,观察落地以后出现朝上面的情况。试验结果的事件表达形式:,Random Variable,花面朝上;字面朝上如果 表示花面朝上面, 表示字面朝上。 于是,试验结果的变量表示为:“花面朝上” ;“字面朝上”特点:试验结果数量化了,试验结果与实数建立了对应关系。1. Def 设随机试验 的样本空间为 ,如果对于每一个样本点 ,均有唯一的实数 与之对应,并且X满足(1)X是由 唯一确定。(2)对任意给定的实数 ,事件 都是有概率的 则称 为样本空间 上的随
3、机变量。随机变量特征:1)它是一个变量;2)它的取值随试验结果而改变;3)随机变量在某一范围内取值,表示一个随机事件。设 为一个随机变量,对于任意实数 ,则集合 是随机事件,随着 变化,事件 也会变化。 这说明该事件是实变量 的“函数”。,2. 随机变量举例与分类随机变量实例:例2.3 某人抛掷一枚骰子,观察出现的点数 。的可能取值为 。例2.4 某个灯泡的使用寿命 。的可能取值为 。例2.5 一部电话总机在一分钟内收到的呼叫次数 。的可能取值为 。例2.6 在 区间上随机移动的点,该点的坐标 。的可能取值为 。,有限或无穷可列取值,无穷且不可列取值,二、分布函数1. 随机变量的概率分布Def
4、 能反映随机变量取值规律的数学表达式称为随机变量的概率分布律,简称概率分布。概率分布的常用表达方式有:分布函数(“通用型”);概率函数或概率密度函数(“针对型”)。2. 分布函数概念Def 设 为随机变量, 为任意实数,则 称为随机变量 的分布函数,其定义域为 。显然,分布函数是一个特殊的随机事件的概率。3. 分布函数的性质(1)对于任意 有 (非负有界性);(2) (规范性);(3)对于任意 有 (单调性);(4) 在每一点至少是右连续的 (连续性)。,是一个实函数!,Distribution Function,若已知随机变量 的分布函数 ,则对于任意 有例2.7 已知随机变量 的所有可能取
5、值为 ,取各值的概率分别为 ,试求随机变量的分布函数并作其图像。解:由题设随机变量的概率分布为由分布函数的定义有当 时, ;当 时,;当 时,;当 时, 。分布函数图像如图2.1所示,图2.1,离散型随机变量及其分布一、 离散型随机变量Def 如果随机变量所有可能取值为有限或无穷可列,则该随机变量称为离散型随机变量。设离散型随机变量 的所有可能取值是 ,而取值 的概率为 ,即有则称该式为随机变量 的概率函数。其也可以用下列表达:并称其为随机变量 的概率分布列,简称分布列。注意:离散型随机变量的概率分布除用分布函数可以表示以外,还可以利用概率函数或分布列表示,概率函数与分布列是等效的,概率函数或
6、分布列表示更直观、简便。,2. 概率函数或分布列的性质(1) ;(2) (归一性)。3. 概率函数与分布函数的关系已知概率函数求分布函数已知分布函数求概率函数例2.8 设 的分布列为试求 。解:由随机变量 的分布列有,例2.9 设有一批产品20件,其中有3件次品,从中任意抽取2件,用 表示抽取出2件产品中的次品数,求随机变量的分布律和“至少抽得一件次品”的概率。解: 的可能取值为 。 于是,由古典概率有所以, 的分布列为对立事件,例2.10 一名士兵向一目标连续射击,直至其击中目标为止。假定该士兵命中率为 ,而且任意两次射击之间互不影响,用 表示该名士兵射击次数。求 的概率分布。解: 的可能取
7、值为 ;设 表示该名士兵第 次击中目标, 。于是有 相互独立; 。所以 即 的概率函数为注意:这种类型的随机变量取值愈大,概率值愈小,是典型的不等概分布。,例2.11 设随机变量 的概率函数为试求(1)常数 的值;(2)概率最大的 取值。解: (1) 由概率函数的性质有又有函数的幂级数展开知 ,从而有解得(2) 由(1)知随机变量的分布列为显然,随机变量 取1和2的概率最大。,二、常用的离散型随机变量的概率分布、1. 二点分布(0-1分布)Def 若随机变量 的分布表为其中 ,则称 服从参数为 的二点分布。,二点分布所能刻画随机现象:凡是随机试验只有两个可能的结果,都可以二点分布作为其概率模型
8、。例如:掷硬币观察正反面,产品是否格,人口性别统计,系统是否正常,电力消耗是否超负荷等等。,显然,凡是n重贝努力概型中,事件A发生次数的概率分布规律均可用二项分布来刻画。当n=1时,二项分布即为两点分布。,例2.12 设某学生期末考试共有5门课程要考,已知该学生每门课及格的概率为0.8,试求该学生恰好有3门及格和至少有3门及格的概率。,例2.13 某人骑摩托车上街,出事的概率为0.02,独立重复上街400次,求至少2次出事的概率。,通过例题知:二项分布当参数n很大,而p很小时,有关概率的计算是相当麻烦的。甚至有时借助于计算工具也难实现。为了解决这种情况下的二项分布有关概率计算问题,1837年法
9、国数学家S.D.Poisson提出泊松定理,从而形成泊松分布,解决了二项分布中的上述问题。,实际应用中:当n较大, p较小,np适中时,即可用泊松定理的结果对二项概率进行近似计算。,显然例2.15用泊松分布的概率函数计算更为简便。在生物学、医学、工业统计、保险科学及公用事业的排队等问题中,泊松分布是常见的。如:地震、火山爆发、特大洪水、交换台的电话呼叫次数等,都服从泊松分布。若某人做某事的成功率为1%,他重复努力400次,则该人成功的概率为 。这表明随着实验次数的增多,小概率事件是会发生的!,超几何分布在产品质检中经常用到,若有N件产品,M件不合格,采用不放回抽样抽取n件,则n件中不合格产品的
10、件,数 。若 时,记 时,超几何分布趋于参数为 的二项分布。一般在实践中,若 ,而抽样强度 时,超几何分布可以近似用 来计算其概率。即上式表明超几何分布与二项分布的联系超几何分布 二项分布 泊松分布 (6)几何分布:若离散型R.V. 的概率函数为:,则称X 服从几何分布,记为:。由于该概率函数是几何级数 的通项,故得名。如:一人要开门,共有 把钥匙,仅有1把能打开次门,他随机取一把,每次试开的每把钥匙以 被使用,则此人第 次试开成功的概率为:,连续型随机变量及其分布一、 连续型随机变量Def 设 为随机变量,其分布函数记为 ,如果存在非负的可积函数 ,使得则称 为连续型随机变量,非负函数 为概
11、率密度函数,简称概率密度或密度函数。2. 概率密度的性质(1)对于任意 有 ;(2) ;(3)对于任意 有 ;(4)在函数 连续点有 。,3. 连续型随机变量与离散型随机变量区别定理:设 为连续型随机变量, 为任意实数,则有证明:设 的分布函数为 ,易知 处处连续。于是,对于任意的 ,一定成立下列结论:不等式关于 求极限,便得所以有该定理表明连续型R.V.的概率分布不能用逐点取值的概率表达,而只能用概率密度来表达。连续型R.V. 在任意实数处的概率均为0,概率为0的事件并不一定是不可能事件。,对于连续型随机变量总成立下式:例2.14 设随机变量 的概率密度为试求 。解: 有概率密度的性质知解得
12、 ,所以,例2.15 设连续型随机变量 的分布函数为试求(1)常数 的值;(2) ;(3) 概率密度。解: (1)由于连续型随机变量分布函数处处连续,所以有从而有 ,于是分布函数为(2)(3),二、常用的连续型随机变量的概率分布1. 均匀分布(Uniform Distribution)Def 若随机变量 的概率密度函数为则称随机变量 服从区间 上的均匀分布,记为 均匀分布所能刻画随机现象:“等可能”地取区间 中的值。这里的“等可能”理解为: 落在区间 中任意等长度的子区间内的可能性是相同的;或者说它落在子区间内的概率只依赖于子区间的长度而与子区间的位置无关。这正是几何概型的情形。例2.16 设
13、 在 上服从均匀分布,求方程 有实根的概率。解: 方程有实数根等价于 ,即 ;所求概率为 。,2. 指数分布(Exponential Distribution)Def 若随机变量 的概率密度函数为则称随机变量 服从参数为 的指数分布,记为指数分布所能刻画随机现象:随机服务系统中的服务时间;电话的通话时间;无线电元件的寿命;动植物的寿命。例2.17 设 服从参数为3的指数分布,试写出它的密度函数并求 。解: 的概率密度为,3. 威布尔分布,正态分布Def 若随机变量 的概率密度函数为其中参数 满足 ,则称随机变量 服从参数为 的正态分布,记为 。 显然,密度函数满足两性质。从而知正态分布的分布函
14、数为:,Gauss,正态分布密度函数的性质:密度函数关于 对称;密度函数在 处取得最大值 ;,参数 对密度曲线的影响,相同 不同 密度曲线情况,相同 不同 密度曲线情况,位置参数变化,形状参数变化,密度函数在 处有拐点,且以 轴为其水平渐近线。参数 的意义: 为密度函数中心位置的横坐标; 表示曲线的陡峭程度, 越大曲线越平; 越小曲线越陡。正态分布的有关概率计算当 时,称其为标准正态分布,记作: 其密度函数和分布函数分别用 表示,即:,标准正态分布的密度函数为偶函数,则其分布函数值可查附表。正态分布有其广泛的实际背景,如:测量误差,人的身高、体重,考试成绩,炮弹的弹落点等。正态分布是概率论中最
15、重要的分布,体现在以下方面:(1)正态分布是自然界及工程技术中最常见的分布之一,大量的随机现象都服从或近似正态分布。事实上,若一随机指标受到诸多因素的影响,但其中任何一个因素都不起决定性作用,则该随机指标一定服从或近似服从正态分布;(2)正态分布可以作为许多分布的近似分布;(3)正态分布有许多其它分布不具备的良好性质。正态分布的概率计算常用到,若其为 ,则可直接查表;若是 ,则将其通过标准化变换转换为 进行计算。,下面给出一重要结论:Th 若 ,令 ,则 。Proof 设R.V. 的分布函数为 ,则由分布函数的定义有:此式表明 ,称 为标准化变换,因此,若 ,则例2.18 设 ,求: , 。,
16、解:例2.19 ,求:C,使 ,。解:由已知有 从而有 , 即 , 从而得练习 某地区8月份的降雨量 mm,写出 的密度函数并求该地区8月份降雨量超过250mm的概率。答案:0.0102,若 ,要求 的分位数 ,先由查表得 ,再由 确定 。例2.20 某省高考采取标准分,并认为考试成绩 近似服从 ,若某一科的录取率为30.9%,问录取分数线应划定在多少分以上?解:设录取分数线应划定在 以上,则由题意知:由于所以则,2.5 随机变量函数的概率分布在实际生活中,经常会遇到这样的问题:有一群人,若用 分别表示一个人的年龄和体重, 表示该人的血压,并且已知 与 的函数关系为 ,如何通过 的分布确定 的
17、分布。为了解决此类问题,我们引入随机变量函数的概率分布。一、一维R.V.函数的概率分布1.随机变量函数的定义Def 设 为R.V., 为实连续函数,令,则称 为R.V. 的函数。注: 仍为随机变量; 与 具有相同的类型。,3.一维连续型R.V.函数的概率分布若R.V. 为连续型,已知其密度函数为 , 为连续函数,确定 的概率分布。,Th 设 的密度函数为 , 。若 是严格单调函数且处处可导,则 是连续型R.V.,其密度函数为其中 , 为 的反函数,且可导。,则 的密度函数为:例2.22 若R.V. 的密度函数为:求 的概率密度函数。解:设 的密度函数为 ,则有,则有则 。,例2.23 若 ,求
18、 的概率分布。解:设 的密度函数为 ,有,例2.24 若R.V. 的密度函数为 ,求 的密度函数解:设R.V. 的分布函数分别为 , 的密度函数为 ,则若 不成立,故 ; 若 ,则所以,2.6 随机变量的数字特征 在前面的课程中,我们讨论了随机变量及其分布,如果知道了随机变量X的概率分布,那么,X的全部概率特征也就知道了.然而,在实际问题中,概率分布一般是较难确定的. 而在一些实际应用中,人们并不需要知道随机变量的一切概率性质,只要知道它的某些数字特征就够了.因此,在对随机变量的研究中,确定某些数字特征是重要的 .,一、R.V.数学期望1.算术平均数:2.加权平均数:若变量 有 个取值,却只有
19、 个不同的取值且各不同取值的频数为 , 则由平均数的概念有:称为加权平均数, 为 取 的权重。,3、数学期望的定义,离散型随机变量,Def 设离散型随机变量的概率分布为,连续型随机变量,Def 设连续型随机变量的概率密度为,,若广义积分,注意 不是所有的 R.V.都有数学期望,例如:柯西(Cauchy)分布的密度函数为,它的数学期望不存在!,随机变量数学期望所反应的意义 随机变量数学期望反映了随机变量所有可能取值的平均, 它是随机变量所有可能取值的最好代表。,1.二项分布 即 求,2 已知随机变量,。求数学期望,4 已知随机变量,求数学期望,随机变量函数的数学期望,设,是随机变量 X的函数,,
20、离散型,连续型,该公式的重要性在于: 当我们求Eg(X)时, 不必知道g(X) 的分布,而只需知道X的分布就可以了. 这给求随机变量函 数的期望带来很大方便.,解:因为,中位数Def R.V. 的分布函数为 ,若存在 使得 ,则称 为R.V. 的中位数,记作:表示“ 取值比 小的可能性与 取值比 大的可能性相等”。例2.27 R.V. 的分布为 ,求,随机变量数学期望的性质,1. 设C是常数,则E(C)=C;,2. 若k是常数,则E(kX)=kE(X);,3. E(aX+b) = aE(X)+b;,解:由于当 时, ,所以 为 上的任意值。例2.28 R.V. 的分布函数为 ,求 。解:由于所
21、以即数学期望 不存在。,即 ,所以该分布为Cauchy分布,其数学期望不存在,中位数为零。,二、 方 差(Variance)数学期望是一种加权平均,与一般的平均值不同,它从本质上反映了R.V.取值的真正平均。但要了解R.V.取值的全貌,仅知道均值是不够的,还应知道R.V.取值的分散程度,即方差。 1、方差的定义Def R.V. ,若 存在,则称其为R.V. 的方差,记作: 或 。即称 为R.V. 的标准差或均方差,记作: ,即,若R.V. 为离散型,其概率函数为 则 的方差为:若R.V. 为连续型,其密度函数为 ,则 的方差为:,为了计算方便,方差还可以表示为如下形式:,几种常用分布的方差1.
22、二项分布 即 ,求,当 时,,2.泊松分布 即 ,求3.均匀分布 即 ,求,3、方差的性质设R.V. 的方差均存在, 为常数,则方差有如下的性质1. ; 2. ;3. ;4.若 ,则 ;5.若R.V. 的方差存在,则 。,三、矩、偏度和峭度1.Def R.V. ,若 存在,则称其为R.V. 的 阶原点矩。记作: ,即因此, 为 的一阶原点矩,则对具体离散型和连续型R.V.有,2.Def R.V. ,若 存在,则称其为R.V. 的 阶中心矩,记作: ,即因此, 为 的2阶中心矩,则对具体离散型和连续型R.V.有,2.Def R.V. ,若 存在,则称其为R.V. 的 阶中心矩,记作: ,即因此, 为 的2阶中心矩,则对具体离散型和连续型R.V.有,2.Def R.V. ,若 存在,则称其为R.V. 的 阶中心矩,记作: ,即因此, 为 的2阶中心矩,则对具体离散型和连续型R.V.有,3.中心矩与原点矩的关系,偏度. Def 设X 为R.V., 称 为随机变量分布的偏斜系数简称偏度。,峭度. 设X 为R.V., 称 为随机变量分布的峰态系数或陡峭系数简称峰度或峭度。,