1、第三章连续型随机变量一、 教学目的与要求1掌握分布函数的定义和性质;2掌握连续型随机变量的概率密度,特别是均匀分布、指数分布、正态分布的概率密度;二维连续型随机变量的联合概率密度和边际密度。3掌握连续型随机变量的数学期望、方差。4掌握表示随机变量相互关系的数字特征:协方差、相关系数,随机变量的不相关与独立的异同。5掌握连续型随机变量函数的分布密度的求法,掌握卷积公式。二、 教学重点与难点教学重点是分布函数与连续型随机变量的密度函数,期望、方差的有关概念。教学难点是协方差、相关系数的有关计算,及卷积公式的应用。第三章 连续型随机变量3.1 随机变量及分布函数一、分布函数的概念定义:设定义在样本空
2、间 上的随机变量 ,对于任意实数 x,是随机变量 的概率分布函数,简称为分布函数或分布。分布函数实质上就是事件 的概率。二、分布函数的性质由概率的性质可知:1)非负性: 2)单调性: 若 则3)若 进一步 4)极限性 证都存在,又由概率的完全可加性有5)左连续性 证: 是单调有界函数,其任意一点的左极限 必存在,为证明其左连续性,只要对某一列单调上升的数列证明 成立即可。这时有由此可得2)、4)、5)是分布函数的三个基本性质,反过来还可以 证明任一个满足这三个性质的函数,一定可以作为某个随机变量的分布函数。知道了随机变量的分布函数 ,不仅可以求出 的概率而且还可以计算下述概率由此可以看出,上述
3、这些事件的概率都可以由 算出来,因此 全面地描述了随机变量 的统计规律,既然分布函数能 够全面地描述一般的随机变量的统计规律,因而分布函数这个概念比分布列更重要。三、离散型随机变量的分布函数设 为一个离散型随机变量,它的分布列为则 的分布函数为对离散型随机变量,用得较多的还是分布列。例 1、 若 服从退化分布即则 的分布函数为例 2、 若 服从两点分布1 0P q求 的分布函数 F(x)。解: 当当 时,当 时,例 3、 设 的分布列为0 1 20.3 0.4 0.3求 的分布函数 。解: 当当 时,当 时,当于是从上面例子可以看到, 是一阶梯状的左连续函数,在处有跳跃,其跃度为 在 处的概率
4、。例 4、 等可能的向区间 上投掷质点,求 质点坐标 的分布函数。解:设 为任一实数,当 时, 显然有当 时,由几何概型可知当从而例 5设随机变量 的分布函数为求 1)常数 A,B ; 2)P( 。解:1)由极限性 得 从而解于是2)例 6设随机变量 的分布函数为 , 求: 1)常数 A ; 2) 落在 上的概率。解:1) 左连续,故于是2)由例 5,例 6 可知求分布函数中的待定常数,主要是利用分布函数的极限性及左连续性。3.2 连续型随机变量一、连续型随机变量的概念1、定义定义:设 是随机变量, 是它的分布函数,如果存在可能函数 使得对任意的 ,有 ,则称 为连续型随机变量,相 应的 为连
5、续型分布函数,同时称 是 的概率密度函数或称为密度。2、密度函数的性质由分布函数的性质,可以验证任一连续型随机变量的密度函数 必具备下列性质:1)非负性:2)规范性:反过来,定义在 R 上的函数 ,如果具有上述两个性 质,即可定 义一个分布函数 。密度函数除了上述两条特征性质外,还有如下一些重要性质:3) 在 R 上连续,且在 的连续点处,有 ,对连续型随机变量,分布函数和密度函数可以相互确定,因此密度函数也完全刻画了连续型随机变量的分布规律。4)设 为连续型随机变量,则对任意实数 ,有这表明连续型随机变量取个别值的概率为 0,这与离散型随机变量有本质的区别,顺便指出 并不意味着 是不可能事件
6、。5)对任意这一个结果从几何上来讲, 落在区间 中的概率恰好等于在区间上曲线 y=p(x)的曲 边梯形的面积。同 时也可以发现,整个曲线 y=p(x)与 x轴所围成的图形面积为 1。例 1、 设随机变量 的密度函数为试求 1)常数 c ; 2) 的分布函数 ; 3) 。解:1)由密度函数的性质可知 即于是密度函数为2)3)例 2、 设随机变量的密度函数为试求 1)常数 c ; 2)分布函数 F(x); 3) 。解:1)由密度函数的性质于是2)当当于是3)例 3、 设连续型随机变量的分布函数为 ,求它的密度函数 。解:因为所以二、几种常用分布1、均匀分布设随机变量 的密度函数为 ,则称 服从区间
7、 上的均匀分布,记作 。向区间 上均匀投掷随机点,则随机点的坐标 服从 上的均匀分布。在实际问题中,还有很多均匀分布的例子,例如乘客在公共汽车站的候车时间,近似计算中的舍入误差等。设随机变量 ,则对任意满足 ,则有 这表明, 落在 内任一小区间上取值的概率与该小区间的长度成正比,而与小区间 的位置无关,这就是均匀分布的概率意 义, 实际上均匀分布描述了几何概型的随机试验。2、指数分布若随机变量 的密度函数 为: ,则称 服从参数为 的指数分布,记作 。指数分布是一种应用广泛的连续型分布,它常被用来描述各种“ 寿命”的分布,例如无线电元件的寿命、电话问题中的通话时间等都可以认为服从指数分布。例
8、4、假定打一次电话所用的时间 (单位:分)服从参数 的指数分布,试求在排队打电话的人中,后一个人等待前一个人的时间(1)超过 10 分钟;(2)10 分钟到 20 分钟之间的概率。解:由题设知 ,故所求概率为1)2)3、正态分布若随机变量 的密度函数为称 服从参数为 的正态分布,记为 。密度曲线呈倒钟形, 称为位置参数, 称为形状参数。由数学分析知识可知从而当 时,正态分布 N(0,1)称之为标准正态分布,其密度函数为分布函数 ,对于 可以查正态分布表设 即 。一般地设 ,则 。从而,若 , 则例 5,设 求 1) 2) 3)解:例 6、设 ,求 。解:一般地这个概率与 无关。4、 分布设随机
9、变量 的密度函数为 为两个常数其中 , ,称 服从参数为 的 分布。特别的当 时,随机变量 的密度函数为: 称服从自由度为 n 的 分布,记作 。这是数理统计中的一个重要分布。特别地,当 时, 就为参数为 的指数分布。3.3 多维连续型随机变量及其分布一、多维随机变量的联合分布函数1、定义定义 1、设 是定义在同一个样本空间 上的随机变量,则 n 维随机向量是样本空间 上的 n 维随机变量或 n 维随机向量,并称 n 元函数是 n 维随机变量 的联合分布函数,称为联合分布或分布, 联合分布函数描述了多维随机变量的统计规律。下面着重讨论二维随机变量,若 表示笛卡儿平面上的点的坐标,那么 为 的联
10、合分布函数, 这表示点落在图中阴影部分的概率。2、联合分布函数的性质显然1)对 x 或 y 都是单调不减的;2)对 x 和 y 都是左连续的,即3)对任意 x 和 y,有4)对任意 和( ,其中 有5)反过来还可以证明,任意一个具有上述四个性质的二元函数必定可以作为某个二维随机变量的分布函数,因而满足这四个条件的二元函数通常称为二元联合分布函数。3、边缘(边际)分布函数设 为二维随机变量,那么它的分量的分布函数称为边际分布函数,记为 。设二维随机变量 的联合分布函数为 ,那么它的两个分量 的分布函数可由 求得同理 。由此可知,由联合分布可以唯一确定边际分布函数,反之,不一定成立。例 1、 设
11、的联合分布函数为 ,求:1)常数 A,B,C ; 2)边际分布函数 。解:1)由解得2)二、二维连续型随机变量及其密度函数1、定义定义 2 :设 为一个二维随机变量, 为其联合分布函数,若存在可积函数 ,使对任意的(x,y )有 ,则称 为二维连续型随机变量, 的联合分布函数,简称为密度函数。2、联合密度的性质由联合分布函数的性质有1)非负性:2)规范性:反过来,具有上述两个性质的二元函数必定可以作为某个二维连续型随机变量的密度函数。3)若 在点(x,y)连续, 是相应的分布函数则有 。4)若 G 是平面上的某一区域,则 这表明 取值落在平面上任一区域 G 内的概率,可以通 过密度函数 在 G
12、 上的二重积分求得。3、边缘密度函数设二维连续型随机变量 的联合密度函数为 ,则 的边际分布函数为 。这表明 也是连续型随机变量,其边际密度函数为类似地由此可以看出,边际密度由联合密度唯一确定。例 2、设 的联合密度函数为 ,求:1)常数 C ; 2)分布函数 F(x,y) ; 3)边际密度函数 及相应的边际密度;4) 。解:1)由联合密度的性质解得 c=4 于是2) 3) 4)三、两种常用分布1、均匀分布设 G 是平面上的一个有界区域,其面积为 A,令则 是一个密度函数,以 为密度函数的二维联合分布称为区域G 上的均匀分布。若 服从区域 G 上的均匀分布,则 G 中的任一(有面积)的子区域
13、D,有 。其中 是 D 的面积。 上式表明二维随机变量落入区域 D 的概率与 D 的面积成正比,而与在 G 中的位置与形状无关,这正是第一章中提过的在平面区域 G 中等可能投点试验,由此可知“均匀 ”分布的含 义就是“等可能”的意思。特别的若服从 G 上的均匀分布,其联合密度函数为相应的边际密度由此说明,矩形区域上的均匀分布其边际密度是一维的均匀分布。2、 二维正态分布设二维随机变量 的联合密度函数为则称 服从二维正态分布,记为 ,其中 为参数。习惯上称 为二维正态向量,由 的联合分布可以求得边际密度函数分别为由此说明二维正态分布 的两个边际分布函数都是一维正态分布,分别为 如果 则两个二维正
14、态分布是不相同的。但由上面可以知道它们有完全相同的边际分布,由此例也说明了边际分布不能唯一确定她们的联合分布,此外即使两个边际分布都是正态分布的二维随机变量,它 们的联合分布还 可以不是二维正态分布。例 3、设 的联合密度函数为,求边际密度函数。解: 同理即 都是标准正态分布的随机变量,但却不是二维正态分布四、随机变量的独立性定义 3、设 的联合分布函数为 的边际分布函数为 ,若对任意的 有 成立,则称随机变量是相互独立的。如果 是二维连续型随机变量,则 都是连续型随机变量,它们的密度函数分别为 这时容易验证 与 相互独立由此可知,要判断连续型随机变量是否独立,只需要验证 是否为 联合密度函数
15、。例 4、设 服从 G 上的均匀分布。试问它们是否相互独立?若 G 为矩形区域 呢?解: 的联合密度函数为所以 不相互独立。例 5、若 则 相互独立 随机变量的独立性还可以推广到多个随机变量的情形。定义 4、设 n 维随机变量 的联合分布函数为为它们的边际分布函数,若 则称是相互独立的随机变量。若 为 n 维连续型随机变量,则 相互独立的充要条件为其中 的联合密度函数, 的边际密度函数。3.4 随机变量函数的分布一、一个随机变量函数的分布定理 1.设 为连续型随机变量, 为其密度函数。又 y=f(x)严格单调其反函数h(y)具有连续导 数。则 也是一个连续型随机变量,且其密度函数为 其中证明:
16、略例 1 设证: 为单调函数。且反函数 h(y)=一般地,若 ,则 也服从正态分布 。定理 1 在使用时的确很方便,但它要求的条件“函数(X)严格单调且反函数连续可微”很 强,在很多场合下往往不能满足。事 实上这个条件可以减弱为“f(x)逐段单调,反函数连续可微 ”。这时密度公式应作相应的修改。一般地我们都是先求其分布函数,然后再求其密度函数。例 2 设 试求 的密度函数。解: 当 y当上述密度函数为 分布的密度函数在 n=1 时的特例,也就是说 N(0,1)变量的平方是自由度为 1 的 变量。二、两个随机变量函数的分布若 而 的联合密度函数为 p(x,y),则同上面一样讨论可得到。1、和的分
17、布若 而 的联合密度函数为 p(x,y)则如果 与 相互独立时,有 ,从而因此 的密度函数为 也可写为由上式给出的运算称为卷积,通常记为 。例 3、设 与 相互独立且都服从 N(0,1)证明证:由卷积公式故一般说,若 是 n 个相互独立的服从 分布的随机变量则 仍然是一个服从正态分布 N 的随机 变量,并且参数这个事实有时也称为正态分布具有可加性。在前面已经证明了普阿松分布具有可加性,这里也说明了正态分布具有可加性,其实还有其他一些分布,如 分布也具有可加性,即若大家自己证明,由此可知,分布对他的第一个参数 具有可加性。由于 为参数为 n 的 分布,因此 分布也具有可加性。如果 是 n 个相互
18、独立的随机变量,每一个都服从 N(0,1),由例2 可知每一个 都服从 分布且 仍然相互独立,这时由 分布的可加性并利用归纳法可知 是服从自由度为 n 的分布,即 n 个相互独立的 N(0,1)的平方和是一个参数为 n 的 分布,习惯上独立变量的个数称为“自由度” 。2、商的分布设 是二维连续型随机变量,密度函数为 p(x,y),表示点落在阴影部分的概率。于是 密度函数为例 4、设 与 相互独立,分别服从自由度为 n 及 m 的 分布的随机变量,试求 的密度函数。解: 的密度函数为 的密度函数为 于是 的密度函数为上式的密度函数的分布称为参数为 n,m 的 F-分布,记作 F(n,m)它是数理
19、统计中最常用的分布之一。在上例中,已知 相互独立,在计算中用到的 的相互独立,当然由相互独立很快推出 的相互独立。一般的,若 是 n 个相互独立的随机变量,则 也是相互独立的,这里 是任意的一元波雷尔函数。例 5、设 相互独立,求 的密度函数。解: 这个密度函数称为自由度为 n 的 t-分布。三、随机变量的变换若 的密度函数为 ,求 的分布,这时有(*)显然,这是最一般的场合,当 m=1 时,便是随机向量的函数的情形,当m=n=1 时,得到单个随机变量的函数的情形,下面考虑另一个重要的特殊情形,即当 与 有一一对应变换关系时,当然这时 m=n 必须成立。若对 存唯一的反函数且的 的密度函数为
20、,那么比较(*)与(*)可知 其中 J 为坐标变换的雅可比行列式。例 6、设 与 相互独立的随机变量,且具有相同的指数分布密度函数求 的联合密度函数。解:对 做变换 因此所以可以验证这里的 是相互独立的,分别具有密度例 7、设 与 相互独立,且均服从 N(0,1)试证 是相互独立的。证:(U, V)的 联合分布函数为 当 s0 时做变换反函数有两支与考虑到反函数具有两支,分别利用两组变换得对 F(u,v )求 导,得( U,V)的联合密度为(其余为 0)所以 U,V 两随机 变量独立。3.5 随机变量的数字特征,契贝晓夫不等式一、数学期望1、定义定义 1、设 为一个连续型随机变量,密度函数 为
21、 当 时,称的数学期望(均值) 存在,且 , 的数学期望 是 的可能取值(关于概率)的平均,这里要求 道理与离散型随机变量一样。例如: 的密度函数为因为 , 所以 不存在。2、几种常用分布的期望1)均匀分布设 , 则2)指数分布设 , 则3)正态分布设 , 则 , 事实上4) 分布设 即 的密度函数为这里用到为 的分布密度函数,因而有再利用 函数的性质 知道 即为参数为 的指数分布 ,因而 。3、随机变量函数的数学期望定理 3、若 为连续型随机变量,密度函数 为 p(x),又 f(x)为实变量 x 的函数,且则定理 4、设 是二维连续型随机变量, 联合密度函数为 p(x,y)又 f(x,y)为
22、二元函数,则随机变量的数学期望当然这也要求上述积分绝对收敛。例 1、 设 。解:例 2、 过单 位圆上一点 P 作任意弦 PA,PA 与直径 PB 的夹角 服从均匀分布,求弦 PA 的长 的数学期望。解:由任意 的密度函数为例 3、 设 相互独立,且都服从 N(0,1),求 。解:联合密度函数为4、数学期望的性质性质 1、若 则的数学期望存在,且 特别的若 ,则 Ec=c。性质 2、对任一二维连续型随机变量 若 都存在,则对任意实数存在且 。性质 3、若 相互独立,则 存在且 。性质 2 与性质 3 可以推广到任意有限个情形对任意 n 个常数 ,有 。若 相互独立,则 。二、方差1、定义定义
23、2、设 为一个随机变量,又 存在,则称 是随机变量的方差,记作 D ,并称 是 的根方差或标准方差。2、计算公式3、几种常用分布的方差1)均匀分布设 2)指数分布设 , 则 。3)正态分布设 , 则 。4) 分布 设4、契贝晓夫不等式我们知道方差反映了随机变量离开数学期望的平均偏离程度,如果随机变量 ,数学期望 ,方差为 ,那么对任意大于零的常数 C,事件( )发生的概率 P( )应该与 有一定的关系,粗略的说,如果 越大那么 P( )也会越大,将这个直觉严格化,就有下面著名的契贝晓夫不等式。定理 3、对任意的随机变量 ,若 又 存在,则对任意正数 有。将契贝晓夫不等式给出的估计式中,只须知道
24、方差 及数学期望 两个数字特征就够了,因而使用起来是比较方便的。但因为它没有完整的用到随机变量的统计规律分布函数或密度函数,所以一般说来,它给的估计是比较粗的。利用契贝晓夫不等式可以证明下列事实:随机变量 的方差 D =0 的充要条件是 取某个常数 值的概率为 1,即这个结论的充分性是显然的,下面证明必要性。由此 可知 P( )=0 从而 其中常数 a 即为 。5、方差的性质1)若 c 为常数,则 ;2)对任意的常数 ,则有 ;3)若 的两个相互独立的随机变量,且 存在,则 更一般地若 相互独立,则三、协方差1、定义定义 3、若( 为一个二维随机变量,又 , 称 为 的协方差,记作。协方差反映
25、了随机变量 之间是否存在线性关系。2、性质1) ;2)若 a,b 是两个任意常数,则 ;3) ;4)若 相互独立,则 。注意:反过来不一定成立。四、相关系数1、定义定义 4、若( 为一个二维随机变量,且称为 的相关系数,用 表示。相关系数反映了随机变量之间的相关关系,即它们之间是否存在某种线性关系。称为 不相关, 称为完全正相关, 称为完全负相关。2、性质定理 4、设二维随机变量( 的两个分量的相关系数为 ,则有1) ; 2) 的充要条件是 以概率为 1 线性相关,即存在常数 a,b 使得相关系数只是随机变量之间的线性关系强弱的一个度量,因而说得更确切些,应该 称为线性相关系数。例 4、设 为
26、 上的均匀分布,又 求 之间的相关系数。解:在该例中 不相关,但显然有 也就是说, 之间显然没有线性关系,却有另外的函数关系。由此可知,当 时与 可能独立也可能不独立。例 5、设则 就二维正态分布而言,不相关与独立性是两个等价的概念。五、矩1、原点矩设 为随机变量,k 为任意系数,若 存在,称 为随机变量 的 k 阶原点矩。(期望)就是一阶原点矩。2、中心矩设 为随机变量,若 (k 为正整数)称 为 的 k 阶中心矩。而方差 为二阶中心矩,更一般地,若 a 为一常数,p 为任一正数,如果存在,则称 是关于点 a 的 p 阶矩。3、混合矩设( 为二 维随机变量,称 为 k+ 混合矩。称为 k+ 阶的中心混合矩。特 别 的当 k= =1 时,1+1 阶中心混合矩就是协方差。