1、4.1 随机变量的数学期望,试问哪个射手技术较好?,实例1 谁的技术比较好?,解,分布函数能完整地描述 r.v.的统计特性, 但实际应用中并不都需要知道分布函数,而只需知道 r.v.的某些特征.,判断棉花质量时, 既看纤维的平均长度,平均长度越长,偏离程度越小, 质量就越好;,又要看 纤维长度与平均长度的偏离程度,例如:,考察一射手的水平, 既要看他的平均环数是否高, 还要看他弹着点的范围是否小, 即数据的波动是否小.,随机变量某方面概率特性可用数字来描写,由上面例子看到,与 r.v. 有关的某些数值,虽不能完整地描述 r.v.但能清晰地描述 r.v.在某些方面的重要特征 , 这些数字特征在理
2、论和实践上都具有重要意义.,设某射击手在同样的条件下,瞄准靶子相继射击90次,(命中的环数是一个随机变量).射中次数记录如下,引例 射击问题,试问:该射手每次射击平均命中靶多少环?,解,平均射中环数,设射手命中的环数为随机变量 Y .,平均射中环数,“平均射中环数”的稳定值,“平均射中环数”等于,射中环数的可能值与其概率之积的累加,1. 离散型随机变量的数学期望,关于定义的几点说明,(3) 随机变量的数学期望与一般变量的算术平均值不同.,(1) E(X)是一个实数,而非变量,它是一种加权平均,与一般的平均值不同 , 它从本质上体现了随机变量 X 取可能值的真正的平均值, 也称均值.,(2) 级
3、数的绝对收敛性保证了级数的和不随级数各项次序的改变而改变 , 之所以这样要求是因为数学期望是反映随机变量X 取可能值的平均值,它不应随可能值的排列次序而改变.,随机变量 X 的算术平均值为,假设,它从本质上体现了随机变量X 取可能值的平均值.,当随机变量 X 取各个可能值是等概率分布时, X 的期望值与算术平均值相等.,实例2 发行彩票的创收利润,某一彩票中心发行彩票 10万张, 每张2元.设头等奖1个, 奖金 1万元, 二等奖2个,奖金各 5 千元;三等奖 10个, 奖金各1千元; 四等奖100个, 奖金各100元; 五等奖1000个, 奖金各10 元.每张彩票的成本费为 0.3 元, 请计
4、算彩票发行单位的创收利润.,解,设每张彩票中奖的数额为随机变量X,则,每张彩票平均可赚,每张彩票平均能得到奖金,因此彩票发行单位发行 10 万张彩票的创收利润为,实例3 如何确定投资决策方向?,某人有10万元现金,想投资于某项目,预估成功的机会为 30%,可得利润8万元 , 失败的机会为70,将损失 2 万元若存入银行,同期间的利率为5% ,问是否作此项投资?,解,设 X 为投资利润,则,存入银行的利息:,故应选择投资.,实例5 分组验血,解,例1 X B ( n , p ), 求 E( X ) .,解,特例 若Y B ( 1 , p ), 则 E(Y),2.连续型随机变量数学期望的定义,数学
5、期望的本质 加权平均 它是一个数不再是 r.v.,解,因此, 顾客平均等待5分钟就可得到服务.,实例7 顾客平均等待多长时间?,例2 X N ( , 2 ), 求 E ( X ) .,解,例3 设 X 参数为 p 的几何分布,求E ( X ).,解,常见 r.v. 的数学期望,区间(a,b)上的 均匀分布,E(),N(, 2),注意 不是所有的 r.v.都有数学期望,例如:柯西(Cauchy)分布的密度函数为,它的数学期望不存在!,设离散 r.v. X 的概率分布为,设连续 r.v. 的 d.f. 为f (x),2.r.v.函数 Y = g(X ) 的数学期望,设离散 r.v. (X ,Y )
6、 的概率分布为,Z = g(X ,Y ),设连续 r.v. (X ,Y )的联合 d.f. 为,f (x ,y) ,Z = g(X ,Y ),绝对收敛, 则,若广义积分,例3 设 (X ,Y ) N (0,1;0,1;0), 求,的数学期望.,解,解 (1) 设整机寿命为 N ,五个独立元件,寿命分别为,都服从参数为 的指数分布,若将它们 (1) 串联; (2) 并联 成整机,求整机寿命的均值.,例4,即 N E( 5),可见, 并联组成整机的平均寿命比串联 组成整机的平均寿命长11倍之多.,(2) 设整机寿命为,例5 设X N (0,1), Y N (0,1), X ,Y 相互独 立,求E
7、(max(X ,Y ) .,解,D1,D2,其中 称为 概率积分,一般地,若,X ,Y 相互独立,则,所以,E (C ) = C,E (CX ) = CE (X ),E (X + Y ) = E (X ) + E (Y ),当X ,Y 独立时,E (X Y ) = E (X )E (Y ) .,若存在数 a 使 P(X a) = 1, 则 E (X ) a ;若存在数 b 使 P(X b) = 1, 则 E (X ) b.,3.数学期望的性质,性质 4 的逆命题不成立,即,若E (X Y ) = E (X )E (Y ),X ,Y 不一定独立,反例见附录 1,注,性质 5推论:,|E (X)
8、| E (|X|).,当X Y 时,则E (X) E (Y) .,当X 0,则E (X ) 0.,设 X 连续,d.f. 为 f (x), 分布函数为 F(x), 则,故,证 性质5,例7 设二维 r.v. (X ,Y ) 的 d.f. 为,求E(X), E(Y), E( X + Y ), E(X Y), E(Y / X),解,由数学期望性质,柯西,Augustin-Louis Cauchy,1789 - 1857,法国数学家,柯 西 简介,法国数学家 27岁当选法国科学院院士,早在1811年就解决了拉格朗日向他提出的一个问题:凸多面体的角是否被它的面所决定?柯西作了肯定的回答.这一直是几何学
9、中一个精彩的结果.,在概率论中他给出了有名的柯西分 布. 然而他一生中最重要的数学贡献在 另外三个领域:微积分学、复变函数和 微分方程.,柯西在代数学、几何学、误差理论以及 天体力学、光学、弹性力学诸方面都有出色 的工作,特别是他弄清了弹性理论的基本数 学结构,为弹性力学奠定了严格的理论基础.,在这三个领域中我们常常能见到以柯西 名字命名的定理、公式和方程等:,微积分在几何上的应用 1826 年,柯西的著作大多是急就章,但都朴实无 华,有思想, 有创见. 他所发现和创立的定理 和公式, 往往是一些最简单、最基本的事实. 因而,他的数学成就影响广泛,意义深远.,柯西是一位多产的数学家,一生共发表
10、 论文 800 余篇,著书7本.柯西全集共有 27卷,其中最重要的为:,分析教程 1821 年,无穷小分析教程概论 1823 年,若 X 服从柯西(Cauchy)分布,其 p.d.f. 为,简记 X C( )分布,性质 4 的逆命题不成立,即,若E (X Y ) = E (X )E (Y ),X ,Y 不一定独立,反例 1,p j,pi,附录1,但,反例2,但,4.2 随机变量的方差,1. 概念的引入,方差是一个常用来体现随机变量取值分散程度的量.,实例 有两批灯泡,其平均寿命都是 E(X)=1000时.,2. 方差的定义,D(X ) 描述 r.v. X 的取值偏离平均值的平均偏离程度, 数,
11、方差是一个常用来体现随机变量 X 取值分散程度的量.如果 D(X) 值大,表示 X 取值分散程度大,E(X) 的代表性差; 而如果 D(X) 值小,则表示X 的取值比较集中,以 E(X) 作为随机变量的代表性好.,3. 方差的意义,离散型随机变量的方差,连续型随机变量的方差,4. 随机变量方差的计算,(1) 利用定义计算,证明,(2) 利用公式计算,例1 设r.v X服从几何分布,概率函数为,P(X=k)=p(1-p)k-1, k=1,2,,n,其中0p1,求D(X),解:,记q=1-p,求和与求导 交换次序,无穷递缩等比 级数求和公式,D(X)=E(X2)-E(X)2,+E(X),1.D (
12、C) = 0,2.D (CX ) = C2D(X),D(aX+b ) = a2D(X),3.,特别地,若X ,Y 相互独立,则,5.方差的性质,则,若X ,Y 相互独立,4. 对任意常数C, D (X ) E(X C)2 ,当且仅当C = E(X )时等号成立,5. D (X ) = 0,P (X = E(X)=1,称为X 依概率 1 等于常数 E(X),性质 1 的证明:,性质 2 的证明:,性质 3 的证明:,当 X ,Y 相互独立时,,注意到,,性质 4 的证明:,当C = E(X )时,显然等号成立;,当C E(X )时,,例2 设X P (), 求D ( X ).,解,例3 设X B
13、( n , p),求D(X ).,解一 仿照上例求D (X ).,解二 引入随机变量,相互独立,,故,例4 设 X N ( , 2), 求 D( X ),解,常见随机变量的方差(P.159 ),区间(a,b)上 的均匀分布,E(),N(, 2),例5 已知X ,Y 相互独立, 且都服从N (0,0.5), 求 E( | X Y | ).,解,故,例4,例6 设X 表示独立射击直到击中目标 n 次 为止所需射击的次数 , 已知每次射击中靶 的概率为 p , 求E(X ), D(X ).,解 令 X i 表示击中目标 i - 1 次后到第 i 次 击中目标所需射击的次数,i = 1,2, n,相互
14、独立,且,例5,故,本例给出了几何分布与帕斯卡 分布的期望与方差,例7 将 编号分别为 1 n 的 n 个球随机 地放入编号分别为 1 n 的n 只盒子中, 每盒一 球. 若球的号码与盒子的号码一 致,则称为一个配对. 求配对个数 X 的 期望与方差.,解,则,标准化随机变量,设随机变量 X 的期望E(X )、方差D(X ) 都存在, 且D(X ) 0, 则称,为 X 的标准化随机变量. 显然,,仅知 r.v.的期望与方差并不能确定其分布,与,有相同的 期望方差 但是分布 却不相同,例如,6、切比雪夫不等式,设随机变量X有期望E(X)和方差 ,则对于 任给 0,或,由切比雪夫不等式可以看出,若
15、 越小,则事件|X-E(X)| 的概率越大,即随机变量X集中在期望附近的可能性越大.,当方差已知时,切比雪夫不等式给出了r.v X与它的期望的偏差不小于 的概率的估计式 .,如取,可见,对任给的分布,只要期望和方差存在,则 r.v X取值偏离E(X)超过 3 的概率小于0.111 .,例8 已知正常男性成人血液中,每一毫升白细胞数平均是7300,均方差是700 . 利用切比雪夫不等式估计每毫升白细胞数在52009400之间的概率 .,解:设每毫升白细胞数为X,依题意,E(X)=7300,D(X)=7002,所求为 P(5200 X 9400),P(5200 X 9400),=P(5200-73
16、00 X-7300 9400-7300),= P(-2100 X-E(X) 2100),= P |X-E(X)| 2100,由切比雪夫不等式,P |X-E(X)| 2100,即估计每毫升白细胞数在52009400之间的概率不小于8/9 .,例9 在每次试验中,事件A发生的概率为 0.75, 利用切比雪夫不等式求:n需要多么大时,才能使得在n次独立重复试验中, 事件A出现的频率在0.740.76之间的概率至少为0.90?,解:设X为n 次试验中,事件A出现的次数,,E(X)=0.75n,的最小的n .,则 XB(n, 0.75),所求为满足,D(X)=0.75*0.25n=0.1875n,=P(
17、-0.01nX-0.75n 0.01n),= P |X-E(X)| 0.01n,P(0.74n X0.76n ),可改写为,= P |X-E(X)| 0.01n,解得,依题意,取,即n 取18750时,可以使得在n次独立重复 试验中, 事件A出现的频率在0.740.76之间的 概率至少为0.90 .,7.矩,1.定义,2. 说明,例:,解:,等号成立充要条件:存在常数 使得P(Y= X )=1,小结:,等号成立充要条件:存在 使得,一、基本概念,二、n 维正态变量的性质,4.3 协方差与相关系数,对于二维随机变量(X ,Y ):,已知联合分布,边缘分布,对二维随机变量,除每个随机变量各自的概率
18、特性外, 相互之间还有某种联系,问题是用一个怎样的数去反映这种联系.,问题的提出,反映了随机变量 X , Y 之间的某种关系,1. 定义,一 .协方差和相关系数的定义,若D (X ) 0, D (Y ) 0 ,称,2. 说明,法1.若 ( X ,Y ) 为离散型,,若 ( X ,Y ) 为连续型,,3. 协方差的计算公式,证明,法2.,4. 性质,求 cov (X ,Y ) XY,例1 已知 X ,Y 的联合分布为,解,解1,例2,例2 设 ( X ,Y ) ,求XY,解2,结论,即X ,Y 相互独立,X ,Y 不相关,解,例3,1. 问题的提出,二、相关系数的意义,解得,2. 相关系数的意义,例4,解,(1) 不相关与相互独立的关系,3. 注意,相互独立,(2) 不相关的充要条件,4. 相关系数的性质,证明,由方差性质知,故有,(3):,X , Y 不相关,X ,Y 相互独立,X , Y 不相关,若 ( X , Y ) 服从二维正态分布,,X , Y 相互独立,X , Y 不相关,例5 设 ( X ,Y ) N ( 1, 4; 1,4; 0.5 ), Z = X + Y , 求 XZ,解,三.协方差矩阵,由于,引入,由此可得,由于,推广,四、n 维正态变量的性质,线性变换不变性,