收藏 分享(赏)

第5章-大数定律和中心极限定理.pps

上传人:天天快乐 文档编号:1155909 上传时间:2018-06-15 格式:PPS 页数:44 大小:657KB
下载 相关 举报
第5章-大数定律和中心极限定理.pps_第1页
第1页 / 共44页
第5章-大数定律和中心极限定理.pps_第2页
第2页 / 共44页
第5章-大数定律和中心极限定理.pps_第3页
第3页 / 共44页
第5章-大数定律和中心极限定理.pps_第4页
第4页 / 共44页
第5章-大数定律和中心极限定理.pps_第5页
第5页 / 共44页
点击查看更多>>
资源描述

1、郑州轻工业学院数学与信息科学系,第五章:大数定律和中心极限定理概率统计教研组,第五章 大数定律和中心极限定理,人们在长期的实践中发现,事件发生的频率具有稳定性,也就是说随着试验次数的增多,事件发生的频率将稳定在一个确定的常数,即概率值附近频率的稳定性是概率定义的客观基础,在第一章中我们从直观上描述了这一事实。本章将用大数定律对频率的稳定性作出理论上的说明,第五章 大数定律和中心极限定理,另外,在前面,我们还看到相互独立的正态随机变量的和仍是正态随机变量。本章将要介绍的中心极限定理将给出概率论中的另一个重要结果:在相当一般的条件下,充分多个相互独立的非正态随机变量(不管它们的分布如何)的和近似服

2、从正态分布这一事实更说明了正态分布的重要性大数定律和中心极限定理无论在应用上还是理论上都具有极其重要的作用,第五章 大数定律和中心极限定理,【吸烟率调查问题】某卫生组织为确定某城市成年男子的吸烟率p,将被调查的成年男子中吸烟的频率作为p的估计,现在要保证有90%以上的把握,使得调查对象吸烟者的频率与该城市成年男子的吸烟率p之间的差异不大于5%,问至少要调查多少对象?,第五章 大数定律和中心极限定理,主要内容一 大数定律二 中心极限定理第五章:总结,5.1 大 数 定 律,对某个随机变量X进行大量的重复观测,所得到的大批观测数据的算术平均值也具有稳定性.由于这类稳定性都是在对随机变量进行大量重复

3、试验的条件下呈现出来的,历史上把这种试验次数很大时出现的规律统称为大数定律首先来引进证明大数定律所需要的预备知识契比谢夫(Chebyshev)不等式,5.1 大 数 定 律,【定理5.1】 设随机变量X的数学期望E(X)及方差D(X)都存在,则对于任意正数,有不等式 (5.1)即 (5.2)成立称上述不等式为契比谢夫(Chebyshev)不等式此定理进一步说明方差是一个反映随机变量在其分布中心E(X)附近集中程度的数量指标 利用契比谢夫不等式,我们可以在随机变量X的分布未知的情况下估算概率值的界限,.,5.1 大 数 定 律,【例5-1】若某班某次考试的平均分为80分,标准差为10,试估计及格

4、率至少为多少?解:用随机变量X表示学生成绩,则数学期望E(X) = 80,方差D(X) = 100,所以P60 X 100 P60 X 100 = P|X 80| 20 所以及格率至少为75%,5.1 大 数 定 律,【例5-2】已知n重伯努利试验中参数p = 0.75,问至少应做多少次试验,才能使试验成功的频率在0.74和0.76之间的概率不低于0.90?解:设需做n次试验,其中成功的次数为X,则XB(n,p),E(X) = np,D(X) = np(1 p)。因为根据契比谢夫不等式应有,5.1 大 数 定 律,【例5-2】已知n重伯努利试验中参数p = 0.75,问至少应做多少次试验,才能

5、使试验成功的频率在0.74和0.76之间的概率不低于0.90?解:设需做n次试验,其中成功的次数为X,则XB(n,p),E(X) = np,D(X) = np(1 p)。根据契比谢夫不等式应有令 解得,5.1 大 数 定 律,【定义5.1】 设X1,X2,Xn是一随机变量序列,a是一常数,若对任意正数,有则称序列X1,X2,Xn,依概率收敛于a,记为注:若 当n充分大时, Xn 以很大的可能性接近于a,这种接近是“概率意义下的接近”,与微积分中数列收敛中的“接近”不同,5.1 大 数 定 律,【定理5.2】(契比谢夫大数定律)设X1, X2, , Xn是相互独立,服从同一分布的随机变量序列,且

6、具有数学期望E(Xi) = 及方差D(Xi) = 2(i = 1, 2,),则 依概率收敛于,即对于任意正数,有即 (5.3)证:,5.1 大 数 定 律,【定理5.2】(契比谢夫大数定律)设X1, X2, , Xn是相互独立,服从同一分布的随机变量序列,且具有数学期望E(Xi) = 及方差D(Xi) = 2(i = 1, 2,),则 依概率收敛于,即对于任意正数,有即 (5.3)证:对 运用Chebyshev不等式,5.1 大 数 定 律,定理5.2表明,当n充分大时,随机变量序列的算术平均值接近于数学期望E(Xk) = ,这种接近是概率意义下的接近通俗地说,在定理条件下,n个相互独立同分布

7、随机变量的算术平均值,当n无限增大时,几乎变成了一常数这一定理从理论上说明了大量观测值的算术平均具有稳定性,为实际应用提供了理论依据例如,在进行精密测量时,人们为了提高测量的精度,往往要进行若干次重复测量,然后取测量结果的算术平均值,5.1 大 数 定 律,【定理5.3】(伯努利大数定律)设nA是n重伯努利试验中事件A发生的次数,p是事件A在每次试验中发生的概率,则对于任意正数,有即 (5.4)证:引入随机变量Xi(i = 1,2,):则,5.1 大 数 定 律,【定理5.3】(伯努利大数定律)设nA是n重伯努利试验中事件A发生的次数,p是事件A在每次试验中发生的概率,则对于任意正数,有证:其

8、中Xi相互独立且均服从参数为p的0-1分布,即且有E(Xi) = p,D(Xi) = p(1 p),i = 1,2,n由定理5.2得到,5.1 大 数 定 律,【定理5.3】(伯努利大数定律)设nA是n重伯努利试验中事件A发生的次数,p是事件A在每次试验中发生的概率,则对于任意正数,有即 (5.4)证:由定理5.2得即,5.1 大 数 定 律,伯努利大数定律表明事件A发生的频率nA/n依概率收敛于事件A发生的概率p这也正是在大量重复独立试验中,频率nA/n接近于概率p的真正含义,也就是我们所说的频率稳定性的真正含义所以当试验次数很大时,就可以利用事件发生的频率来近似地代替事件发生的概率,5.1

9、 大 数 定 律,【定理5.4】(辛钦大数定律)设X1,X2,Xn,是相互独立,服从同一的分布的随机变量序列,且具有数学期望E(Xi) = (i = 1,2,),则 依概率收敛于,即 (5.5)辛钦大数定律提供了求随机变量数学期望E(X)的近似值的方法辛钦大数定律是数理统计部分中点估计理论的重要依据,5.1 大 数 定 律,【例5-3】设随机变量X1,X2,Xn独立同分布,且 存在,令 则证:因为X1,X2,Xn独立同分布,所以 独立同分布。又 存在,由辛钦大数定律,5.2 中心极限定理,大数定律讨论的是多个随机变量的算术平均的渐近性质现在我们来讨论独立随机变量和的极限分布先给出一个例子,5.

10、2 中心极限定理,【例5-4】误差分析是人们经常遇到且感兴趣的随机变量,大量的研究表明,误差产生是由大量微小的相互独立的随机因素叠加而成的现在考虑一位操作工在机床上加工机械轴,要求其直径应符合规定要求,但加工后的机械轴与规定要求总会有一定误差,这是因为在加工时受到一些随机因素的影响,它们是:(1) 在机床方面有机床振动与转速的影响;(2) 在刀具方面有装配与磨损的影响;(3) 在材料方面有钢材的成分、产地的影响;(4)在操作者方面有注意力集中程度、当天的情绪的影响,5.2 中心极限定理,【例5-4】误差分析是人们经常遇到且感兴趣的随机变量,大量的研究表明,误差产生是由大量微小的相互独立的随机因

11、素叠加而成的现在考虑一位操作工在机床上加工机械轴,要求其直径应符合规定要求,但加工后的机械轴与规定要求总会有一定误差,这是因为在加工时受到一些随机因素的影响,它们是:(1) 在机床方面有机床振动与转速的影响;(5) 在测量方面有度量工具误差、测量技术的影响;(6) 在环境方面有车间温度、湿度、照明、工作电压的影响;(7) 在具体场合还可列出许多其他影响因素,5.2 中心极限定理,由于这些因素很多,每个因素对加工精度的影响都是很微小的,而且每个因素的出现又都是人们无法控制的、随机的、时有时无、时正时负的这些因素的综合影响最终使每个机械轴的直径产生误差,若将这个误差记为Yn,那么Yn是随机变量,且

12、可以将Yn看作很多微小的随机波动X1,X2,Xn之和,即Yn = X1 + X2 + Xn这里n是很大的,那么我们关心的是,当时n时,Yn的分布是什么?,5.2 中心极限定理,由于这些因素很多,每个因素对加工精度的影响都是很微小的,而且每个因素的出现又都是人们无法控制的、随机的、时有时无、时正时负的Yn = X1 + X2 + Xn这里n是很大的,那么我们关心的是,当时n时,Yn的分布是什么?当然,我们可以考虑用卷积公式去计算Yn的分布,但这样的计算是相当复杂的、不现实的,而且也是不易实现的有时即使能写出Yn的分布,但由于其形式复杂而无法使用,5.2 中心极限定理,5.2.1 独立同分布的中心

13、极限定理【定理5.5】(独立同分布的中心极限定理)设X1,X2,Xn,为相互独立、服从同一分布的随机变量序列,且E(Xi) = ,D(Xi) = 2 0(i = 1,2,),则对于任意x,有(5.6)记 记 为Yn的分布函数,则,5.2 中心极限定理,5.2.1 独立同分布的中心极限定理推论1:当n充分大时, 或推论2:当n充分大时 或其中,,5.2 中心极限定理,5.2.1 独立同分布的中心极限定理【例5-5】用机器包装味精,每袋净重为随机变量,期望值为100克,标准差为10克,一箱内装200袋味精,求一箱味精净重大于20400克的概率解:设箱中第i袋味精的净重为Xi克, X1, X2, X

14、n是200个相互独立同分布的随机变量,且由中心极限定理即,5.2 中心极限定理,5.2.1 独立同分布的中心极限定理【例5-5】用机器包装味精,每袋净重为随机变量,期望值为100克,标准差为10克,一箱内装200袋味精,求一箱味精净重大于20400克的概率解:由中心极限定理 所以,,5.2 中心极限定理,5.2.2 二项分布的正态近似现在将定理5.5应用于服从0-1分布的随机变量,即设X1,X2,Xn,相互独立,且都服从参数为的0-1分布:PX = k = pk(1 p)1- k,k = 0,1此时EXi=p, DXi=p(1-p), i=1,2,又记 则nB(n,p)此时定理5.5的结论可写

15、成于是,有下述定理:,5.2 中心极限定理,5.2.2 二项分布的正态近似【定理5.6】(棣莫弗拉普拉斯定理)设n(n = 1,2,)服从参数为n,p(0 p 1)的二项分布,则对于任意实数x,有 (5.9)这个定理表明,当n充分大时,服从二项分布的随机变量n的标准化变量近似服从标准正态分布即有 即,5.2 中心极限定理,5.2.2 二项分布的正态近似【例5-6】设电路供电网内有10000盏相同的灯,夜间每一盏灯开着的概率为0.8,假设各灯的开关彼此独立,计算同时开着的灯数在7800与8200之间的概率解:记同时开着的灯数为X,它服从二项分布B(10000,0.8),于是由棣莫弗-拉普拉斯定理

16、,有,5.2 中心极限定理,5.2.2 二项分布的正态近似【例5-7】某单位内部有260部电话分机,每个分机有4%的时间要与外线通话,可以认为每个电话分机用不同的外线是相互独立的,问总机需备多少条外线才能以95%的概率满足每个分机在用外线时不用等候?解:设表示同时使用外线的分机数, 则B(260,p),其中p = 0.04根据题意应确定最小的x使成立由棣莫弗拉普拉斯定理,有,5.2 中心极限定理,5.2.2 二项分布的正态近似【例5-7】某单位内部有260部电话分机,每个分机有4%的时间要与外线通话,可以认为每个电话分机用不同的外线是相互独立的,问总机需备多少条外线才能以95%的概率满足每个分

17、机在用外线时不用等候?解:应确定最小的x使令 查得,5.2 中心极限定理,5.2.2 二项分布的正态近似【例5-7】某单位内部有260部电话分机,每个分机有4%的时间要与外线通话,可以认为每个电话分机用不同的外线是相互独立的,问总机需备多少条外线才能以95%的概率满足每个分机在用外线时不用等候?解:应确定最小的x使令 查得故取于是,5.2 中心极限定理,【吸烟率调查问题解答】 某卫生组织为确定某城市成年男子的吸烟率p,将被调查的成年男子中吸烟的频率作为p的估计,现在要保证有90%以上的把握,使得调查对象吸烟者的频率与该城市成年男子的吸烟率p之间的差异不大于5%,问至少要调查多少对象?解:设共调

18、查n个成年男子,记则Xi独立同分布,且PXi=1=p,PXi=0=1-p,i=1,2, ,n,5.2 中心极限定理,【吸烟率调查问题解答】 某卫生组织为确定某城市成年男子的吸烟率p,将被调查的成年男子中吸烟的频率作为p的估计,现在要保证有90%以上的把握,使得调查对象吸烟者的频率与该城市成年男子的吸烟率p之间的差异不大于5%,问至少要调查多少对象?解:又记n个调查对象中,吸烟的人数为X,则有由大数定理知,当n很大时,频率X / n与概率p很接近,可用频率作为p的估计依题意,5.2 中心极限定理,【吸烟率调查问题解答】 某卫生组织为确定某城市成年男子的吸烟率p,将被调查的成年男子中吸烟的频率作为

19、p的估计,现在要保证有90%以上的把握,使得调查对象吸烟者的频率与该城市成年男子的吸烟率p之间的差异不大于5%,问至少要调查多少对象?解:又记n个调查对象中,吸烟的人数为X,即,5.2 中心极限定理,【吸烟率调查问题解答】 某卫生组织为确定某城市成年男子的吸烟率p,将被调查的成年男子中吸烟的频率作为p的估计,现在要保证有90%以上的把握,使得调查对象吸烟者的频率与该城市成年男子的吸烟率p之间的差异不大于5%,问至少要调查多少对象?解:又记n个调查对象中,吸烟的人数为X,查表得,所以,,5.2 中心极限定理,【吸烟率调查问题解答】 某卫生组织为确定某城市成年男子的吸烟率p,将被调查的成年男子中吸

20、烟的频率作为p的估计,现在要保证有90%以上的把握,使得调查对象吸烟者的频率与该城市成年男子的吸烟率p之间的差异不大于5%,问至少要调查多少对象?解:从而又因p(1-p)0.25,所以n270.6,即至少要调查271成年男子,5.2 中心极限定理,【实验5.1】用Excel验证二项分布逼近正态分布实验准备:,=BINOMDIST(A6,$C$1,$C$2,FALSE),=NORMDIST(A6,C$3,SQRT(C$4),FALSE),5.2 中心极限定理,【实验5.1】用Excel验证二项分布逼近正态分布实验结果:说明:随着n的增大,二项分布逐渐逼近正态分布,n=7, p=0.5,n=10, p=0.5,n=100, p=0.5,5.2 中心极限定理,【实验5.1】用Excel验证二项分布逼近正态分布实验结果:,第五章:总 结,大数定律:中心极限定理: 当n充分大时,,Chebyshev大数定律,伯努利大数定律,独立同分布的中心极限定理,棣莫弗-拉普拉斯中心极限定理,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 经营企划

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报