1、第5章 大数定律和中心极限定理,5.1 大数定律,5.2 中心极限定理,人们在长期的实践中发现,事件发生的频率具有稳定性,也就是说随着试验次数的增多,事件发生的频率将稳定在一个确定的常数,即概率值附近频率的稳定性是概率定义的客观基础,在第一章中我们从直观上描述了这一事实。本章将用大数定律对频率的稳定性作出理论上的说明,第5章 大数定律和中心极限定理,另外,在前面,我们还看到相互独立的正态随机变量的和仍是正态随机变量,本章将要介绍的中心极限定理将给出概率论中的另一个重要结果,即在相当一般的条件下,充分多个相互独立的非正态随机变量(不管它们的分布如何)的和近似服从正态分布这一事实更说明了正态分布的
2、重要性 大数定律和中心极限定理无论在应用上还是理论上都具有极其重要的作用,第五章 大数定律和中心极限定理,【吸烟率调查问题】 某卫生组织为确定某城市成年男子的吸烟率p,将被调查的成年男子中吸烟的频率作为p的估计,现在要保证有90%以上的把握,使得调查对象吸烟者的频率与该城市成年男子的吸烟率p之间的差异不大于5%,问至少要调查多少对象?,第五章 大数定律和中心极限定理,5.1 大 数 定 律 对某个随机变量X进行大量的重复观测,所得到的大批观测数据的算术平均值也具有稳定性,由于这类稳定性都是在对随机变量进行大量重复试验的条件下呈现出来的,历史上把这种试验次数很大时出现的规律统称为大数定律,首先来
3、引进证明大数定律所需要的预备知识契比谢夫(Chebyshev)不等式定理5.1 设随机变量X的数学期望E(X)及方差D(X)都存在,则对于任意正数,有不等式 (5.1)即 (5.2)成立称上述不等式为契比谢夫(Chebyshev)不等式,5.1 大 数 定 律,证:(仅对连续型随机变量进行证明) 设f (x)为X的概率密度,记E(X) = ,D(X) = 2,则 从定理中可以看出,如果D(X)越小,那么随机变量X取值于开区间(E(X) ,E(X) + )中的概率就越大,这也进一步说明方差是一个反映随机变量在其分布中心E(X)附近集中程度的数量指标,D(X)越小,X的取值越集中于E(X)附近,5.1 大 数 定 律,利用契比谢夫不等式,我们可以在随机变量X的分布未知的情况下估算概率值的界限,当然这个估计是比较保守的如果已经知道随机变量的分布,所需求的概率可以确切地计算出来,就没必要利用契比谢夫不等式来做估计了,5.1 大 数 定 律,【例5-1】若某班某次考试的平均分为80分,标准差为10,试估计及格率至少为多少? 解:用随机变量X表示学生成绩,则数学期望E(X) = 80,方差D(X) = 100,所以P60 X 100 P60 X 100 = P|X 80| 1),则 证:因为X1,X2,Xn独立同分布,所以 独立同分布。又 =k存在,由辛钦大数定律:,5.1 大 数 定 律,