1、渤海大学学士学位论文题 目: 中心极限定理与大数定理的关系系 别: 渤海大学专 业: 数学系班 级: 2002 级 1班姓 名:于 丹指导教师:金铁英完成日期:2006 年 5月 19日1中心极限定理与大数定理的关系于 丹(渤海大学数学系 辽宁 锦州 121000 中国)摘要:中心极限定理是概率与数理统计的一个重要分支,大数定理和中心极限定理都是讨论的随机变量序列的极限问题,它们是概率论中比较深入的理论结果。本篇论文从研究大数定理开始,然后由大数定理以及收敛性引出了中心极限定理,最后通过对定理在实际应用中的举例和定理的一些反例的研究使我们弄清中心极限定理的内涵与外延,进一步弄清了大数定理与中心
2、极限定理之间的关系。关键词:大数定理 中心极限定理 收敛性 The relation of the central limit theorem and largenumbers lawYu Dan(Department of Mathematics Bohai University Liaoning jinzhou 121000 China)Abstract:The Central limit theorem is an important branch of probability and mathematical statistic. The large numbers law and t
3、he central limit theorem is limit question of random variable sequence .They are the quite thorough theory result in the theory of probability.This paper commences from large numbers law,then the central limit theorem is cited by large numbers law and convergence.Eventually,we can understand connota
4、tion and extension of the central limit theorem by its examples and relationship between large numbers law and the central limit theorem . Key words:large numbers law ; the central limit theorem ; convergence.2引言中心极限定理是概率与数理统计的一个重要分支,大数定理和中心极限定理都是讨论随机变量序列的极限问题。它们是概率论中比较深入的理论结果。中心极限定理表明,在相当一般的条件下,当独立
5、随机变量的个数增加时,其和的分布趋于正态分布,这一事实阐明了正态分布的重要性。中心极限定理也揭示了为什么实际应用中会经常遇到正态分布,也就是揭示了产生正态分布变量的源泉。本文讨论的主题是大数定理和中心极限定理,通过列举一些例子让我们弄清中心极限定理的内涵与外延,进一步弄清楚了大数定理和中心极限定理之间的关系。 一 随机变量的收敛性随机变量收敛性的定义:设有一列随机变量 ,如果对12,于任意的 ,有 则称随机变量序列 依概率收敛0lim()1nxPn于 ,并记作 或 。nx ()P 下面给出随机变量收敛的几个性质:1.设 是一列分布函数,如果对于 的每个连续12(),()Fxx ()Fx点 ,都
6、有 成立,则称分布函数列 弱收敛于lim()nxFxn分布函数 ,并记作 。()()nx 2.若随机变量序列 以概率收敛于随机变量 ,即12, 则相应的分布函数列 弱收敛于分()Pn 12(),Fx3布函数 ,即()Fx()()nxFxn 3.随机变量序列 (C 为常数)的充要条件是 P 基数()()nxx 4. 设 是 k个随机变量序列,并且12,nkn又 是 k元变量的有理函数,,(,2)Piniaik 1(,)Rx并且 ,则有12()kk 2Pnkn 成立。,Rn二 大数定理大数定理主要说明大数次重复试下所呈现的客观规律,若是随机变量序列,如果存在常数列 ,使得对12, 12,nb 任意
7、的 ,有 成立,则称随机变量序列01limniinxPb服从大数定理。1(一)大数定理的引入在实践中人们发现事件发生的“频率”具有稳定性,在讨论数学期望时,也看到在进行大量独立重复试验时“平均值”也具有稳定性,大数定理正是以严格的数学形式证明了“频率”和“平均值”的稳定性。同时表达了这种稳定性的含义,即“频率”或“平均值”再依据概率收敛的意义下逼近某一常数。此外我们所说的靠近并不是高等数学中的收敛,在高等数学中序列 收敛于 a(即 )指对任意给定的 ,可找到nxnlimxa0N0,使得对所有的 ,恒有 。而且不会有例外。N4而在概率论中,序列 是非确定性变量(随机变量) , 以概率nx nx收
8、敛于 a,是指对任意给定的 ,当 n充分大时,事件0发生的概率很大,接近于 1(即 ) ,但并nx nlima1不排除事件 的发生可能性。nxa(二)常见的几种大数定理在介绍大数定理之前,先介绍契贝晓夫不等式:契贝晓夫不等式:设 x为随机变量,且有有限方差,则对任意,有 或者02D()P(XE)D(x)P(XEx)121、贝努里大数定理:设 是 n重贝努里试验中事件 A出现的次数,又 A在每次试验中出现的概率为 ,则对任意的(01)有 或者0nnlimP1nnlimP证明:令 i,iA1in0 在 第 次 试 验 中 出 现在 第 次 试 验 中 不 出 现则 是 n个相互独立的随机变量,且1
9、2,而 于是由契贝晓夫不等iiEpD(p)q(=1-p,i2n) 1ni式有 又由独立性知道有n 211D()(E()inniiiii,从而有i1)pqni所以 成立。n22p( 0,nnnlimp12、契贝晓夫大数定理:设 是一列两两不相关的随12, 机变量,又设它们的方差有界,即存在常数 ,使得C0则对任意的 有iDC,1 0n11limpEniii5证明:仍利用契贝晓夫不等式,有 112211D()()np(E)n niiniii 因为 两两不相关,且由它们的方差有界即可得到i1D()nCnii从而有 211pE0,niii所以有 得证n11limniii3、辛钦大数定理:设 是一列独立
10、的同分布的随机变2n, 量,且数学期望存在, 则对任意的 有iEa(,) 0成立n1limp(a)ni(三)大数定律的应用1、设随机变量 X的数学期望 ,方差 ,则根据契E(x)2D(x)贝晓夫不等式估计 。px4解:由题意设 ,由契贝晓夫不等式 得2(x)pXE(),故结果为21pX4()6162、设 相互独立同分布随机变量序列,且12nx, 则 ?nE()0nlimp()iX解:由于 是相互独立同分布,所以由辛饮大数i(1,)定理有取 ,即 又显然有n1()lp0nin1limp()iX11()()niiX6故 nn11limp()lip()ni iXX三 中心极限定理(一)中心极限定理的
11、引入我们在研究许多随机变量时,都认为它们会遵循正态分布。那么什么会这样呢?仅仅是一些人的经验猜测还是有理论依据。高斯在研究误差理论时已经用到了正态分布。现在不妨来考察一下“误差”是怎样一个随机变量,以炮弹射击误差为例,设靶心是坐标原点,多次射击的结果,炮弹的着地点的坐标为 ,它是一个二维,随机变量,一般认为它服从二维正态分布,我们知道 和 分别表示弹着点与靶心之间的横向与纵向误差,即使炮手瞄准后不再改变,那么在每次射击以后,它也会因为震动而造成微小的误差,每发炮弹外型上的细小差别而引起空气阻力的不同而出现的误差等等诸多原因。这些误差有正的有负的,都是随机的而弹着点的总误差是这样多的随机误差的总
12、合即 而这些小误差 是彼此间()ii相互独立的,要研究这些独立的随机变量的和的分布问题,就需要利用前面所讲的大数定理。前面的贝努里大数定理告诉我们:这是因为事先进行了“中心化”并且在分母中有一10,niiPEn 个因子 n,它比分子的取值增长得快,所以整个分式以概率收敛于0,显然,如果把分母换成 ,则上述结论仍然成立。因为1(0)n这时分母增长得更快,讨论这种情形也就没有什么意义了。由此得到启示,在讨论独立随机变量和得分布当 时得极限行为时,n7为了使问题有意义,可以先进行“中心化” ,然后在分母中放上一个增长得不快不慢的因子。这个因子如何选取呢?让我们回忆一下前面的标准化方法,仍以 为例,既
13、考虑:1ni这时对任意的 n,都有 。因而11()nniiiiEpSqD0,1nnSD当 时, 不至于发生趋向于 或 0 这种情况,这时讨论它的nnS分布函数的极限才有意义。如果 是服从参数为 P的二点(1,2)i分布的独立随机变量序列,有下述历史上颇为有名的德莫佛拉普拉斯极限定理。这种“中心化”的思想就是中心极限定理的理想。(二)常见的中心极限定理在介绍中心极限定理之前我们先了解林德贝尔格条件:设是一列独立的随机变量,又密度函数为12,n ,这时:2221,(1,)nkk kEaDB(1)若 是连续随机变量,密度函数为 ,如果对任k ()npx意的 ,有 。0 221lim()0nknknk
14、xaxadB(2)若 是离散型随机变量, 的分布列为kn(),njnjpX如果对任意的 ,有 则称 满足1,j 0kjn221xaBli()0kjkjnXk林德贝尔格条件。以下我们主要介绍三个中心极限定理,独立同分布的中心极限定理;李雅普诺夫定理;德莫佛拉普拉斯定理。81、独立同分布的中心极限定理(林德贝尔格勒维定理)若是一列独立同分布随机变量,并且2,n 2,(0),kkEaD则随机变量之和 的标准化变量:,k 1nk的分布函数 对任意 X满足111()nnnkkkkEuYD()nFx211lim()nkxtuPedx证明:设 的特征函数为 ,则 的特征函ka()qt11nknka数为 又因
15、为 ,所以()ntq20,kkEaD于是特征函数 有展开式20),()qt2221(0)()0tqtqt从而对任意固定的 t有,而 是 N(0,1)分布的特征函22q()10()tnntte2te数,所以原命题得证。2、林德贝尔格定理:设独立随机变量序列 满足林德贝尔12,n 格条件,则当 时,有n21lim()nxyknPaedB与林德贝尔格勒维定理相比,林德贝尔格定理不要求各个加项“同分布” ,因而它比林德贝尔格定理更强,事实上林德贝尔格勒维可以由它推出来,为此只要验证林德贝尔格条件成立即可。93、德莫佛拉普拉斯极限定理:设 是 n重贝努里试验中事Y件 A发生的次数,即 则对任意实数 X,
16、有(,)()nYBpPA:21lim()1xtnnpYed证明:设 是一列独立的同分布的随机变量,他们都12,n 服从统一的 分布, 因为 服从(,)Bp:1nkY(1,2)k分布,所以(,)np:,0,iikp由于 ,(),2)kkEDn所以:故原命题成立。211lim()li()()1nkxtnppYxed这个定理是林德贝尔格勒维定理的一个特列。4、李雅普诺夫定理:若 是一列独立随机变量序列,12,n 又 ,记 若存在2,(,)kkEaD 2k1B0使有 ,则随机变量之和 的标准化变量:210nkB1nk的分布函数 对任意的 X,满足111()nnnkkkkEaZBD ()nFx证明:我们
17、验证这时21n 1lim()li()nkktxnaFxpedt林德贝尔格条件满足。仍设 是连续随机变量,密度函数为k,则有()1,2)npxk 221()knkxaBkn pxd10221221 ()()()0,knnkxaBknkknkk pxdBExan:同理可以证明离散型的情形,所以定理成立。(三)中心极限定理的应用我们下面将过列举一些例子来说明中心极限定理在概率与数理统计中的应用。应用 1:近似计算有关随机事件的概率例 1:从良种率为 20%的一大批种子中任选 10000粒,求在这10000粒种子中良种所占的比率与良种率之差的绝对值小于 0.5%的概率。解:设表示 10000粒种分子中
18、的良种粒数,本题所求为0.251(,).20550()()0.791.281.8pBPP:例 2:报名听数学课的学生人数是均值为 100的泊松随机变量,讲授这门课程的教授决定,如果报名人数不少于 120人,就分成两班;如果少于 120人,就集中在一个班讲授,问该教授两个班的概率多大?解:设 X表示听课人数,又因为报名听数学课的人数服从均值11为 100的泊松随机变变量,则所求概率为 由于102()()!kkePx较大,不能查表求得上述概率,考虑到泊松分布具有可加性,10可把均值 的泊松变量 X看成是相互独立的 100个均值0的泊松变量之和,即(,21)i 1012kxx因为 相互独立,是数学期
19、望为 ,方差 ,则i 1i21102(0,1)(0,)kXNN:则大数定理可知 10(12)(2)120/().7kpxpxX该教授讲授两个班的概率为 0.0227应用 2:已知随机变量在其范围内取值的概率,估计该范围例 3:某车间有 200台机床,它们工作独立,开工率各为 0.6,开工时耗电各为 1千瓦,问供电所至少要供给这个车间多少电才能以 99.9%的概率保证这个车间会因供电不足而影响生产。解:用 X表示工作的机床台数,则 X服从参数为 的二项(,)np分布,其中 n=200,p=0.6,设要向车间供电 a千瓦,才能以 99.9%的概率保证车间不会因供电不足而影响生产,即 20201(0
20、)(.6)4.9akkpxC有德莫佛拉普拉斯中心极限定理得120P(0)()(120(.9(3.1)48npxanpxaqqa故 ,得1203.48a48例 4:抽样检查产品质量时,如果发现次品多于 10个,则拒绝接受这批产品,设某批产品的次品率为 10%,问至少应抽取多少个产品检查才能保证拒绝接受该产品的概率达到 0.9?解:设 n为至少抽取的产品数量,x 为其中的次品数则1,k0kX第 次 检 查 为 次 品第 次 检 查 为 正 品kk1,E().,D(X)0.1().9n由德莫佛拉普拉斯极限定理,有0n.1xn0.1P199().3由题意有: 10n10.n.() 3查表得: 2847
21、.3应用 3:与用频率估计概率有关的二项分布的近似计算例 5:检察员逐个地检查某产品,每次花十秒钟检察一个,但也有可能有的产品需要再花 10秒钟重复检查一次,假设每个产品需要重复检查的概率为 0.5,求在 8小时内检察员检查的产品个数多于 1900个的概率是多少?13分析:在 8小时内检查员检查的产品个数多于 1900个的概率等于检察员检查 1900个产品的时间小于 8小时概率,检查员检查每个产品花费的时间可以认为是相互独立的。由林德贝格列维中心极限定理计算解:设 表示“检查第 i个产品花费的时间 ”(单位:秒)即ix10, i1,2902ii 第 个 产 品 不 需 要 复 查第 个 产 品
22、 需 要 复 查则 相互独立同分布, 为检查 1900个产品花12nx, 190Xi费的时间,且 iE()10.52.52 2iiiD(x)x()(01).5由独立同分布的(林德贝格列维)中心极限定理知: 19011P(X836)P(28)5280195( )96P()201.376).5iiiniX所以在 8小时内检查员检查的产品个数多于 1900个的概率为0.91559。四 大数定律理与中心极限定理的关系大数定理是研究随机变量序列 依概率收敛的极限问题,而nX中心极限定理是研究随机变量序列 依分布收敛的极限定理,它们都是讨论大量的随机变量之和的极限行为。下面就通过例子来说明14大数定理与中
23、心极限定理的关系。1、若 服从大数定理,它不一定服从中心极限定理。k(1)对于 不是同分布的情形,大数定理与中心极限定理的关系是不确定的,例如,设 是相互独立的随机变量序列,12n, 为常数, 的分布为 当 时,显然 ,k, 12kE0且 222k11Dk:所以 满足契贝晓夫大数定理,但此时 所以 2k11DK()n不服从中心极限定理。k从上面的例子可以看出,不同分布的随机变量序列,显然服从大数定理,但是不一定服从中心极限定理。(2)对于 是独立分布(比如上面例中取 )的情况,只k 0要 (比如 时, ) ,若中心极限定理kD0E1,k2,成立,则大数定理一定成立。自然,对于 不是同分布的情形
24、,也可能服从大数定理也服从中心极限定理。例如上面的例子中,当时,易证明 服从大数定理也服从中心极限定理。12k2、若 服从中心极限定理,它不一定服从大数定理。k前面的研究我们已知道,若 是独立的同分布 有限时,中kkD心极限定理比大数定理强:这时中心极限定理成立,大数定理也成立。但是也存在大数定理比中心极限定理更强的情况,下面通过例子来说明这个问题。(1)例如:独立随机变量序列 中, 的分布列为kk15其中 ,因为 ,所以2k(1,2)1 122kDK(1,)212nk1BD(n)令 kkn,BU0当当注意到 于是当 时, 因此2k(1,) 2n(1)kU,这表明林德贝格条件的满足。所以 服从
25、中心极限21nE()B 定理。但是由于不会小于某个常数 C。所以 不服从2k1DK(),k2, k契贝晓夫大数定理。(2)又如,设独立随机变量序列 的分布列为:k,显然111222k0k32kkE0,D所以 ,令 因为 ,3522nnk1k1BDkkn,BU当当 54n2k而当看 时,, kn所以当 时, ,这时425n2k1nE()B即林德贝格条件成立。从而 服从中心极限定理。但是因为k,不满足 ,所以不服从大数定理。从上面522nBk21D0(n)n的这些例子可以看出,若 是独立随机变量序列,且对它成立中k心极限定理,则 满足大数定理的充分必要条件是k16。k21D(n)n3、 不一定服从
26、中心极限定理或大数定理的一个。前面所列举的例子中, 至少服从中心极限定理或大数定理的k一个,但是并非所有的随机变量序列 都是如此。以下面的例子来k进行说明。设随机变量序列 相互独立,且具有同一的柯西分布:12n, 求 ,所以 不服从大数定理。kEa(,) k又因为柯西分布的各阶距都不存在,显然 也不服从中心极k限定理。4、大数定律和中心极限定理同时成立当 相互独立同分布,并且有大于 0的有限方差时,12n, 大数定理和中心极限定理同时成立。设 ,则由切比雪夫大数定律知,对任意给定2iiEX,D0的 ,有0in1lmP(x)1ni而由独立同分布的中心极限定理有 11nP()P()nn2()i i
27、i iXX由此可见,在所假设的条件下,中心极限定理比大数定理更为精确。五 结论在这篇毕业论文中,我们讨论了大数定理、中心极限定理,通17过对中心极限定理的一些反例的研究,不但使我们更深入地了解了大数定理、中心极限定理,它们的实际应用以及它们之间存在的一些关系,而且使我们明白了几个中心极限定理的相互关系。通过对阅读本篇论文,我们不难得出这样一个结论:若独立随机变量序列具有有限方差,它不一定服从中心极限定理;若随机变量序列不满足林德贝格条件,它不一定不服从中心极限定理;若随机变量序列不满足费勒条件,它不一定不服从中心极限定理;若随机变量序列服从大数定理,它不一定服从中心极限定理;若随机变量序列服从
28、中心极限定理,它不一定服从大数定理。18六 参考文献1复旦大学数学系编:概率论,北京:人民教育出版社,1979,456-478.2W.Fellen:概率论及其应用,北京:科学出版社,1950,128-131.3华东师大数学系编:概率论与数理统计习题集,北京:人民教育出版社,1982,56-59.4王梓坤:概率论基础及其应用,北京:科学出版社,1976,216-218.5中山大学数学系编:全国概率统计数学研讨会油印资料,1981,99-101.6刘章温等:概率论浅说,北京:科学出版社,1980,78-79.7钟开莱著,魏宗书译:初等概率附随机过程,上海:上海科技出版社,1966,234.8Freund ,J.E. Probability and Statistics. Prentice-Hall,U.S.A 1962,123-125.9R.柯郎,F.约翰:微积分与数学分析引论,北京:科学出版社,2001,156-159.10俄 季米多维奇. 数学分析习题集,北京:人民教育出版社,1959,256-261.