1、目 录摘要1关键词1Abstract1Key words1引言11 几种常见的具有可加性的分布11.1 二项分布21.2 泊松分布( 分布)3Posin1.3 正态分布41.4 伽玛分布 6 1.5 柯西分布 71.6 卡方分布 72 具有可加性的概率分布间的关系 82.1 二项分布的泊松近似 82.2 二项分布的正态近似 92.3 正态分布与泊松分布间的关系102.4 正态分布与柯西分布、卡方分布及卡方分布与伽玛分布的关系113 小结 12参考文献 12致谢 13概率论中几种具有可加性的分布及其关系概率论中几种具有可加性的分布及其关系摘要 概率论与数理统计中概率分布的可加性是一个十分重要的内
2、容.所谓分布的可加性指的是同一类分布的独立随机变量和的分布仍属于此类分布.结合其特点,这里给出了概率论中几种具有可加性的分布:二项分布,泊松分布,正态分布,柯西分布,卡方分布以及伽玛分布.文章讨论了各类分布的性质及其可加性的证明,这里给出了证明分布可加性的两种方法,即利用卷积公式和随机变量的特征函数.除此之外,文章就可加性分布之间的各种关系,如二项分布的泊松近似,棣莫佛-拉普拉斯中心极限定理等,进行了不同层次的讨论.关键词 概率分布 可加性 相互独立 特征函数Several Kinds of Probability Dstribution and its Relationship with A
3、dditiveAbstract Probability and mathematical statistics in the probability distribution of additivity is a very important content.The distribution of the so-called additivity refers to the distribution of the same kind of independent random variables and distribution are still belong to this kind of
4、 distribution.Combined with its characteristics, here given several has additivity distribution in probability theory: the binomial distribution, poisson distribution and normal distribution and cauchy distribution, chi-square distribution and gamma distribution.Article discusses the nature of all k
5、inds of distribution and its proof of additivity, additive of proof distribution are also given two methods, namely using convolution formula and characteristic function of a random variable. In addition, this paper the relationships between the additive property distribution, such as the binomial d
6、istribution of poisson approximation, Di mo - Laplaces central limit theorem, and so on, has carried on the different levels of discussion.Key Words probability distribution additivity property mutual independence characteristic function引言 概率论与数理统计是研究大量随机现象的统计规律性的学科,在概率论与数理统计中,有时候我们需要求一些随机变量的和的分布,在这
7、些情形中,有一种求和类型比较特殊,即有限个相互独立且同分布的随机变量的和的分布类型不变,这一求和过程称为概率分布的“可加性”.概率分布中随机变量的可加性是一个相当重要的概念,本文给出了概率论中常见的六种具有可加性的分布,包括二项分布,泊松分布,正态分布,伽玛分布,柯西分布和卡方分布.文章最后讨论了几项分布之间的关系,如二项分布的泊松近似,正态近似等等.1 几种常见的具有可加性的分布在讨论概率分布的可加性之前,我们先来看一下卷积公式和随机变量的特征函数,首先来看卷积公式 1:离散场合的卷积公式 设离散型随机变量 彼此独立,且它们的分布列分,别是 和 则 的概率分布列可表nkaP,10,)( .1
8、0,)(nkbP示为.2,10,)()( 00 kbaikPikPikii连续场合的卷积公式 设连续型随机变量 彼此独立,且它们的密度函数分,别是 ,则它们的和 的密度函数如下)(,yfx .)()dxzfxfz )2(其证明如下:的分布函数是 dxyfzfzFzyx)()() fdfxz.)(x其中 为 的分布函数,对上式两端进行求导,则可得到 的密度函数:)(xF 即证.)()dxzfxfzf 在概率分布可加性的证明中,除了卷积公式,我们常用的证明方法还有利用随机变量的特征函数.下面我们来讨论一下这几种具有可加性的分布及其可加性证明的过程中卷积公式和特征函数的应用.1.1 二项分布1.1.
9、1 二项分布 的概念),(pnB如果记 为 n 次伯努利试验中成功(记为事件 A)的次数,则 的可能取值为 0,1,2,n.记 p 为事件 A 发生的概率,则 记为 即,)(p(),1p.q.pq因 n 次伯努利试验的基本结果可以记作 =(w 1,w2, n) ,w i 或为 或为 ,这样A的 w 共有 2n 个,这 个样本点 w 组成了样本空间 .2下求 的分布列,即求事件 的概率.若某个样本点 =(w 1,w2, n)k,意味着 w1,w2, n 中有 个 , 个 ,由独立性即可得: ( )kAnP.)1(knp而事件 = 中这样的 w 共有 个,所以 的分布列为k= (1-p ) ,)(
10、kPnkn.,10n此分布即称为二项分布,记作 .且我们易验证其和恒为 .也就是)(pB1概率论中几种具有可加性的分布及其关系= .knknkp)1(0np)1(n=1 时,二项分布 称为两点分布,有时也称之为 分布.,B10二项分布的图像具有以下特点:二项分布的图像形状取决于 和 的大小,随着 的增加,分布图高峰逐渐右npp移.当 时,图像是对称的.50p1.1.2 二项分布的可加性定理 1.1.1 设 而且 相互独立,记 则有),(),(pmBn, ,).,(mnB证明 因 所以易知 可以取 等 个值.根据卷积公式,mn2,101,事件 的概率可以表示为)1k)()(0ikPiPki ik
11、mikmiinikin pp)1(1.)(0ikikk又因 所以.0mnkikin.,1,)1()( mnkpPmnk 也就是说, 即证!.,nB1.2 泊松分布 分布(osi)与二项分布一样,泊松分布也是一种离散分布,许多随机现象,特别是社会现象与物理学中的一些随机现象都服从于泊松分布.泊松分布可作为描述大量试验中稀有事件出现次数的概率分布的数学模型.1.2.1 泊松分布的概率分布列泊松分布的概率分布如下所示:,其中 大于 ,记作 .2,10,!)(kekP0)(P对于泊松分布而言,它的参数 即是期望又是它的方差:.ekkE10 )!(!)(又因,ekk1022 )!(!)(= k)1= 1
12、2 )!()!(kkee=故 的方差为 =22EVar 21.2.2 泊松分布的可加性定理 1.2.1 设随机变量 ,且 相互独立,则)(),(21P21,).(2121P证明 此处 ,0,!)(,!2121 kekPek根据卷积公式 ,有)(21)!(!021 iiikiikkie210)(21.,!)(2121k所以 即证!).()(2121P同样我们可以利用特征函数对其进行证明,此处不再赘述.1.3 正态分布 1.3.1 正态分布的定义 6定义 1.3 对于已经给定的两个常数 和 0,定义函数2/)(,1)(xexp ),(x )1(它含有两个参数 和 .显然的, 取正值.,p我们称密度
13、函数为 的分布为正态分布,记作 ,它的分布函数记为 )(, ),(2NdtexFxt2)(,1)(),(x正态分布的密度函数的图像是一条钟形曲线,中间高两边低,而且关于 对称,x在此处 取最大值 我们称 为该正态分布的中心,在 附近取值的可)(,p.21能性比较大,在 处有拐点.x若将 固定,改变 的取值,则 越大,曲线峰顶越低,图像较为平坦; 越小,曲线封顶越高,图像较为陡峭.因此正态密度函数的尺度由 确定,故称 为尺度参数.同样的,将 固定,而去改变 的值,会发现图像沿 轴平移而并不改变形状,x也就说明该函数的位置由 决定,故称其为位置参数.当 时的正态分布称为标准正态分布,记作 .它的密
14、度函数记为1,0 )1,0(N,分布函数记为 .则有)(u)(u,22/e概率论中几种具有可加性的分布及其关系),(,21)(2/udteuu1.3.2 一般正态分布的标准化对于正态分布族,0),(;),(2N标准正态分布 只是其中一个成员.其实在应用中很少有随机变量恰好服从标准正)1,0态分布,可是一般正态分布均可以利用线性变换转变成标准正态分布.所以一切与正态变量有关的事件的概率均可通过标准正态分布分布求取.定理 1.3.1 如果随机变量 ,则 ,其中 为标准),(Y)1,0(/)(NYXX正态变量.证明 记 与 的分布函数分别为 和 ,易知YXyFYx).()()() PxPxxF YX
15、因为正态分布函数严格递增而且处处可导,所以如果记 和 的密度函数分别是X和 ,会有ypY,21)()()( 2/expxFdxYYX由此即得, 即证1,0N对于标准正态随机变量 的数学期望为),(X2)(2/dxeE因被积函数 为奇函数,故上述积分值为 0,也就是说/2xeh .0)(XE而对于一般正态变量 ,如果满足 ,由数学期望的线性性质则可),(NYY得到 .0)(Y所以我们可以知道正态分布 的数学期望即为其参数 .,2 因为dxeXEXVar 2/221)()1/2xeddx2/2|.11/2 dxe且 ,由方差的性质XY.)()(2Var也就是说,正态分布的方差即是其另一个参数 .2
16、1.3.3 正态分布的可加性定理 1.3.2 设随机变量而且 和 彼此独立,且 则有XY ),(),(221NYX).,(2121NYX证明 知 服从于正态分布,且它们的密度函数分别是).2exp(),exp(21titiYX 又因 彼此独立,所以,)()(ttYXYX .)()(2121tti这正是数学期望为 方差为 的正态分布的特征函数,即证!,21我们同样可以使用连续场合的卷积公式进行证明,详见文献5,此处不再赘述.1.4 伽玛分布在讨论伽玛分布之前,我们先来看一下伽玛函数:我们称dxe01)()0(为伽玛函数, 为其参数.它的性质如下: ;)2(,)1 取自然数 的时候,有.n!.)(
17、1n1.4.1 伽玛分布的定义定义 1.4 如果随机变量 的密度函数为X,0;)()1xxep就称作 服从伽玛分布,记为 且 的值均大于 0. 为伽玛分布的X),(GaX形状参数, 为其尺度参数 .当 时, 为严格单调递减的函数,在 处取1xp0x得奇异点;当 时, 亦严格单调减,且 时有1)(xp0;)(当 时, 为单峰函数,先上凸然后下凸;2当 时,先下凸再上凸,最后下凸.而且随着 的增大, 逐渐接近于正态 )(xp分布的密度函数.1.4.2 伽玛分布的可加性定理 1.4.1 设随机变量 且 和 彼此独立,则),(),(21GaYaXXY).,(21GaYX证明 知 ,)(,(21itti
18、ttYX且 与 彼此独立,所以,)()() )(21itttYXYX概率论中几种具有可加性的分布及其关系此即为 的特征函数,根据惟一性定理则可知 结论得证!)(21Ga ).,(21GaYX如正态分布,对于伽玛分布,我们同样可以利用连续场合的卷积公式对其可加性进行证明,详见文献5; 1.5 柯西分布 41.5.1 柯西分布的密度函数柯西分布是几个常见的连续分布之一.它的密度函数为).,(,)(1),(22xxp时的柯西分布密度函数称为标准柯西分布密度函数,即0.,1)(2x为方便起见,往后我们分别记这两类密度函数为 和),(p).1,0(对于柯西分布的数学期望和方差,因.)(1),( 22 d
19、xxdxp所以 不收敛,故柯西分布的数学期望与方差均不存在.1.5.2 柯西分布的可加性定理 1.5.1 设随机变量 且 彼此独立,则有),(),(21pYpXYX).,(2121pYX证明 因 均服从于柯西分布,且 的特征函数分别是,(1tiXet.)(2tiYe又因 彼此独立,所以,)ttY .)()(2121tti这恰好就是参数为 的柯西分布的特征函数,所以121,即证!.,(21pYX1.6 卡方分布( 分布)1.6.1 卡方分布( 分布)的定义及密度函数定义 1.67 设 独立同分布与标准正态分布分布 则称nX,21 ),10(N所服从的分布为自由度为 的卡方分布,记为2212nX
20、.2n卡方分布的密度函数为.0,;0,)2()(1xxepnn1.6.2 卡方分布可加性卡方分布密度函数的图像是一个只取非负值的偏态图像.它的图像随着自由度的增加而逐渐趋于对称,当自由度 时,其图像趋于正态分布的图像.这也从另一个侧n面告诉我们,卡方分布是由其自由度决定的,不同的自由度对应了不同的卡方分布.由 1.6.1,我们可以知道卡方分布即伽玛分布的一个特例,所以由伽玛分布的可加性我们易知卡方分布亦满足可加性定理,即定理 1.6.15 设 且 彼此独立,则有),(),(221nm21,.证明 由卡方分布的定义,设, 22212212 nmmmXXX且 彼此独立.则有,,),0(niNXi
21、ji,222122121 n从从卡方分布的定义,因此 即证!).(n2 具有可加性的概率分布间的关系2.1 二项分布的泊松近似 4当 的取值很大时,二项分布 的计算是令人头疼的.这里介绍了泊松分布的n),(pnB一个十分有用的特性,我们可利用泊松分布作为二项分布的一种特殊近似,即二项分布的泊松近似.下面我们来看泊松定理,当 取值较大,而 取值偏小的情况下使用泊p松定理,可大大减小二项分布的计算量.定理 2.18( 定理) 在 重伯努利试验中,记事件 在每次试验中发生的PosinnA概率为 它与试验发生的次数 有关,若当 时,有 即 则对,np 0,n,limnp任意给定的 ( 为非负整数) ,
22、有k.!)1(limekpnknn证明 设 则有 所以,p,knknknkn k )1(!)()2()1( .!1kn.)1()()2(1 knnkn由已知有, 则对于给定的 值,有 且,limnk;limkn;1)()(;li1li (ennnn.)(k所以有 即证!.!)1(limekpnknn概率论中几种具有可加性的分布及其关系因 定理的条件之一为 所以在二项分布的计算中,若 值很大,Posin,limnpn的值却很小,且 的大小适中时(一般认为当 且 时) ,pp ,1.0,pn10p二项分布 可以使用参数为 的泊松分布来做近似,即有),(B,210,!)1kenpknkn此即为二项分
23、布 的泊松近似,而且 的值应尽可能的大,这样计算结果才能更,(p精确.二项分布 的泊松近似经常被用于稀有事件(即每次试验中事件发生的概率),nB很小)的研究中,大量实例表明,一般情况下概率 时,泊松近似非常好用,甚1.0p至 的取值不必很大.n2.2 二项分布的正态近似定理 2.27(棣莫佛-拉普拉斯( )极限定理) 设随机变量DeLalceMoivr( ) ,则对任意的实数 ,有),(pBX,210,nx).(1lim2/dtxpXPn 证明 因随机变量 服从二项分布 ,所以 可看做是 个相互独立的且服),(pnBXn从于同一参数 的两点分布的随机变量 的和,即 而且pnX21 ,1ii,)
24、,(),)( iVarXEii根据 中心极限定理,有Levyindbrg定理得证!).(21)1(lim2/xdtexpnPxiin 中心极限定理说明, 相当大时,服从二项分布 的随DeLalceMoivrn),(pnB机变量 的概率的计算服从正态分布 的随机变量的计算.也就是说,二X)1(,pN项分布可以用正态分布来近似计算.比如 ,在 比较大的时候knkXP)(的计算量时十分大的.根据 中心极限定理,因 近似服DeLalceMoivr)1(npX从于标准正态分布,或者说是 近似服从于 分布,也就是说)1(,pnNknknpXP)1()( .)()1(22) kepx对于 有,knkbka)
25、1()1()1()( 221 pnapXpP)1()1(2pnapna )(我们只需查一下标准正态分布表,就可以求出我们需要的相当精确的值.但是,当较大或者较小时近似效果可能差一些,利用公式时 的值最好满足 另外,p 9.01.p因二项分布是离散分布,正态分布是连续分布,所以在我们实际的应用中,为减小误差,常常使用)(21aXP )1(5.0)1(5.02 pnapn来替换 式.)2.3 正态分布与泊松分布之间的关系 9由上面的定理 2.1 和定理 2.2 我们可以知道,二项分布 可以用泊松分布来),(nB做近似,同样也可以用正态分布来近似.所以,从某个方面来说,泊松分布与正态分布也具有某种近
26、似的关系,首先我们来看特征函数的连续性定理.定理 2.3.111 分布函数列 弱收敛于分布函数 的充分必要条件是它的)(xFn )(xF相应的特征函数列 收敛于 的特征函数)(tn).(t定理 2.3.211 设随机变量 则有),(PX .21lim2dteXx证明 知 服从泊松分布,则 的特征函数为X .)()(itet所以 的特征函数是 .)(1tietit对于任何一个 我们有,t .,!21ieti所以有.,21 ttiti因此对于任意的点列 有,n .)(limtenn又知 是标准正态分布 的特征函数,因此由连续性定理可以得到,2te )1,0(N.2li 2dtexXPxnn 由 的
27、任意性,所以有 成立.n tx21lim我们来看泊松分布的正态逼近.定理 2.3.38 对于任意的 有,21a概率论中几种具有可加性的分布及其关系其中,21!lim2/axk dee.,21a其证明见文献8.由前可知, 的正态近似与泊松近似的条件是不同的,当 的取值特别小时,),(pnB p哪怕 的值不是太大,用泊松分布来近似二项分布也是可以的.但在这种情况下,用正n态近似却是不合理的.我们可以想象,若 值很小,但 的值也不是太大,则 的pnnp值肯定不会很大,而由定理 2.3.1,我们可知,此时正态分布就不可能很好的进行泊松近似.2.4 正态分布与柯西分布、卡方分布及卡方分布与伽玛分布之间的
28、关系首先来看正态分布与柯西分布的关系.定理 2.4.1 设 且 与 独立同分布,记 ,则).1,0(),(NYXXYYXZ/.)1,0(NZ证明 易知 的取值范围是 ,所以对于 ,我们利用商的公式,Z,),(z可以得到 021exp1)()( dtttdtpztzpYXZ .)(2z这正是 时的柯西分布的密度函数,所以结论得证!1,0正态分布与卡方分布的关系如下:定理 2.4.2 若随机变量 则),10(NX).1(2定理证明见文献10.这说明了标准正态分布与自由度为 1 的卡方分布之间的关系.若 且 彼此独立,记 ,根据卡方分布.,21,0niNXi i 22nX的定义,我们知 服从自由度为
29、 的卡方分布.对于伽玛分布,当其参数 时即为自由度为 的卡方分布,记为21,).(,2(nGa3 小结文章第一部分我们讨论了六种具有可加性的分布以及它们的简单性质,上述分布的可加性均可利用卷积公式或者特征函数进行证明.正态分布是概率论中最重要的分布,一般地,如果某个数量指标受到大量随机因素影响,而每一因素起的作用很小,则这个数量指标就近似服从正态分布.在第二部分里研究了二项分布、正态分布与泊松分布的关系,从此处我们可以知道二项分布不仅可以用泊松分布近似,同样也可由正态分布来近似.参考文献1 罗建华.卷积公式的应用注记J.中南林业科技大学学报,2007 年,第 27 卷,第 1 期:152 页.
30、 2 李贤平,沈崇生,陈子毅.概率论与数理统计M.上海:复旦大学出版社,2003.5:221-231.3唐玲,徐怀.复合泊松分布和泊松过程的可加性J.安徽建筑工业学院学报,2007.05:83 页.4 郭彦.对柯西分布性质的进一步讨论J.淮阴工学院学报,2005.05:12 页.5 茆诗松,程依明,濮晓龙.概率论与数理统计教程M.北京:高等教育出版社,2004.7:155-160;6 王梓坤.概率论基础及应用M.北京:北京师范大学出版社,1996.3:61-64.7 宋立新.概率论与数理统计M.北京:人民大学出版社,2003.9:176-177.8于洋.浅析二项分布、泊松分布和正态分布之间的关系J.企业科技与发展 ,2008 年第 20期:120 页.9魏宗舒等.概率论与数理统计教程M.北京:高等教育出版社,1983.10:208-211.10孟凡华.浅谈几种概率分布之间的相互关系J.信阳农专学报,1992 年第 3 卷第 2 期:63-65.11王淑云.特征函数及其应用J.邯郸学院学报,2008 年第 18 卷第 3 期:52-56.