1、东海科学技术学院毕业论文I正态分布的发展及应用摘 要生活中诸多的经验和理论都表明,我们所处的环境中服从正态分布的事件是极其常见的。例如:工程中的加工尺寸,人的身高,降雨量等都可以看做是正态分布。所以在统计学中对于正态分布的使用越来越广泛。本文是对正态分布的发展以及应用做一些基本的阐述。正态分布又名高斯分布,德国数学家高斯对于正态分布的形成与发展有着举足轻重的地位。正态分布从无到有,最后成为数理统计中非常重要的模型大致可分为三个阶段:第一个阶段是形成阶段,18 世纪 30 年代数学家狄莫弗在一个赌博问题的概率计算中意外发现了正态曲线,所以人们也把正态分布的起源归于赌博问题,但由于社会及个人的问题
2、,正态曲线在那时并没都得到很大的发展。第二个阶段是 18 世纪中叶正态分布的模型建立,在天文学发展的刺激下,数学家拉普拉斯,高斯对于正态分布又有了新的拓展,让人们逐渐认识到了其在天文,误差领域的应用。第三阶段 19 世纪中叶在凯特莱,高尔顿的努力下,使正态分布进入到自然和科学领域,从此进入了统计学的大家庭。最后本文总结了现阶段正态分布的一些最基本最实用的应用。【关键词】正态分布 狄莫弗 拉普拉斯 高斯 凯特莱 东海科学技术学院毕业论文IIDevelopment and Application of the Normal DistributionFengjie xue(Department of
3、 mathematics physics and information, Donghai Science & Technology School 316004) AbstractMany life experiences and theories that we normally distributed environment in which the event is extremely common. For example: the size of the project in the process, a persons height, rainfall and so can be
4、seen as a normal distribution. Therefore, the normal distribution in statistics more widely used. This article is a normal development and application to do some basic exposition.Normal distribution, also known as the Gaussian distribution, the German mathematician Gauss for the formation and develo
5、pment of the normal distribution has a pivotal position. Normal distribution from scratch, eventually became a very important mathematical statistics model can be divided into three stages: the first stage is the formation stage, 18 in the 1930s mathematician Moivre probability calculations in a gam
6、bling problem accidentally discovered normal curve, so people have attributed the origin of the normal distribution of gambling problems, but because of social and personal problems, the normal curve at that time did not have a great development. The second stage is the mid-18th century the normal d
7、istribution model, the stimulation of the development of astronomy, mathematician Laplace, Gaussian normal distribution has a new development, so that people come to realize that its in astronomy, application error field. The third stage in the mid-19th century Quetelet, Galtons efforts to make the
8、normal into the natural and scientific fields, from entering the family statistics. Finally, the paper summarizes some of the most basic and normal stage of practical application.【 Keywords】Normal distribution Moivre Laplace Gauss Kettle东海科学技术学院毕业论文III目 录摘 要 .IAbstract.II1 绪论 .11.1 正态分布的定义 .11.2 正态分
9、布的曲线 .11.3 正态分布与标准正态分布 .22.正态分布的起源 .321 古典统计时期的概率论 .322 二项式正态逼近 狄莫弗 .423 为何当时正态分布未能有大发展 .43.正态分布的重新出发 .631 天文中的误差 .632 误差论的形成 .6321 拉普拉斯的概率论 .7322 高斯分布 .733 基本误差假设 .84.正态分布的近代统计学之路 .941“近代统计学之父” 凯特莱 .942 凯特莱对正态曲线的拓展 .1043 高尔顿对正态分布的创新 .105. 现代统计学中的正态分布 .126.正态分布的应用 .136.1 频数分布 .136.2 对学生的一些情况进行调查 .13
10、6.3 医学的正常值范围参考 .146.4 正态分布促进统计学的发展 .14.结束语 .15参考文献 .16东海科学技术学院毕业论文11 绪论1.1 正态分布的定义若随机变量 x 服从一个位置参数为 ,尺度函数为 ,其概率密度函数为21()exp2f则这个随机变量就称为正态随机变量,正态随机变量服从的分布就称为正态分布,记作 XN( ) ,读作服从 N( ) ,或者 X 服从正态分布。 221.2 正态分布的曲线正态分布的概率密度函数的曲线像一种大钟,两头低,中间高,左右对称,曲线与横轴间的面积总等于 1.。正态分布有两个参数 , ,参数 服从正态分布的均值,参数2是随机变量的方差,所以记作
11、XN( ) 。正态分布取当值与 越接近时,概率越2 大;当取值与 越远是,概率越小,在取到 是达到最大。正态分布与 的关系是,当 2越小时,整个图形在 附近的面积越多;当 越大时,整个图形在 附近的面积越少。正态分布的密度函数是对称函数,他的对称轴为 ,在 上去的整个函数的最大值,在正负轴的无穷远处为 0,当曲线与横轴不相交,图像形状为中间高两边低,从最高点向两边均匀下降。在正态分布的面积中,曲线与横轴上的面积表示该区占总数的比例或者是某一事件发生的概率,各个范围均可用正态公式计算。一些重要的面积比例,横轴与正态曲线之间的面积恒等于 1。正态曲线下,横轴区间(-,+ )内的面积为 68.268
12、949%,横轴区间(-1.96,+1.96 )内的面积为 95.449974%,横轴区间( -2.58,+2.58)内的面积为 99.730020%。 1东海科学技术学院毕业论文21.3 正态分布与标准正态分布标准正态分布是一般正态分布的特殊情况,既当 =0, =1 时,正态分布就成标准正态分布,其概率密度函数 21()expfx正态分布关于竖轴对称,它有正态分布所有的性质,在实际应用中更为简便,广泛。正态分布与标准正态分布的转化为:若 XN ,则 N(0,1)2( ) XZ=东海科学技术学院毕业论文32.正态分布的起源狄莫弗是一位法国英国数学家。主要作品有机遇论 ,与伯努力的推测术和拉普拉斯
13、的概率的分析理论 ,被认为是概率论史上三部具有里程碑性质的作品,1667 年生于法国维,1754 年死于英国伦敦。狄莫弗的父亲是一位医生,他父亲对他的影响很大,后来他进入到一间天主教学习念书。在求学期间狄莫弗对数学有了极大的兴趣,在论赌博中的机会 几何原本等一些著作的影响下,他开始奋发学习数学知识。他在 19 岁那年,他为了保护卡尔文教徒的南特兹赦令不被废除而遭监禁,做了两年牢。南特法令别摒除后,他为求生计,去了英国伦敦。在伦敦的学习狄莫弗找到了更多更加优秀的作品,学到了更加丰富的知识,后来通过自己的不断努力他当上了英国皇家学会会员,他的一生有许多的成就其中最重要的就是正态曲线的发现。 2狄莫
14、弗对统计意义主要有:他用频率估计概率,观察值的算术平均的精度,与观察次数 N 的平方根成比例,这对当时来说是一个非常大的进步。还有他的最大贡献当然是以他名字命名的中心极限定理,后来拉普拉斯在他 40 年自后才才得出了中心极限定理的公式。后来统计学家发现,许多的统计学中的基础量,在样本无限时,他的分布都与正态分布有契合的地方,这成为数理统计学中大量的基本模型。一直到今天,这样的模型依然有着很重要的地位,可见狄莫弗所给后人带来了无穷无尽的财富。21 古典统计时期的概率论概率论和统计学是一对兄弟学科,两门学科一同形成完善,共同创新并影响着,你中有我,我中有你。概率论发源于赌博活动中,概率论的发展推动
15、者统计学的进步,而统计学的进步尤为概率论的世纪应用找到了方向。我们通常把统计学的形成分成三个时期:古典统计时期、近代统计时期和现代统计时期。古典统计时期大约是 17 世纪中叶到 18 世纪中叶 ,这一时期欧洲在各个方面都有着天翻地覆的变化 , 概率论和古典统计学就是在这特殊的情况下出现的。 我们一般认为概率论的出现源于帕斯卡和费马,两个伟大的数学在特殊时期的发明。东海科学技术学院毕业论文422 二项式正态逼近狄莫弗在任何实验中,当实验次数足够多时,时间出现的频率就接近于事件发生的概率。当无限次地进行实验室,人们就能准确的计算所有事件的概率。当时在英国的狄莫弗通过学习对数学有了极大的兴趣,尤其是
16、对概率论的兴趣,他对概率论有着诸多的灵感,他不断的摸索其中的奥秘。在 1711 发表了关于概率论研究的论文,在 1733 年,一个赌博问题刺激着狄莫弗- A,B 在赌场里赌钱,A,B 赢概率是 p, B 赢的概率是 q=1-p,赌 n 次,假如 A 赢的次数 X np, 就 A 给赌场 X-np 元,不然 B 给赌场 np-X 元。 求赌场能获得理论的期望?最后求得的结果期望值是 棣莫弗用公式得到了当 p=1/2 时这是狄莫弗由赌博问题计算出来的式子,在概率论应用及统计学中有着非常崇高的地位。从这开始,在拉普拉斯等其他学者的共同发展下,中心极限定理最终形成,称为狄莫弗-拉普拉斯中心极限定理:
17、3设随机变量 X_n 服从参数为 p 的二项分布,则对任意的 x, 恒有 狄莫弗在二项分布的推算中只看到正态曲线的外貌,他未能真正看到这条曲线的迷人之处,他的研究也到此为止了。23 为何当时正态分布未能有大发展从现代的眼光来看狄莫弗对正态分布的出现有着历史性的作用,他为正态分布的出现埋下了一颗希望的种子,可在当时狄莫弗所做的研究没有引起很多人的的重视,正态分布还处在一个萌芽状态,根本谈不上有什么应用。我觉得还有以下原因:首先,在那时人们随意概率论有着偏见,认为概率论的来源是赌博,人们反对将他归东海科学技术学院毕业论文5入到科学领域,束缚的他的发展,那时的大数法则被推上的很高的位置,人们都无法挑
18、战铁律。其次,一个理论的发展需要现实的需要,而当时统计学的作用中用于人口的统计,非常有局限性,那时统计学中的二项分布运用的比较多,二正态分布由于不被社会所需要所以他的成长还需要一些过程。再次,当时除了狄莫弗,当时的数学家对于概率论的研究都不是非常的感兴趣,他所得到帮助非常少。最后是历史原因,在书写概率论的发展史中狄莫弗二项式正态逼近被遗漏了,他对概率论所做的贡献在很长一段时间内被遗忘了,知道拉普拉斯和高斯等人的出现,对正态曲线有进一步的发展,人们才认识到狄莫弗的贡献。东海科学技术学院毕业论文63.正态分布的重新出发人们对事物的检测,无可避免或多或少总会出现一些误差,不管是检测哪方面的,人们很早
19、就知道了这一点,不过对检测结果的不确定性,人们总是不清楚,看法始终不能一致。到了 18 世纪,数学有了一个变化,人们研究数学是为了解决生活中的问题。人们对概率论有了新的认识,概率论在日常生活中的应用也越来越多了,推动了误差问题的前进。天文学的迅速发展,许多天文学家在研究天文问题时都涉及到天文数据的测量计算,这些为正态分布的发展提供了温床。31 天文中的误差天文学从古代至 18 世纪一直是应用数学中最发达的领域,观测和数学天文学,给出了建模及数据拟合的最初例子。正态分布的新生则是其中非常经典的例子。人们对天文问题的研究促使天文学家非常关心在数值分析是算术平均是否合理,并开始从误差的角度来进行分析
20、。测量误差,一个无法避免的问题,在天文的一些数据测量中,不同的测量机构,不同测量机器,不同的测量人员等等都难免会有差异,所以测量结果页肯定会有差异,当去平均时可是受到的干扰最小,结果更接近真实值,测量值有误差,但基本都在真实值附近。 4在进行对天体观测数据的计算过程中发现了许多正态分布的特征,认为在观测中引起的误差与在计算中引起的误差是不一样的,小的观测值变化同意可以是距离值有很大的变化。伟大的天文学家伽利略是第一个在作品中提出观测误差这个概念的,由于那时的概率论的知识有限,没能很好的解决这个问题。后来辛普森对误差问题的研究也并没有取得很多的进展。32 误差论的形成卡尔弗里德里希高斯,德国著名
21、数学家、物理学家、天文学家、大地测量学家,与牛顿、阿基米德被称为为历史上最伟大三个数学家,是近代数学奠基者之一。在他 18 岁的发现了质数分布定理和最小二乘法。通过对足够多的测量数据的处理后,可以得到一个新的、概率性质的测量结果。在这些基础之上,高斯随后专注于曲面与曲线的计算,并成东海科学技术学院毕业论文7功得到高斯钟形曲线,正态误差理论正式被提出,在 70 年后狄莫弗推导出来的式子进入了概率的家庭中。这一函数被命名为标准正态分布,在概率计算中被大量使用。321 拉普拉斯的概率论拉普拉斯(17491827)是法国、数学家、分析学家、概率论学家和物理学家,法国科学院院士。1749 年生于法国,
22、1816 年被选为法兰西学院院士,1817 年任该院院长。他是天体力学的主要创作人,天体演化学的创立者之一,在概率论的发展史中,拉普拉斯是古典概率论的第一人,所以说在数学界他是当时的先锋人。在他 1812 年发表了代表作概率分析理论 ,在书中总结了当时整个概率论的研究,介绍了概率论在当时的应用。书中包含了他毕生对概率论的研究成果,他用数学中的各种工具来对概率论进行分析,对概率论的发展有着举足轻重的作用。他非常喜欢用归纳和类比的研究方法,是一位分析学大师。在概率论史上,拉普拉斯被认为是古典概率论的集大成者,他运用许多的分析方法,把概率论的基本理论统统做了系统性整理,把概率论变成了一门系统的学科,
23、为概率论的发展做出了伟大的贡献。他继承 17 世纪伯努利对概率论的成果,把概率论应用到当天文地理、人口统计、赌博输赢、人寿保险、法庭判决等各个领域中去。 5322 高斯分布在数学界我们把高斯称为“数学王子“,高斯一生的研究涉及到很多的领域甚至他开创了许多新的领域。在他的观念中,他宁愿少的发表文章,他要让他所发表的东西是非常完整的。高斯受拉普拉斯的影响非常深,他的概率论研究资料并没有出版成册,而是在他大量的论文中。我们都知道高斯的一生很长一部分他的职务是任格丁根天文台台长,所有对天文学的研究从未间断,前面提到了天文学的误差论,高斯对此很感兴趣做了大量的研究,1809 年,高斯发表了数学和天体力学专著绕日天体运动的理论其中涉及的误差分布的问题,他推导出来了正态分布的表达式 21()expfx测量的误差是有许多原因形成的,但每个原因的影响都不是十分巨大,按照中心极限