1、12011 年 12 月 25 日经过一个学期的的概率论学习,从廖宇波老师那里收获颇丰,所以根据的我的总结,我想将我的感想和收获写在论文中,那么我就先介绍一下概率论的发展简史吧。一、发展简史统计学是关于数字资料收集、组织、分析与解释的科学。“资料收集”是取得数量或数据的方法。正确的结论只能来源于正确的资料,来源于有代表性的资料。“资料组织”是以适当形式表现所收集的资料,以得出符合逻辑的结论。“资料分析”是从给定的量或数,抽出有关问题,从而得出一个简要的综合姓的结果。达到这个日的的最重要的量(平均数、中位数、极差、标推差,等等)。“资料解释”是通过资料分析来作出结论的工作,它通常是通过类似对象的
2、小的集合提供的信息来对有关对象的大的集合形成预测的。因此,统计学是一门科学,它处理在某种程度上可用数量信息回答的问题,而信息是通过计数和量度得到的。不论我们在生物研究中调查昆虫数、还是在工厂中调查工人数或工时数,统计工作者的职责首先是选择所裔的那类信息,其次是指导适当的有效的收集与加工信息,最后是解释结果。在解释结果中,特别是在资料不完全的情况下,统计工作者必须运用原理与方法以得出有效的调查结果。他常常要求面对不肯定的情况做出明智的决策。 统计一词有两个显然不同的意义。当用作如上所指的情况时,它是。一种研究和评价数量资料的科学方法。当用作复数时,它是“数量资料:一词的同义语。因此,如果我们说在
3、“世界年鉴” 或“美国统计摘要”中有统计,即是说在它们中有数量资料。这是一个古老的、有普遍意义酌词。原先,统计着重为政府首脑管理国家政务提供资料。用数字资料表现的这种信息可以上溯到亚里斯多德及他的“国家政务论” 。事实上, “statistics 与“state”源于同一词根,就是一个明证。早期大多数文明国家,由于军事的与财政的原因,曾经编制大规模的统计资料,以确定国家的入力与物力。我们在基督教圣经中曾看到诸如此类的户口调查,以及罗马帝国各地普遍编制的税册。概率论的研究始于意大利的文艺复兴时期,当时赌徒要求找到掷段子决定胜负的规则,曾向学者 G卡达诺(150l-1576)和著名的数学天文学家
4、G加利莱(15641642)求教;加利莱所写的一篇短文中,说明了概率的基本定律,从而为整个统计科学的发展奠定了理论基础。 在 16 与 17 世纪,机会对策(赌博)在富人中特别普遍,而且引进了更复杂的对策,包括更大的赌注,不同的对策需要一个合理的计算“机会” ,当时这个问题成了一个非常重要的问题。一个法国知识分子 C,梅勒也是一个狂热的赌徒,他曾向著名的数学家和哲学家 B。帕斯卡尔(16231662)求教,帕斯卡尔的注意促成了与他的数学朋友的交往,特别是与 P弗曼特马(1601-16S5)的书信往来,就成为现代概率论与组合分析的起源。研究“机会”定律的其他闻名的数学家有 OW莱布尼兹(1646
5、1716)与雅可比白努利(16541705),他是著名的白努利家族九个数学家中的第一个。他们都赢得了卓越的声誉,其中雅可比的兄弟约翰白努利(1667-1748),侄子尼古拉白努利(1687-H59)与2丹尼尔白努利(17001782)都成为世界上知名的人。第一篇广博的概率论论文是由雅可比白努利写出的,他详细地阐述了大数定律的原理。尼古拉白努利把概率的概念用于法律问题,而丹尼尔白努利则把概率的计算用于流行病学与保险学的研究。 同一时期,在收集社会统计学资料上取得了重要的进展,现在叫做“统计学”的知识也有所发展。在英国,J格兰特(16201674)对生命统计以及保险与经济统计部分采用了数学方法进行
6、研究,他的研究通过 W佩蒂(16231687)得以发展,佩带研究了伦敦城的人口生命统计,他是首先从事这类工作的人。E哈利(1656 一 1742)继承了这项工作,他发展了死亡表,并把他称为开创生命统计科学的人。 A德模瓦(16671754)说明了复合事件的概率程序,由摄率原理导出排列与组合理论,并奠定了生命意外事故科学的基础。1733年他发明了正态曲线方程,很多的归纳统计学理论都以此为基础。同一钟形曲线一般称之为“拉普拉斯曲线” 、 “高斯曲线”或“高斯拉普拉斯曲线” ,以表示对 M拉普拉斯(17491827)与 KF。高斯(1777 一 1855)的故意。高斯独立地发明了这个方程。高斯由重复
7、量度同一个量所出现的误差,以推导正态曲线方程。他还发明了最小乎方法并发展了观察误差理论,拉普拉斯的最大贡献是把统计学应用于天文学,并与 A,M勒让德(1752 一1833)一起,把偏微分方程用于概率研究。1815 年“概差”(probable error)一调第一砍出现在 FW贝塞(17841846)的著作中,他也发展了仪器误差理论。对理论的其他贡献的有 J斯特林(16921770)的 n!近似公式;M康杜斯(17431794)把概率与统计应用于社会问题;T贝期(1702176,1)首先归纳地运用概率;L尤勒(17071783)首创使用希腊字母西格马 作为求和的符号;以及 T辛普森(1710
8、一 1761)把连续原理运用到数学横串理论中。人 LR阿勒贝特(17171783)在他的概率研究中使用了气象资料;人 L拉格朗日(17361813)使用了微分学;Po B蒙特模特(16781719)引进了有限差分的计算。C巴夫(17071788)在现代遗传的某些方面以及在概率计算上属于领先地位,此外,SD泊松(17811840)发展了以他本人名字命名的分布,即泊松分布。在 1835 一 1870 年间,比利时科学家LAJ. 魁持奈(17961874)对概率与统计的发展与应用作出了重大贡献。他把生物学的与人类学的油量和正东曲线紧密池联系在一起。:魁特奈把统计方法不仅用在生物上,而且用到教育与社会
9、学上。他显示出对统计的极广泛的兴趣,他是认识大数稳定性的第一个人,也是首先论证在研究领域里,发展起来的统计方法可以推广到其他大多数领域的人之一。在德国,OF纳普(1842 一 1926)按照魁特奈的原则广泛地调查研究死亡统计,而 W刘易斯(18371914)发展现在叫做一向方差分析的程序。 在 19 世纪最后 25 年中,F高尔顿(1822 一 1911)为英国的优生学泥的创始人,在论证每个生物变量的系统变化助原理上,显示出无穷的热情,他并且积累了这方面的适当资料。发现了生物变化的有秩序原理,这标志着生物研究新时代的开始。高尔顿与他的继承者K皮尔逊(18571936)利用遗传学的问题,发展了回
10、归与相关的概念。后来(皮尔逊)与 CB,斯皮尔曼(18631945)开拓了这个理论,并把它应用于社会科学。皮尔逊同时也广泛地研究了抽样误差的影陶,发展了 检验,并在2文献中弓!进“平均偏差”(mean de Viatlon)与标准差(standard de V1ation)等词。 :本世纪初,一位爱尔兰吉尼斯啤酒厂的统计学家 WS戈塞特(1876 一 1937),笔名“学生”,出版了许多篇关于解释抽样资料的文章。他是第一个入认识到发展小样本方法以得出可3靠信息的重要性。这种方法以后由 RA费雪(1890 一 1962)及其同事在英国推广,费雪对科学作出了很大贡献,特别是群体遗传学方面,他开拓了
11、试验理论,注意统计方法及其在科学研究领域中的应用。正是费雪。他引进了现在广泛应用的“虚假设”一词(null,hypothesis),并发展了方差分析的统计方法。在二十世纪,涌现了许多的著名统计学家,他们积极发展新理论并应用于实践。电子计算机的应用极大地促进了统计的发展。今天研究工作者把统计看作一项最有用的工具日常生活普遍受到以数量信息为基础的决策论的影响。现在,假设、试验与假设检验等一系列科学方法已为每个活动领域所熟悉。今天,建立在概率基础上的现代统计方法,作为物理学、生物科学、经济学、社会学、心理学、教育学、医学、农业、工业和政府的助手,正在证明它是不可缺少的。天文学以统计方法为基础,预测天
12、体的未来位置;适当的遗传区分是由统计探明的;生命保险费与年金是以统计记录为基础的死亡表来确定的;能源公司如果没有地区需求的统计资料,就不能有效地供应电力,研究工作者用统计方法来确定农业试验的结果是否显著;工程师发现抽样理论在工业产品质量控制上是非常有用的;企业经理与政府分析家用统计程序作出决策。这些应用的范围虽然很不相同,但使用大量的统计方法则是相同的。统计分拆的某一方面在某个领域也许比在其它领域显得更重要,但一般说来,同一统计方法则可用在所有领域。在统计研究中有一点要提请注意,认识这一点是很重要的,即没有一个统计方法本身能保证数据不出现错误、绝对准确,不能保证推理没有毛病、结论正确。原始资料
13、一定要正确、方法一定要恰当;而结果一定要由不仅懂得方法,而且要由懂得应用的人来解释。本书是把所讨论的统计方法当作土具,由适当的人掌握,在设计合理的场合加以应用,以取得有用的结论,但统计方法本身并不能创造奇迹。浅谈随机变量的数字特征摘要:我们知道,随机变量的分布函数完全刻画了随机变量的统计规律,它反应了随机变量的全貌,而随机变量的数字特征只是随机变量的统计规律的某一个方面的数量描述,不能完整地描述随机变量,但却反映随机变量取值的一些特征。本文就从这点出发,主要讲述随机变量的数字特征的引出、相关知识点及重点和随机变量数字特征的应用。 关键字:数字特征 数学期望 方差 协方差 相关系数我们知道随机变
14、量的分布函数能够全面地描述随机变量的统计特性。但实际问题中,由于有时很难求出随机变量的分布函数或者不需要知道随机变量的一切统计特性,而只需要知道随机变量的某些特征。例如在分析某校学生英语四级水平时,只要计算该校的平均成绩和计算该校每位学生的考试成绩与平时成绩的偏离大小,便可以对该校的学生英语四级水平做出比较客观的判断,这种能表示随机变量某些方面特征的数就是随机变量的数字特征。另外我们还注意到许多的重要分布都会含 1 到 3 个参数,而这些参数都与数字特征重合或关系密切,因此只要知道分布的类型,通过数字特征就能完全确定分布函数。由此可见,随机变量的数字特征的研究具有理论上和实际上的重要意义。通过
15、这章的学习,我理解了随机变量的数学期望、方差的概念,并会运用它们的基本性质计算具体分布的期望、方差;掌握了二项分布、泊松分布、均匀分布、指数分布、正态分布的数学期望和方差;会根据随机变量 X的概率分布计算其函数 ()gX的数学期望()EgX;会根据随机变量 (,)XY的联合概率分布计算其函数 (,Y的数学期望正4(,)EgXY;理解协方差、相关系数的概念,掌握它们的性质,并会利用这些性质进行计算,了解矩的概念。下面是我总结出来的本章知识要点:1数学期望设 是离散型的随机变量,其概率函数为 (),1,2iiPXap如果级数 iap绝对收敛,则定义 的数学期望为 ()iE;设 X为连续型随机变量,
16、其概率密度为 fx,如果广义积分 ()xfd绝对可积,则定义 的数学期望为 ()()Xfd2随机变量函数的数学期望设 为离散型随机变量,其概率函数 (),1,2iiPap如果级数()iigap绝对收敛,则 X的函数 (g的数学期望为)iiE设 (,)XY为二维离散型随机变量,其联合概率函数 (,),1,2ijijPaYbp如果级数(,)ijijigabp绝对收敛,则 (X的函数 ()gY的数学期望为,),ijijiEgab;特别地();(iji jiEXYbp.设 为连续型随机变量,其概率密度为 ()fx,如果广义积分 ()gxfd绝对收敛,则 的函数 ()g的数学期望为 ()EgXfd设 (
17、,)XY为二维连续型随机变量,其联合概率密度为 (,)fxy,如果广义积分gxyfdxy绝对收敛,则 (,)Y的函数 gXY的数学期望为(,),(,)gxyfd;特别地 ()Efdxy,(,)Y.3数学期望的性质3.1 ()c (其中 c 为常数);3.2 EkXbb ( ,k为常数);53.3 ()()EXYEY; 3.4 如果 与相互独立,则 ()XEY.4方差与标准差随机变量 的方差定义为 2()()D计算方差常用下列公式: 2XEX当 X为离散型随机变量,其概率函数为 (),1,iiPap如果级数2()iiaEp收敛,则 的方差为 2()()iiDXE;当 X为连续型随机变量,其概率密
18、度为 fx,如果广义积分2()(xEXfxd收敛,则 的方差为 2()()(fdx.随机变量 的标准差定义为方差 DX的算术平方根 )DX.5方差的性质 5.1 ()0Dc (c 是常数); 5.2 2(kX (k为常数);5.3 如果 与 Y独立,则 ()YY.6协方差 设 (,)为二维随机变量,随机变量 ,X的协方差定义为cov(,)()()EE计算协方差常用下列公式: YY当 XY时, cov(,)(,)(XYD协方差具有下列性质:6.1 ,0 (c 是常数);6.2 ()(,;6.3 cov,covkl ( ,kl是常数);6.4 1212cov,XYXY7相关系数随机变量 (,)的相
19、关系数定义为 (,)XYD相关系数 XY反映了随机变量 与 之间线性关系的紧密程度,当 |XY越大, 与 Y之间的线性相关程度越密切,当 0XY时,称 与 不相关相关系数具有下列性质:67.1 |1XY;7.2 的充要条件是 ()1PYaXb,其中 ,ab为常数;7.3 若随机变量 与 相互独立,则 与 Y不相关,即 0XY,但由 0XY不能推断 与 独立7.4 下列 5 个命题是等价的: 7.4.1 0XY;7.4.2 cov(,);7.4.3 ()EY;7.4.4 DD);7.4.5 ()利用协方差或相关系数可以计算()2cov(,)()2()XYXYYXD8原点矩与中心矩随机变量 的 k
20、阶原点矩定义为 kE;随机变量 的 阶中心矩定义为 ()k;随机变量 (,)Y的 (,l阶混合原点矩定义为 (l;随机变量 X的 k阶混合中心矩定义为 )()klXEY一阶原点矩是数学期望 )X;二阶中心矩是方差 D(X);(1,)阶混合中心矩为协方差 cov(,)Y.9常用分布的数字特征 9.1 当 X服从二项分布 ,Bnp时,(),()(1)EXDnp9.2 当 服从泊松分布 时, ,X,9.3 当 服从区间 (,)ab上均匀分布时, 2(),)21abbaE9.4 当 X服从参数为 的指数分布时, 21(),()XD9.5 当 服从正态分布 2,N时,(),()E9.6 当 (,)XY服
21、从二维正态分布 21,时, 21,X;2()()YD;1cov,XY上面讲了那么多的知识点,看起来很是繁琐,个人认为重点是期望、方差、协方差、相关系数的概念、计算和性质;常用分布的数字特征;利用性质计算随机变量函数的期望。7从随机变量的数字特征的引出中,我们可以知道研究随机变量的数字特征可以简化某些实际问题的解答,可以从总体上掌握随机变量某一侧面的性质,下面讲讲随机变量的数字特征的应用:1.通过分布求数字特征如:已知某网站每天的登录人数服从参数为 的泊松分布,而进入该网站的每个人打开某网页的概率为 ,试求访问该网页人数的分布律及其数学期望.解 以 表示登录网站的人数, 表示访问某网页的人数.依
22、题意:由全概率公式得:可见 仍服从泊松分布,参数为 ,因此其数学期望为 2.利用运算性质求数字特征如:已知随机变量 和 服从正态分布 和 ,且 与 的相关系数 ,设 , 试求 (1) , , ; (2) 与 是否相互独立?为什么.解 (1)由运算性质,有 ,8故 ;(2)由于 不一定是二维正态分布,故由 不能推出 与 相互独立.(若 与 均服从正态分布,且 与 相互独立,则 服从二维正态分布)3.利用分解法进行计算如:对某一目标连续射击,直至命中 次为止.设每次射击的命中率为 ,试求消耗的子弹数的数学期望.解 设 表示第 次命中至第 次命中之间所消耗的子弹数(含第 次命中不含第 次命中),则 , , 于是 9故 .总之,随机变量的数字特征的研究具有理论上和实际上的重要意义。参考文献:概率论与数理统计 第四版 江西高校出版社概率论与数理统计学习指导书 第四版 江西高校出版社最后谢谢廖宇波老师一学期来的辛苦教学,谨以此文献上。