收藏 分享(赏)

概率论简介.pptx

上传人:dreamzhangning 文档编号:2268113 上传时间:2018-09-08 格式:PPTX 页数:42 大小:2.62MB
下载 相关 举报
概率论简介.pptx_第1页
第1页 / 共42页
概率论简介.pptx_第2页
第2页 / 共42页
概率论简介.pptx_第3页
第3页 / 共42页
概率论简介.pptx_第4页
第4页 / 共42页
概率论简介.pptx_第5页
第5页 / 共42页
点击查看更多>>
资源描述

1、概率论简介 随机变量及其分布,孔宪芬 2012.5.9,1,内容提要,概率概述 随机变量及其分布 离散型随机变量及其分布 二项分布 泊松(Poisson)分布 连续型随机变量及其分布 正态分布,2,概率论是研究随机性或不确定性等现象的数 学。更精确地说,概率论是用随机实验来模 拟在同一环境下会产生不同结果的自然界与 人类社会活动中的现象。典型的随机实验有 掷骰子、扔硬币、抽扑克牌以及轮盘游戏等。,概率论简述,3,典型的概率问题:“掷一颗公正 的骰子,出现3点的概率是多少?”,概率论历史,作为数学统计基础的概率论的创始人分别是法国数学家帕斯卡和费马, 其可追溯到公元17世纪。当时的法国宫廷贵族里

2、盛行着掷骰子游戏,游 戏规则是玩家连续掷 4 次骰子,如果其中没有 6 点出现,玩家赢,如果 出现一次 6 点,则庄家(相当于现在的赌场)赢。按照这一游戏规则, 从长期来看,庄家扮演赢家的角色,而玩家大部分时间是输家,因为庄 家总是要靠此为生的,因此当时人们也就接受了这种现象。后来为了使游戏更刺激,游戏规则发生了些许变化,玩家这回用 2 个骰 子连续掷 24 次,不同时出现2个6点,玩家赢,否则庄家赢。当时人们普 遍认为,2 次出现 6 点的概率是一次出现 6 点的概率的 1 / 6 ,因此 6 倍 于前一种规则的次数,也既是 24 次赢或输的概率与以前是相等的。然而 事实却并非如此,从长期来

3、看,这回庄家处于输家的状态,于是他们去 请教当时的数学家帕斯卡,求助其对这种现象作出解释。其他对概率论的发展作出重要贡献的人还有荷兰物理、数学家惠更斯,瑞 士物理、数学家伯努利,法国数学家棣莫弗,法国数学、天文学家拉普拉斯, 德国数学家高斯,法国物理、数学家泊松,意大利数学、医学家卡尔达诺以 及苏联数学家柯尔莫哥洛夫。,4,概率论应用,概率论最早产生于17世纪,在过去的半个世纪里概率论在越来越多的新兴领域显示了它的应用性和实用性,例如:物理、化学、生物、医学、心理学、社会学、政治学、教育学,经济学以及几乎所有的工程学等领域。特别值得一提的是,概率论是今天数理统计的基础,其结果被用做问卷调查的分

4、析资料或者对经济前景进行预测。,5,随机变量(Random Variable) 随机变量的概率分布(Probability Distribution),6,概率论中的两个重要概念,定义: 设E是一个随机试验,是它的样本空间。如果对于中 的每一个样本点,都有一个实数()与之对应,那么就把 这样一个定义域为的单值实值函数称为随机变量。 : () 【注】用通俗语言解释随机变量就是:把随机试验的结果数量化(数字 化)数学化。引入随机变量以后,研究随机事件概率的方式有所改变:用随 机变量满足某个不等式或等式表示随机事件。把有共性的一些问题归结到 对某个 随机变量的研究。分类: 离散型随机变量和连续型随机

5、变量,随机变量,离散型随机变量的概率分布(或称分布)(Probability Distribution),设 X 是一个离散型随机变量(随机变量只能取有限个或可列个值),它所有可能的取值为 , , , 相应的取这些值的概率为 = = , =, 称上式为离散型随机变量 X 的概率分布(Probability Distribution)或分布(Distribution)。称如下定义的函数是X的分布函数(distribution function)或累积分布函数(cumulative distribution function),简称CDF =,8,几种重要的离散型分布,两点分布 二项分布 泊松(P

6、oisson)分布 超几何分布 几何分布 负二项分布 均匀分布,9,在医学领域的随机事件中,最简单的是只有两种互斥可能结果随机事件,称为二项分类变量(dichotomous variable),如接受治疗后的结果是有效、还是无效;某种化验的结果是阳性、还是阴性,手术后是生存、还是死亡。对这类问题的研究,不仅要确定2个可能出现的随机事件的概率,有时还要计算在独立、重复地进行 N 次相同的观察下,某一事件出现 k 次的概率。二项分布(binomial distribution)就是对这类只具有两种互斥结果的离散型随机事件的规律性进行描述的一种概率分布。,二项分布(Binomial Distribu

7、tion),11,二项分布是最重要的离散概率分布之一,由瑞士数学家雅各布伯努利(Jakob Bernoulli ,1654.12.27-1705.08.16)所发展。,什么是二项分布?,定义: 伯努利试验 (Bernoulli trial) 是只有两种可能结果的单次 随机试验,比如失败,成功 、yes, no、生存,死亡、 阳性,阴性。即对于随机变量 X 而言,X只可取两个值。设为 0 ,1 。其分布为 = = , = =. 定义:进行 次独立的伯努利试验,设每次试验成功的概率为 ,那么这 次试验中试验成功的次数服从二项分布. 记做(,) ., = = 1 , =0, 1, , 且 =, =(

8、1),二项分布的例子,二项分布的典型例子是扔硬币试验。扔硬币,正面朝上的概率为p, 重复扔n次,则出现正 面的次数服从二项分布 B(n,p). 设同学们的出勤率均为90%,我班上有110名同学。则周四缺勤同学的人数服从二项分布B(110,0.1)。 姚明作为中锋,他职业生涯的定点投篮命中率为0.8.在1000次罚球投篮练习中,他投中的次数服从二项分布B(1000,0.8)。 已知用某药治疗某一非传染疾病的有效率为60%。现在用该药治疗该病患者50名,有效治疗的人数服从二项分布 B(50,0.6). 假定有10个工人间歇性的使用电力,每个工人彼此独立的工作。如果一个工人在一个小时里有12分钟在使

9、用电力,估计所需要的总负荷。,13,二项分布的图形,已知p 和n,就能按公式计算X =0,1,n时的P(X) 值。以 X为横坐标,以 P(X) 为纵坐标作图,即可绘出二项分布的图形,二项分布的形状取决于p 和n 的大小,高峰在 =np 处。 当 p 接近0.5时,图形是对称的;p离0.5愈远,对称性愈差,但随着n 的增 大,分布趋于对称;当n时,只要p不太靠近0或1,特别是当np和n(1p)都大于5时,二项分布近似于正态分布。,14,二项分布的图形,p=0.5时,不同n 值对应的二项分布,p= 0.3时, 不同 n 值对应的二项分布,16,能量供应问题(二项分布) 假定有10 个工人间歇性地使

10、用电力,估计所需要的总负荷。,分析:首先我们要知道,或者是假定,每个工人彼此独立工作,而每一时刻每个工人都以相同的概率p需要一个单位的电力。那么,同时使用电力的人数就是一个随机变量,它服从所谓的二项分布。用 X 表示这个随机变量,记做 (,)其次,要根据经验来估计出,p值是多少?例如,一个工人在一个小时里有12分钟在使用电力,那么应该有 = =.。最后,利用公式我们求出随机变量X的概率分布表如下:,17,为直观计,我们给出如下概率分布图(直方图):,18,概率分布表,可以看出, 6 =1 6 =1 =0 + =1 + =2 + =3 + =4 + =5 + =6 =10.999136=0.00

11、0864也就是说,如果供应6个单位的电力,则超负荷工作的概率只有0.000864,即每1 0.000864 1157分钟19小时中,才可能有 1 分钟电力不够用。还可以算出,八个或八个以上工人同时使用电力的概率就更小了,比上面概率的 还要小。,19,泊松分布(Poisson Distribution),20,Poisson分布更多地专用于研究单位时 间、单位人群、单位空间、单位容积 内,某罕见事件发生次数的分布。例如在医学中可以用泊松分布来描绘 某种细菌在单位容积空气或水中出现 的情况,某段时间特定人群中某种 恶性肿瘤患者的分布或出生缺陷的发病情况,放射性物质在单位时间内的放射次数等。 在昆虫

12、生态学中可以描述单位空间、单位时间内某种 昆虫数的分布等等。,西莫恩德尼泊松(Simon Denis Poisson, 1781年6月21日1840年4月25日), 是法国数学家、几何学家和物理学家。,什么是泊松分布?,定义 如果随机变量 X 的概率分布为则称随机变量 X 服从参数为的泊松分布。 记做:() . = =, = = ! , =, 其中,泊松分布的例子,单位时间内电话交换台接到的呼唤次数 纺织厂生产的一定数量的布匹上的疵点数 农田中单位空间中某种害虫的个数 某段时间特定人群中某种恶性肿瘤患者的分布或出生缺陷的发病情况 自然灾害发生的次数 DNA序列的变异数 放射性原子核的衰变数,2

13、2,23,泊松定理 在 n 重伯努利试验中,如果每次试验中事件A发生的概率为 ,且 = , 则对于任意一个非负整数, = ! , =,【注解】:Poisson分布可以用来近似 p 很小,样本含量n 趋向于无穷时的二项分布。当试验中成功事件出现的概率很小,如 p 0.05,且试验的次数 n 很大时,用二项分布计算成功事件出现的次数X(X=0,1,2,, n)的概率很困难。用Poisson分布可简化计算。Poisson分布发展成为描述小概率事件出现规律性的一种重要的离散型分布。,泊松分布与二项分布的关系,24,泊松分布的图形,Poisson分布的形状取决于 的大小。 值越小,分布越偏,随着 的增大

14、,分布越趋于对称,当 =20时,分布接近正态分布,当 =50时,可以认为Poisson分布呈正态分布N( , ),按正态分布处理。,当小于5时为偏峰,愈小分布愈偏,随着增大,分布趋向对称。以下是取不同值时的分布图,25,Rutherford 对裂变物质的观测(Poisson分布),英国著名物理学家 Rutherford(18711937)在其放射性物质试验中,观测在时间间隔T内放射性物质放射出的粒子数。实际试验时,取时间间隔为T=7.5秒,观测了N2608次,将每次观测到的粒子数记录下来,列在下表中第1,2行:,26,我们用X表示T=7.5秒内观测到的粒子数。在2608次观测中,共观测到100

15、94个粒子数,平均每次观测到1009426083.87个粒子数,用参数为=3.87的Poisson分布P计算 一下, 将计算结果列在上表中最后一行,与列在第3行的实际频率比较,比较的图示在下图中。可以看出,认为X服从参数为3.87的Poisson分布还是非常合理的。在后面统计部分,我们会用Pearson 拟合检验法来证明这种合理性。,27,连续型随机变量的密度函数(Probability Density Function ) (或小写pdf),定义 对于随机变量 X 的分布函数() (Recall: :=),如果存在非负可积函数(),使得对任意实数有 = = 则称X为连续型随机变量,称()为X

16、的概率密度函数(Probability Density Function),简称密度(Density).,28,几种重要的连续型分布,均匀分布 指数分布 正态分布 分布,29,正态分布(Normal Distribution),正态分布是最重要的一种概率分布。正态分布概念是由德国的数学家和天文学家是棣莫弗(Moivre)于1733年首次提出的,但由于德国数学家高斯率先将其应用于天文学研究,故正态分布又叫高斯分布。在概率统计中,其它分布如t分布、F分布、 分布都是在正态分布的基础上推导出来的, 检验也是以正态分布为基础的。此外,t分布、二项分布、Poisson分布的极限为正态分布,在一定条件下,

17、可以按正态分布原理来处理.在应用中,正态分布是最重要的一种概率分布。它在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。,31,卡尔弗里德里希高斯(C.F.Gauss,1777.4.30-1855.2.23), 生于不伦瑞克,卒于哥廷根,德国数学家、物理学家和天文学家,大地测量学家。近代数学奠基者之一,在历史上影响之大,可以和阿基米德、牛顿、欧拉并列,有“数学王子”之称。但现今德国10马克的印有高斯头像的钞票,其上还印有正态分布的密度曲线。这传达了一种想法:在高斯的一切科学贡献中,其对人类文明影响最大者,就是这一项。,什么是正态分布?,定义 设随机变量 X 的概

18、率密度为 = , . 则称随机变量 X 服从参数为 , 的正态分布。记做:(, ). = , = (,)称为标准正态分布,有时候用字母 Z 表示。 这时 X 的分布函数为 = , +,正态分布的例子,医学现象中,同质群体的身高、体重、红细胞数、血红蛋白量的体征 实验中、测量中的随机误差 一棵树上所有树叶的重量 批量生产的某一产品的尺寸 各种各样的心理学测试分数 某些物理现象比如光子计数一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布(见中心极限定理)。,33,正态分布的图形,34,正态分布的图形的特点,(1)关于X= 对称。 (2) 在X= 处取得该概

19、率密度函数的最大值, 在X= 处有仅有的两个拐点,表现为钟型曲线。 (3)曲线下面积为1。 (4) 决定曲线在横轴上的位置, 曲线沿横轴右移; 曲线沿横轴向左移。 (5)当 恒定时 , 决定曲线的形状, ,数据越集中,曲线形状“瘦高”, ,数据越离散,曲线越“矮胖”。,正态分布的标准化变换,36,如果随机变量X服从正态分布N( ,2),可做如下的标准化变换,也称Z变换。而随机变量Z服从标准正态分布 N(0,1). 这样,所有服从正态分布的的随机变量都可转化为标准正态分布来处理。,概率密度 = 1 2 2 2 , 分布函数 = 1 2 2 2 , ,37,标准正态分布(,),标准正态分布表,38

20、,现代概率统计教材中都使用软件得到各分布的分位 数。如Excel,Matlab, Spss等都可以。定义:分位数 设连续随机变量X的分布函数为(),密度函数为()。那 么,对任意0p1的p,称 = = 的 为此分 布的分位数,或者下侧分位数。 简单的说,分位数指的就是连续分布函数中的一个点,这个 点对应概率为p。,39,3 法则 (3s法则),设(, ),则 + = + = = () = = () = = . =.,40, =1(), =,3 法则 (3s法则),3 法则: 服从正态分布的随机变量 X 落在区间(,+)之内的可能性可以达到 99.74%, 落在区间 (,+) 之外的可能性不到 0.3%。3 法则在正态性统计判别和产品质量管理中很有用。 + =. + =.,41,谢谢大家!,42,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 实用文档 > 往来文书

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报