收藏 分享(赏)

第二三章(15) 几种常见的概率分布.ppt

上传人:pw17869 文档编号:6495599 上传时间:2019-04-14 格式:PPT 页数:80 大小:1.27MB
下载 相关 举报
第二三章(15) 几种常见的概率分布.ppt_第1页
第1页 / 共80页
第二三章(15) 几种常见的概率分布.ppt_第2页
第2页 / 共80页
第二三章(15) 几种常见的概率分布.ppt_第3页
第3页 / 共80页
第二三章(15) 几种常见的概率分布.ppt_第4页
第4页 / 共80页
第二三章(15) 几种常见的概率分布.ppt_第5页
第5页 / 共80页
点击查看更多>>
资源描述

1、第2 (3)章 概率和概率分布,& 2.1 概率的基本概念 & 2.2 概率分布(略) 2.2.1 离散型概率分布(略) 2.2.2 连续型概率分布(略) & 2.3 几种常见的概率分布 & 2.3.1 0-1分布(略) & 2.3.2 二项分布(略) & 2.3.3 泊松分布(略) & 2.3.4 正态分布(P50) & 2.3.5 中心极限定理(P57),确定性现象:不需要概率论和统计学 非确定性现象:统计学研究随机现象,无简单的因果关系,如动物出生的体重.,某个样本推断总体时 推断错误的可能性有多大? 置信度有多高?,非确定性现象是有规律的。研究偶然现象本身规律的科学称为概率论.,概率论

2、和统计学,是以随机试验为研究对象的。,2.1 概率的的基本概念,2.1.1 概率的古典定义(略),例:掷一颗均匀的色子,求“掷出偶数的概率”例:在10尾鱼中,有6尾健康鱼,4尾病鱼。求“从中抽2尾均为病鱼”的概率。,以等可能为前提 (1)随机试验中,基本事件的总数n为有限个 (2)各基本事件的发生是等可能的(各基本事件等概率) 这类随机现象的概率类型称为古典概型。则事件A的概率: P(A)=A中包含的基本事件数/基本事件总数=m/n,表2.1 在相同条件下水稻种子发芽试验结果 试验粒数(n) 5 10 50 100 200 500 1000 发芽粒数(a) 5 8 44 91 179 452

3、901 发芽频率(a/n) 1.0 0.8 0.88 0.91 0.895 0.904 0.901,2.1.2 概率的统计定义,课本P27表,2.1.3 概率的基本性质:,3、不可能事件(V)的概率等于0,即:P(V)=0,1、任何事件(A)的概率都在0与1之间0P(A) 1,2、必然事件(W)的概率等于1,即: P(W)=1,概率是事件在试验结果中出现可能性大小的定量计量,是事件的固有属性。概率有以下明显性质:,假定在相似条件下重复进行同一类试验,调查事件A发生的次数m与试验总次数n的比数称为频率(m/n),则在试验总次数n逐渐增大时,事件A的频率愈来愈稳定的接近一个定值p,则定义为事件A发

4、生的概率.记为,P(A)=p=m/n,在实际问题中,由于试验次数n不可能无限增大,因此,常将n充分大时,事件A发生的频率作为其概率的近似值。,1.加法法则 任意事件A、B,有:P(A+B)=P(A)+P(B) P(AB) 若事件A和B互斥,则:P(A+B)=P(A)+P(B),例如 在一鱼池中,放养草鱼鲢鱼和鲤鱼各100尾。草鱼 主要吃植物性食料,鲢鱼吃浮游生物,而鲤鱼则为杂食性,求这一鱼池中单食性鱼的概率。,2.1.4 概率的运算,2.条件概率 在同一个样本空间 中的事件或者子集 A 与 B,如果随机从 中选出的一个元素属于 B,那么下一个随机选择的元素属于 A 的概率就定义为在 B 的前提

5、下 A 的条件概率,记为P(A/B)。P(A/B)=P(AB)/P(B),课本P29例2.2,缩小了样本空间,3. 概率乘法法则:P(AB)=P(A) P(B/A)P(AB)=P(B) P(A/B) A和B是两个独立事件(事件A的发生并不影响事件B发生的概率),则: P(AB)=P(A) P(B),若一批玉米种子发芽率为0.9,发芽后能出土的概率为0.8,求这批种子的出苗率?,P(AB)=P(A) P(B)=0.90.8=0.72,例: 在10尾鱼中有3尾雌鱼,7尾雄鱼。按不放回抽样从中抽取2尾,每次抽取1尾,求“第一次抽得雄鱼,第二次抽得雌鱼”的概率。,设A表示“第一次抽得雄鱼“,B表示”第

6、二次抽得雌鱼”,则 P(A)=7/10,P(B/A)=3/9 P(AB)=7/10*3/9,若按放回抽样从中抽取2尾,每次抽取1尾,求“第一次抽得雄鱼,第二次抽得雌鱼”的概率。,4. 独立事件的概率若事件A的发生,并不影响事件B的发生的概率,则称A与B是独立事件。 事件A的概率为P(A),那么对立事件B的概率为: P( B )=1-P(A),若一批种子发芽率为0.9,则不发芽率的概率为1-0.9=0.1,例: 在一鱼池中,草鱼、鲢鱼和鲤鱼所占比例分别为50%、30%、20%,其病鱼率分别为1%,2%,4%。求从此鱼池中任意取出1尾是病鱼的概率。,计算复杂事件的概率时,常需将它们分解为一些较简单

7、的事件,再应用概率的法则,设A1、A2、A3分别表示“取出鱼是草鱼”、“取出鱼是鲢鱼”和“取出鱼是鲤鱼”,B表示”任意取出一条是病鱼”,A之间互斥,和为全样本.,P(B/A1)=0.01, P(B/A2)=0.02, P(B/A3)=0.04 据全概率公式得: P(B)= P(A1B)+P(A2B)+P(A3B) P(A1)P(B/A1)+P(A2)P(B/A2)+P(A3)P(B/A3) =0.05*0.01+0.3*0.02+0.2*0.04 =0.019,&2.2 随机变量的概率分布,2.2.1 离散型随机变量的概率分布,若随机变量X只取数轴上有限个或无限个子孤立x1,x2,x3xn ,

8、并且这些值对应的概P1,P2,P3Pn,则称X是离散型随机变量.其概率函数为:p(x)= P(X=x) 或表示为PX=xi=pi ,i=1,2, 其中:p(x)0 , p (x) =1。 大写字母表示随机变量,小写字母表示第i次观测值,随机变量(random variable)就是在随机试验中被测定的量。,将随机变量X的一切可能值x1,x2,x3.以及取得这些值的概率p1,p2,p3排列起来,就构成了离散型随机变量的概率分布图。(P31),常用离散型随机变量的分布:0-1分布;二项分布;泊松分布,离散型 随机变量的分布函数是指随机变量小于等于某一可能值xi的概率。,2.2.2 连续型随机变量的

9、概率分布,如随机变量可取某一(有限或无限)区间内的任何数值,称为连续型随机变量。如小麦株高。,在研究连续型随机变量是,实际观测值只能是落在一定的区间内,落在一定区间内的概率可 以不为0,但区间可以很小。随机变量Y的值落在区间(y, y+y)内的概率为P (yYy+y)。当y0时, 的极限表示随机变量Y在点y处的概率密度,用f(y)表示,称f(y)为随机变量的概率密度函数。,f(y)为随机变量的概率密度函数,正态分布概率密度函数:,分布函数(累积分布函数):是随机变量Y取得小于y0值的概率,是对概率密度的积分。,分布曲线在区间(-,y)所夹的面积。,概率P(aXb)就是区间(a,b)夹的曲线下面

10、积。,概率密度的图形,称为分布曲线。,& 2.3 几种常见的概率分布 & 2.3.1 0-1分布 & 2.3.2 二项分布 & 2.3.3 泊松分布 & 2.3.4 正态分布(P50),2.3.1 0-1分布,若随机变量X只能取0,1两个值,且P(X=1)=p, P(X=0)=1-p=q,(0P1),则称X服从参数为p的0-1分布.若一随机试验只有两种可能,则称该试验为伯努利试验. =0q+1p= P 2=p(x)(x- )2=(0-p)2q+(1-p)2p= pq,2.3.2 二项分布,例1:某养殖场鱼烂鳃病的发生率为0.8,求在随机抽取的10尾鱼中,(1)恰有4尾发病的概率;(2)最多有8

11、尾发病的概率;(3)发病的平均尾数与方差. 例2.课本P41例3.1,1. 二项分布的概率函数:,特点:总体X只能出现非此即彼两种对立的结果。,假定某事件A发生的概率为p,不发生的概率为q,则做n次独立性试验(独立进行n次伯努利试验),发生k (0kn)次的概率为(或参课本P35表示):,则随机变量X服从参数为n和p的二项分布,记为XB(n,p).,2. 二项分布的特点:,(1) P(x=k)=Pn(k)0 (2) 二项分布概率之和等于1. (展开式各项是事件A发生n次的概率),二项分布由n和P两个参数决定,其特点是:,当P值较小且n不大时,分布是偏倚的。但随着n的增大,分布逐渐趋于对称,如图

12、31所示。,对于固定的n及p,当x增加时,Pn(x)先随之增加并达到某极大值,以后又下降。,当P值趋于0.5时,分布趋于对称,图32所示。,3.服从二项分布的随机变量的特征数,b.二项分布的总体方差:2 =npq表示取值的离散度或变异大小,二项分布的总体平均数表示做次独立试验,某事件平均出现的次数为次,3.二项分布的概率计算应用,例1:有一批芽接苗,其成活率为0.85,今从中随机抽取6株种植,求(1)正好有5株成活的概率?(2)最少有4株成活的概率?(3)最多有4株成活的概率?(4)平均成活数?(5)平均变异?,(5)总体方差:2 =npq=60.850.15=0.765表示成活株数平均差异0

13、.87,(4)总体平均数np=0.856=5.1随机抽6株,平均5.1株成活。,泊松分布是一种可以用来描述和分析随机地发生在单位时间或空间里的稀有事件的概率分布。,例:正常生产线上单位时间生产的不合格产品数,每毫升饮水内大肠杆菌数,意外事故,自然灾害等。,2.3.3 泊松分布,当某事件出现的概率p很小,而试验n很大时(n+,p-0,np-时),二项分布B(n,p)的极限分布,即泊松分布,记为XP()。,当二项分布在p0.1和np5时,可用泊松分布近似。,1.泊松分布定义,2.特点:在概率函数内的,不但是它的平均数,而且是它的方差. 2 其概率分布条形图的形状决定于。 用=np进行有关计算。3.

14、 应用实例(课本P41,例3.5),2.3.4 正态分布,、正态分布的密度函数和分布函数,-3 -2 -1 0 1 2 3,两头少,中间多,两侧对称。数据的这种分配规律称为正态分布,又称高斯(Gauss)分布,是连续性随机变量的一种最重要的理论分布,是生物统计学的重要基础。,正态分布曲线: 正态分布密度函数的图像称为正态曲线。,(1) 正态分布概率密度函数:,如果随机变量X的概率密度函数满足上式,则称X服从正态分布,记为,x : 所研究的变数;:x的函数值,称为概率密度函数;:总体平均数;:总体标准差,其中 , 是两个常数,正态分布记为N( , ) ,表示具有平均数为 ,方差为 的正态分布。,

15、(样本中的观察值总合叫变数,变数中每个成员为变),(1)单峰曲线 (2)左右对称(X) (3)在x处曲线各有一拐点 (4)曲线图形由、确定。总体标准差表示 曲线展开程度。 (5)X ()0 (6)曲线与横坐标所夹的面积等于(100),(2)正态分布曲线(正态分布密度函数的图象)特点:,密度函数,(3) 正态分布的分布函数(累积分布函数):,是随机变量X取得小于x的值的概率,概率密度函数:,正态分布曲线: 正态分布密度函数的图像称为正态曲线。,累积分布函数:是随机变量X取得小于X值的概率,是对概率密度的积分。,分布曲线在区间(-,y)所夹的面积。,对于任何正态分布,随机变量X的值落入任意区间(a

16、,b)的概率为:,密度函数,2、正态分布的概率计算,根据正态分布的性质,变量在两个定值间取值的概率等于曲线与其x轴在该区间围成的面积。因此概率的计算即正态分布概率密度函数的定积分计算。 是一个曲线系统。为了一般化的应用,需将正态分布标准化。,(1) 标准正态分布:, =0, =1时的正态分布称为标准正态分布记作 N(0,1),(u) 称为标准化正态分布密度函数,即,从表中可以查出(u)的值.其值等于标准正态曲线从-到u所夹的曲线下面积。该曲线下的面积表示随机变量U落入区间( -,u)的概率。,(1)在u=0时, 达到最大值 (2)左右对称, (3)在u-1和u=1处曲线各有一拐点 (4)曲线图

17、形由、确定 (5)X ()0 (6)曲线与横坐标所夹的面积等于(100),标准正态分布特点:,u分布,t分布 (df=1),图4.3 t分布及其与标准正态曲线的比较,常用标准正态曲线下的面积(概率),积分得 u =1.96,= +1.96(面积)概率为95u=2.576,=+2.576(面积)概率为99 在统计学上称两尾的概率之和5为5的显著水准1为1的显著水准,正态分布表的查法 P325附表,正态分布表的查法 P325附表,正态分布的单侧临界值,附表3 正态分布上侧临界值,由查u值,由u 查值,附表2,附表3,查当=0.05时的u值,1.645,规定:,表示的上侧临界值,表示的下侧临界值,表

18、示的双侧临界值,由于正态分布图形随,不同而变,不便比较,将X转化为u值:,即把原正态分布转化为标准正态分布。,(2) 正态分布的标准化,即新的随机变量服从标准备正态分布,从N(, 2 )到 N(0,1),从几何意义上说,仅仅是将变量x作了横坐标轴的平移和尺度单位的变化。,经过标准变换后,X的分布函数,P54例2.1 已知高梁品种“三尺三”的株高Y服从正态分布N(156.2, 4.822) , 求:(1)Y164 cm 的概率;(3)Y在152162 cm的概率。,例2.2250株小麦的高度分布服从正态分布N(63.33,2.882),问: (1)株高在60cm以下的概率? (2)株高在69cm

19、以上的概率? (3)株高在6264 cm之间的概率? (4)株高在多少cm以上的占全体的95%?,例2.3 已知某作物株高增量(cm)服从正态分布N(250,1.582)若P(xl1)=P(xl2)=0.05,求l1和l2。,表3:P(Yua)=a,2.3.4 中心极限定理,X1=光强,X2=光质,Xi=光质,X6=氧气,X5=水,X4=N,X3=P,x1+x2+x3+.=X,已证明,随机变量和的分布趋于正态分布,故X趋于正态分布,当n充分大时(极限的原理和方法),无论各个Xi的分布是什么,这个部分和的分布是近似正态的.,假设被研究的随机变量X,可以表示为许多相互独立的随机变量Xi的和。如果X

20、i的数量很大,而且每一个别的Xi对X所起的作用又很小,则随机变量X(和)可以被认为服从或近似地服从正态分布。据此定理才能从单个样本的n个数据所得到的统计量对总体进行估计.,1、中心极限定理基本内容,2、中心极限定理重要推理:,若已知总体平均数为,标准差为,那么,不论该总体是否正态分布,对于从该总体所抽取的含量为n的样本,当n充分大时,其平均数渐近服从正态分布N(, 2/n),-公式推导证明见P57-P58,实例证明见P59例3.11,从一个正态总体中抽取的样本,不论样本含量的大小,其样本数均服从正态分布,实例证明见P63图3-15,总体Y:非正态分布,呈正偏的偏态分布,n=2,n=4,n=8,

21、n=32,n=16,样本平均数的分布:随样本含量的增加,逐渐趋于正态分布,例如,设有一个N=4的有限总体,其变量值为2、3、3、4。,总体的平均数、方差和标准差,当以样本容量n=2进行独立抽样,抽取的所有可能样本数 ,其平均数、方差和标准差如下表。,样本观察值x,2 2 2 2 3 3 3 3 3 3 3 3 4 4 4 4,2,3,4,3,2,3,3,4,2,3,3,4,x,4 5 5 6 5 6 6 7 5 6 6 7 6 7 7 8,2,3,3,4,2.0 2.5 2.5 3.0 2.5 3.0 3.0 3.5 2.5 3.0 3.0 3.5 3.0 3.5 3.5 4.0,0.0 0.

22、5 0.5 2.0 0.5 0.0 0.0 0.5 0.5 0.0 0.0 0.5 2.0 0.5 0.5 0.0,0.00 0.25 0.25 1.00 0.25 0.00 0.00 0.25 0.25 0.00 0.00 0.25 1.00 0.25 0.25 0.00,s,0.000 0.707 0.707 1.414 0.707 0.000 0.000 0.707 0.707 0.000 0.000 0.707 1.414 0.707 0.707 0.000,96 48 8.0 4.0 8.484,以自由度(n-1)作分母计算的样本方差 之均数:,以样本容量n作分母计算的样本方差 之均

23、数:,样本标准差S之均数:,各样本均数总和之均数:,原总体不是正态分布,抽样的样本的平均数的参数,如果所有可能样本的某一统计数的平均数等于该总体的相应参数,则称该统计数为总体参数的无偏估计值(unbiased estimate)。,是 的无偏估计值;,是 的无偏估计值;,以n为分母得到的样本方差 不是 的无偏估计值;,S不是 的无偏估计值;,因此,为了得到 的无偏估计值,估算样本方差时,必须以自由度df=n-1而不用n做分母。,抽样结论,小概率事件实际不可能性,随机事件概率的大小客观地反映事件在一次试验中发生的可能性的大小。概率大表示该事件发生的可能性大;概率小,说明该事件发生的可能性小;生物学研究中多采用5%、1%这两个标准作为小概率事件。,正态曲线下的面积:(用概率表示),在统计推断上国内约定95、99 积分算得 1.96,+1.96概率为95 2.576,+2.576概率为99 在统计学上称两尾的概率之和5为5的显著水准1为1的显著水准,已知随机变量Y 服从正态分布N(0,52),求y0,分别使得,课本P64 3.13,练习题(3.13):,P62习题 3.12 3.13,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 中等教育 > 职业教育

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报