收藏 分享(赏)

统计学 二项分布.ppt

上传人:dreamzhangning 文档编号:3223382 上传时间:2018-10-07 格式:PPT 页数:34 大小:221.50KB
下载 相关 举报
统计学   二项分布.ppt_第1页
第1页 / 共34页
统计学   二项分布.ppt_第2页
第2页 / 共34页
统计学   二项分布.ppt_第3页
第3页 / 共34页
统计学   二项分布.ppt_第4页
第4页 / 共34页
统计学   二项分布.ppt_第5页
第5页 / 共34页
点击查看更多>>
资源描述

1、第8章,几种离散型变量的 分布及其应用 Distribution and Application of Discrete Data,Binomial distribution Poissin distribution,Content,随机变量有连续型和离散型之分,相应的概率分布就可分为连续型分布和离散型分布。有关连续型分布如正态分布、t分布和F分布等在前面的章节中已作了介绍。本章主要介绍在医学中较为常用的离散型分布,即二项分布、Poisson分布。,第一节 二项分布,二项分布(binomial distribution)是指在只会产生两种可能结果如“阳性”或“阴性”之一的n次独立重复试验(常常

2、称为n重Bernoulli试验)中,当每次试验的“阳性”概率保持不变时,出现“阳性”的次数X=0,1,2,n的一种概率分布。,在医学中类似如这种n重Bernoulli试验的情形较为常见。如用某种药物治疗某种疾病,其疗效分为有效或无效;在动物的致死性试验中,动物的死亡或生存;接触某种病毒性疾病的传播媒介后,感染或非感染等。,若从阳性率(死亡率、感染率等)为的总体中随机抽取大小为n的样本,则出现阳性数为X的概率分布即呈二项分布,记为XB(n,).,二项分布有两个参数:总体率样本含量记作:XB(n,),在n个独立的个体中出现X个阳性的概率可由下式求出:,一、二项分布的适用条件和性质 (一) 二项分布

3、的适用条件 1. 每次试验只会发生两种对立的可能结果之一,即分别发生两种结果的概率之和恒等于1; 2. 每次试验产生某种结果(如“阳性”)的概率固定不变; 3. 重复试验是相互独立的,即任何一次试验结果的出现不会影响其它试验结果出现的概率。,(二) 二项分布的性质 1. 二项分布的均数与标准差 在n次独立重复试验中,出现“阳性”次数X的 总体均数为总体方差为总体标准差为,若以率表示,则样本率p的 总体均数为总体方差为 总体标准差为,样本率的标准差也称为率的标准误,可用来描述样本率的抽样误差,率的标准误越小,则率的抽样误差就越小。 在一般情形下,总体率往往并不知道。此时若用样本资料计算样本率p=

4、X/n作为的估计值,则 的估计为:,2.二项分布的图形 对于二项分布而言,当=0.5时,分布是对称的,见图;,当 0.5时,分布是偏态的,但随着n的增大,分布趋于对称。当n 时,只要不太靠近0或1,二项分布则接近正态分布。,二、二项分布的应用 (一)总体率的区间估计 1. 查表法 2. 正态近似法,1. 查表法 对于n 50的小样本资料,直接查附表6百分率的95%或99%可信区间表,即可得到其总体率的可信区间。 例6-2 在对13名输卵管结扎的育龄妇女经壶腹部-壶腹部吻合术后,观察其受孕情况,发现有6人受孕,据此资料估计该吻合术妇女受孕率的95%可信区间。,本例n=13,X=6。查附表6,取0

5、.05时,在n=13(横行)与X=6(纵列)的交叉处数值为1975,即该吻合术妇女受孕率的95%可信区间为(19%,75%)。附表6只列出 的部分。当 时,可先按“阴性”数n-X查得总体阴性率的 可信区间QLQU,再用下面的公式转换成所需的阳性率的 可信区间。 PL=1-QU, PU=1-QL,2. 正态近似法 根据数理统计学的中心极限定理可得,当n较大、不接近0也不接近1时,二项分布B(n,)近似正态分布,而相应的样本率p的分布也近似 正态分布。为此,当n较大、p和1-p均不太小,如np和n(1-p)均大于5时,可利用样本率p的分布近似正态分布来估计总体率的可信区间。,的 可信区间为:如:

6、的95%可信区间为的99%可信区间为,例:在观测一种药物对某种非传染性疾病的治疗效果时,用该药治疗了此种非传染性疾病患者100人,发现55人有效,试据此估计该药物治疗有效率的95%可信区间。,(二)样本率与总体率的比较 1.直接法 在诸如疗效评价中,利用二项分布直接计算有关概率,对样本率与总体率的差异进行有无统计学意义的比较。比较时,经常遇到单侧检验,即“优”或“劣”的问题。那么,在总体阳性率为的n次独立重复试验中,下面两种情形的概率计算是不可少的。,(1)出现“阳性”的次数至多为k次的概率为:(2)出现“阳性”的次数至少为k次的概率为,例6-4 据报道,对输卵管结扎了的育龄妇女实施壶腹部-壶

7、腹部吻合术后,受孕率为0.55。今对10名输卵管结扎了的育龄妇女实施峡部-峡部吻合术,结果有9人受孕。问实施峡部-峡部吻合术妇女的受孕率是否高于壶腹部-壶腹部吻合术? 显然,这是单侧检验的问题,其假设检验为 H0:=0.55 H1:0.55=0.05,对这10名实施峡部-峡部吻合术的妇女,按0.55的受孕率,若出现至少9人受孕的概率大于0.05,则不拒绝H0;否则,拒绝H0,接受H1。 本例n=10,=0.55,k=9。按公式(6-12)有:,按=0.05水准,拒绝H0,接受H1,即认为实施峡部-峡部吻合术妇女的受孕率要高于壶腹部-壶腹部吻合术。,2.正态近似法 当n较大、p和1-p均不太小,

8、如np和n(1-p)均大于5时,利用样本率的分布近似正态分布的原理,可作样本率p与已知总体率0的比较。检验统计量u值的计算公式为:,例6-6 对某疾病采用常规治疗,其治愈率为45%。现改用新的治疗方法,并随机抽取180名该疾病患者进行了新疗法的治疗,治愈117人。问新治疗方法是否比常规疗法的效果好?本例是单侧检验,记新治疗方法的治愈率为,而0=0.45。其假设检验为 H0:=0.45 H1:0.45=0.05,本例n=180,p=117/180=0.65查u界值表(t界值表中 为 的一行)得单侧 。按 =0.05水准,拒绝H0,接受H1,即新的治疗方法比常规疗法的效果好。,(三)两样本率的比较

9、 两样本率的比较,目的在于对相应的两总体率进行统计推断。 设两样本率分别为p1和p2,当n1与n2均较大,且p1、1-p1及p2、1-p2均不太小,如n1p1、n1(1-p1)及n2p2、n2(1-p2)均大于5时,可利用样本率的分布近似正态分布,以及独立的两个正态变量之差也服从正态分布的性质,采用正态近似法对两总体率作统计推断。,检验统计量u的计算公式为:,例6-7 为研究某职业人群颈椎病发病的性别差异,今随机抽查了该职业人群男性120人和女性110人,发现男性中有36人患有颈椎病,女性中有22人患有颈椎病。试作统计推断。 记该职业人群颈椎病的患病率男性为1,女性为2,其检验假设为 H0:1=2 H1:12=0.05,本例 n1=120,X1=36,p1=X1/n1=36/120=0.30;n2=110,X2=22,p2=X2/n2=22/110=0.20,查u界值表得0.05P0.10。按=0.05水准,不拒绝H0,即尚不能认为该职业人群颈椎病的发病有性 别差异。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 实用文档 > 往来文书

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报