收藏 分享(赏)

第4章_显著性检验.ppt

上传人:rav7596 文档编号:7015185 上传时间:2019-04-30 格式:PPT 页数:148 大小:1.25MB
下载 相关 举报
第4章_显著性检验.ppt_第1页
第1页 / 共148页
第4章_显著性检验.ppt_第2页
第2页 / 共148页
第4章_显著性检验.ppt_第3页
第3页 / 共148页
第4章_显著性检验.ppt_第4页
第4页 / 共148页
第4章_显著性检验.ppt_第5页
第5页 / 共148页
点击查看更多>>
资源描述

1、第四章 假设检验,第一节 假设检验的基本原理 第二节 单个样本平均数的假设检验 第三节 两个样本平均数的假设检验 第四节 百分率资料的假设检验 第五节 参数的区间估计,假设检验(test of hypothesis)又叫显著性检验 (test of significance),是统计学中的一个重要内容 。假设检验的方法很多 ,常用的有u检验、t检验、F检验和2检验等。尽管这些检验方法的使用条件及用途不同,但检验的基本原理是相同的。,第一节 假设检验的基本原理,假设检验的意义 假设检验的步骤 显著水平与两种类型的错误 两尾检验与一尾检验 假设检验应注意的问题,假设检验的意义,例如,目前我国大豆育

2、种工作者认为,大豆籽粒蛋白质含量高于45%(记为0)的品种为高蛋白品种。某种子公司对一大豆新品种随机抽取5个样品进行测定,得平均蛋白质含量为 , 。我们能否根据1.5%就认定该大豆新品种就是高蛋白品种?结论是,不一定。,因为通过 5 个样品测定的蛋白质含量计算的样本平均数 仅是该大豆品种蛋白质含量总体平均数 的一个估计值。由于存在抽样误差,任何一个样品测定值xi ,都可以表示为,( 1,2,n)(4-1),其中, 为总体平均数, 为抽样误差。,于是, (4-3),样本平均数 为,(4-1)式表明,样本平均数 包含了总体平均数 与抽样误差 二部分。,另一部分是抽样误差 。,(4-3)式表明, 是

3、由两部分组成:,一部分是两总体平均数的真实差异 ;,并不能代表新品种蛋白质含量总体平均数 与标准含量 之间的真实差异,我们称 为表面差异。虽然真实差异 未知,但表面差异 是可以计算的,借助数理统计方法可以对试验误差作出估计。所以,可将表面差异 与试验误差相比较间接推断真实差异 是否存在,这就是假设检验的基本思想。,假设检验的目的在于判明,表面差异 主要是由真实差异 造成的,还是由抽样误差 造成的,从而得到可靠的结论。,又如,某地进行了两个水稻品种对比试验,在相同条件下,两个水稻品种分别种植10个小区,获得两个水稻品种的平均产量为:,我们能否根据 就判定这两个水稻品种平均产量不同?结论仍是,不一

4、定。,因为两个水稻品种平均产量 、 都是从试验种植的10个小区获得,仅是两个品种有关总体平均数 的估计值。由于存在试验误差,样本平均数并不等于总体平均数, 样本平均数包含总体平均数与试验误差二部分,即,于是, (4-5),其中, 为试验的表面差异, 为试验的真实差异, 为试验误差。,(4-5)式表明,试验的表面差异 是由两部分组成:一部分是试验的真实差异 ;另一部分是试验误差 。,虽然真实差异 未知,但试验的表面差异 是可以计算的,借助数理统计方法可以对试验误差作出估计。所以,可将试验的表面差异 与试验误差相比较间接推断真实差异 是否存在,即进行假设检验。,假设检验的目的在于判明,试验的表面

5、差异 主要是由试验的真实差异 造成的,还是由试验误差 造成的,从而得到可靠的结论。,二、假设检验的步骤,【例41】 已知某品种玉米单穗重xN(300,9.52)。在种植过程中喷洒了某种药剂的植株中随机抽取9个果穗,测得平均单穗重 ,试问这种药剂对该品种玉米的平均单穗重有无真实影响?,首先对样本所在的总体作一个假设。假设喷洒了药剂的玉米单穗重总体平均数 与原来的玉米单穗重总体平均数 之间没有真实差异,即 或 。也就是假设表面差异( )是由抽样误差造成的。,(一)提出假设,这种假设通常称为无效假设或零假设(null hypothesis),记为H0:=0。无效假设是待检验的假设,它有可能被接受,也

6、有可能被否定。相应地还要有一个对应假设,称为备择假设 (alternative hypothesis)。备择假设是在无效假设被否定时,准备接受的假设,记为HA:-00 或 0。 通过检验,若否定无效假设,我们就接受备择假设。,(二)计算概率,假定无效假设成立的前提下,根据所检验的统计数的抽样分布,计算表面差异( )是由抽样误差造成的概率。,本例是在假定无效假设H0: =0 成立的前提下,研究在 xN(300, 9.52)这一已知正态总体中抽样所获得的样本平均数 的分布。,(4-6),抽样分布,标准化,本例,则,下面估计|u|2.526的两尾概率,即估计P(|u |2.426)是多少?我们知道,

7、两尾概率为0.05的临界值为u0.05=1.96,两尾概率为0.01的临界值为u0.01=2.58,即:,P(| u |1.96)= P(u1.96)+ P(u-1.96) =0.05,P(| u |2.58)= P(u 2.58)+ P(u-2.58)=0.01,根据样本数据计算所得的 u 值为2.526,介于两个临界 u 值之间,即:u0.052.526u0.01,所以,| u |2.526的概率 p 介于0.01和0.05之间,即:0.01 p 0.05,说明假定表面差异( )是由抽样误差造成的概率在0.010.05之间。,(三)统计推断,根据小概率事件实际不可能性原理作出否定或接受无效

8、假设的推断。若随机事件的概率很小,例如小于0.05,0.01,0.001,称之为小概率事件。在统计学上,把小概率事件在一次试验中看成是实际上不可能发生的事件,称为小概率事件实际不可能原理。,根据这一原理,当表面差异是抽样误差的概率小于0.05时,可以认为在一次抽样中表面差异是抽样误差实际上是不可能的,因而否定原先所作的无效假设H0:=0,接受备择假设HA: 0 ,即认为存在真实差异。当表面差异是抽样误差的概率大于0.05时,说明无效假设H0: =0 成立的可能性大,不能被否定,因而也就不能接受备择假设HA: 0 。,假设检验的结果表明:本例的样本平均数与原总体平均数之间的表面差异( ) 除包含

9、抽样误差外,还包含真实差异( - 0) , 即喷洒了药剂的玉米单穗重总体平均数 与原来的玉米单穗重总体平均数 0 不同。,综上所述,假设检验,从提出无效假设与备择假设,到根据小概率事件实际不可能性原理来否定或接受无效假设,这一过程实际上是应用所谓“概率性质的反证法”对样本所属总体所作的无效假设的统计推断。,上述显著性检验利用了 u 分布来估计出u2.526的两尾概率,所以称为 u 检验。,三、显著水平与两种类型的错误,(一)显著水平用来否定或接受无效假设的概率标准叫显著水平(significance level),记作。在生物学研究中常取=0.05,称为5%的显著水平;或=0.01,称为1%的

10、显著水平或极显著水平。,对于上述例子的u检验来说,若u1.96 ,则说明试验的表面差异属于试验误差的概率p0.05,即表面差异属于试验误差的可能性大,不能否定H0:=0 。统计学上把这一检验结果表述为:“总体平均数 与 0 差异不显著(non-significant)”,在计算所得的 u 值的右上方标记“ns”或不标记符号;,若1.96| u |2.58,则说明试验的表面差异属于试验误差的概率 p 在0.010.05之间,即0.01p0.05,表面差异属于试验误差的可能性较小,应否定H0:=0 ,接受HA: 0 。统计学上把这一检验结果表述为:“总体平均数 与 0 差异显著(significa

11、nt)”,在计算所得的u 值的右上方标记“*”;,若|u|2.58,则说明试验的表面差异属于试验误差的概率p不超过0.01,即p0.01,表面差异属于试验误差的可能性更小,应否定 H0: =0 ,接受HA: 0。统计学上把这一检验结果表述为:“总体平均数 与 0 差异极显著(very significant)”,在计算所得的值的u右上方标记“* *”。,若|u| u,则在水平上否定H0: =0 ;若|u| u,则不能在水平上否定H0: =0 。,这里可以看到,是否否定无效假设H0: =0,是用实际计算出的检验统计数 u 的绝对值与显著水平 对应的临界值 u 比较:,区间(-, -u 和(u,

12、+ 称为水平上的否定域,而区间(- u, u )则称为 水平上的接受域。,(二)两类错误 因为在假设检验中,否定或接受无效假设的依据是“小概率事件实际不可能性原理”,所以我们下的结论不可能有百分之百的把握。,例如,经 u 检验获得“差异显著”的结论,我们有95%的把握否定无效假设H0,同时要冒5%下错结论的风险;经 u 检验获得“差异极显著”的结论,我们有99%的把握否定无效假设H0,同时要冒1%下错结论的风险;而经 u 检验获得“差异不显著”的结论,在统计学上是指“没有理由”否定无效假设H0,同样也要冒下错结论的风险。,假设检验可能出现两种类型的错误:,型错误(typeerror)与型错误(

13、typeerror),型错误又称为 错误,就是把非真实的差异错判为是真实的差异,即实际上H0正确,检验结果为否定H0。犯类型错误的可能性一般不会超过所选用的显著水平;,型错误又称为 错误,就是把真实的差异错判为是非真实的差异,即实际上HA正确,检验结果却未能否定H0。犯类型错误的可能性记为 ,一般是随着 |-0| 的减小或试验误差的增大而增大,所以 |-0| 越小或试验误差越大,就越容易将试验的真实差异错判为试验误差。,因此,如果经 u 检验获得“差异显著”或“差异极显著”,我们有95%或99%的把握认为,与0不相同,判断错误的可能性不超过5%或1%;若经 u 检验获得“差异不显著”,我们只能

14、认为在本次试验条件下, 与0没有差异的假设 H0:1=2 未被否定,这有两种可能存在:或者是与0确实没有差异,或者是与0有差异而因为试验误差大被掩盖了。,因而,不能仅凭统计推断就简单地作出绝对肯定或绝对否定的结论。“有很大的可靠性,但有一定的错误率” 这是统计推断的基本特点。,假设检验的两类错误归纳如下:,表4-1 假设检验的两类错误,为了降低犯两类错误的概率,一般从选取适当的显著水平 和增加试验重复次数 n 来考虑。因为选取数值小的显著水平 值可以降低犯类型错误的概率,但与此同时也增大了犯型错误的概率,所以显著水平 值的选用要同时考虑到犯两类错误的概率的大小。,对于田间试验,由于试验条件不容

15、易控制完全一致,试验误差较大,为了降低犯型错误的概率,也有选取显著水平为0.10或0.20的(注意,在选用这些显著水平值时,一定要予以注明)。通常采用适当增加试验处理的重复次数(即样本容量),以降低试验误差,提高试验的精确度,降低犯型错误的概率。,四、两尾检验与一尾检验,【例41】中,对应于无效假设H0:=0的备择假设为HA: 0 。HA实际上包含了0 这两种情况。此时,在水平上否定域为(-, -u和u, +),对称地分配在u分布曲线的两侧尾部,每侧尾部的概率为/2,如图4-1所示。这种利用两尾概率进行的检验叫两尾检验(two-tailed test),u为 水平两尾检验的临界值。,两尾检验的

16、目的在于判断 与 0 有无差异,而不考虑 与 0 谁大谁小。在有些情况下两尾检验不一定符合实际情况。,例如,前已述及,目前我国大豆育种工作者认为,大豆籽粒蛋白质含量超过45%(0)的品种为高蛋白品种。如果进行样品含量检测,我们关心的是 所在的总体平均数 大于 0 (即该品种属于高蛋白品种)。此时的无效假设仍为H0: =0,但备择假设则为HA: 0 。这时否定域位于 u 分布曲线的右尾,即u, +)。例如当=0.05时,否定域为1.64, +)。,又如,国家规定稻米中某种农药成分的残留物含量应低于0.1%(0)。在抽检中,我们关心的是 所在的总体平均数 小于0(即该品种属于合格产品)。此时的无效

17、假设仍为H0: =0,但备择假设则为HA: 0。这时否定域位于 u 分布曲线的左尾,即(-, -u 。例如当=0.05时, u分布的否定域为(-, -1.64,见图4-2。,这种利用一尾概率进行的检验叫一尾检验(one-tailed test)。此时u为一尾检验的临界 u 值。显然,一尾检验的u=两尾检验的u2 。,例如,一尾检验的u0.05=两尾检验的u0.10=1.64,一尾检验的u0.01=两尾检验的u0.02=2.33。,实际应用中,如何选用两尾检验或一尾检验,应根据专业的要求在试验设计时就确定。一般情况下,若事先不知道 与 0 谁大谁小,只是为了检验 与 0 是否存在差异,则选用两尾

18、检验;如果凭借一定的专业知识和经验推测 应小于(或大于) 0 时,则选用一尾检验。,五、假设检验应注意的问题,1、 要有合理的试验设计和准确的试验操作,避免系统误差、降低试验误差,提高试验的准确性和精确性。,2、 选用的假设检验方法要符合其应用条件。由于研究变量的类型、问题的性质、条件、试验设计方法、样本大小等的不同,所选用的假设检验方法也不同,因而在选用检验方法时,应认真考虑其应用条件和适用范围。,3、 选用合理的统计假设。进行假设检验时,无效假设和备择假设的选用,决定了采用两尾检验或是一尾检验。,4、 正确理解假设检验结论的统计意义。假设检验结论中的“差异显著”或“差异极显著”不应该误解为

19、相差很大或非常大,也不能认为在实际应用上一定就有重要或很重要的价值。“显著”或“极显著”是指表面差异为试验误差可能性小于0.05或0.01,已达到了可以认为存在真实差异的显著水平。有些试验结果虽然表面差异大,但由于试验误差大,也许还不能得出“差异显著”的结论,而有些试验的结果虽然表面差异小,但由于试验误差小,反而可能推断为“差异显著”。,显著水平的高低只表示下结论的可靠程度的高低,即在0.01水平下否定无效假设的可靠程度为99,而在0.05水平下否定无效假设的可靠程度为95%。,“差异不显著”是指表面差异为试验误差可能性大于统计上公认的概率水平0.05,不能理解为没有差异。下“差异不显著”的结

20、论时,客观上存在两种可能:一是无本质差异,二是有本质差异,但被试验误差所掩盖,表现不出差异的显著性来。如果减小试验误差或增大样本容量,则可能表现出差异显著性。假设检验只是用来确定无效假设能否被否定,而不能证明无效假设是正确的。,5、统计分析结论的应用,还要与经济效益等结合起来综合考虑。,第二节 单个样本平均数的假设检验,在实际研究工作中常常要检验一个样本平均数 与已知的总体平均数 0 是否有显著差异,即检验该样本是否来自某一总体。已知的总体平均数 0 一般为一些公认的理论数值、经验数值或期望数值。,这类问题的无效假设为H0: =0 ,备择假设为HA: 0(或 0 , 0);检验方法有 u 检验

21、和 t 检验两种,(一)总体方差2 已知或2 虽未知但为大样本(n30),用 u 检验法。,【例42】 糯玉米良种苏玉糯1号的鲜果穗xN(216.5, 45.22),即0=216.5g ,0=45.2g。现引进一高产品种奥玉特1号,在8个小区种植,得其鲜果穗重为:255.0 185.0 252.0 290.0 159.9 190.0 212.7 278.5(g),试问新引入品种的鲜果穗重与苏玉糯1号有无显著差异?,1、提出假设,2、计算 u 值。因为,所以,3、统计推断 由于计算所得的|u|u0.05 =1.96,故p 0.05。不能否定H0: = 0 =216.5g,表明新引入品种鲜果穗重与

22、苏玉糯1号鲜果穗重差异不显著,可以认为新引入品种鲜果穗重与苏玉糯1号鲜果穗重相同。,如果总体2未知、且为小样本(n 30),则用 t 检验法。,t检验法,就是在假设检验时利用t分布进行概率计算的检验方法。,【例43】 晚稻良种汕优63的千粒重0 27.5g。现育成一高产品种协优辐819,在9个小区种植,得其千粒重为:32.5、28.6、28.4、24.7、29.1、27.2、29.8、33.3、29.7(g),试问新育成品种的千粒重与汕优63有无显著差异?,1. 提出假设,2.计算t值 t值计算公式为,, (4-7),此例,先计算样本平均数 、样本标准差S、样本均数标准误 如下:,=2.587

23、(g),=,=,=0.862(g),所以,=,= 2.036,3统计推断,由df=n-1=9-1=8查临界 t 值,得:t0.05(8) =2.306,计算所得的 | t | t0.05(8),故p0.05 ,不能否定H0:27.5g,表明新育成品种千粒重与当地良种汕优63的千粒重差异不显著,可以认为新育成品种千粒重与当地良种汕优63的千粒重相同。,第三节 两个样本平均数的假设检验,两个样本平均数的假设检验,因试验设计不同,分为非配对设计和配对设计两种。检验方法有 u 检验法和 t 检验法两种。,一、非配对设计两个样本平均数 的假设检验,非配对设计是将试验单位完全随机地分为两组,然后再随机地对

24、两组分别实施两个不同处理;两组试验单位相互独立,所得观测值相互独立;两个处理的样本容量可以相等,也可以不相等,所得数据称为非配对数据。这种设计适用于试验单位比较一致的情况。,(一)两个样本的总体方差 和 为已知或总体方差 和 为未知时但为大样本时,用 u 检验法。,u值的计算公式为,(4-8),其中 , 为总体均数差数标准误,计算公式如下:,=,【例44】 根据以往资料,已知优质早稻品种佳辐占小区(小区面积为13.34m2)产量的2 1.35 (kg2)。今在种植该品种的一块地上用A、B两种方法取样,A法取15个样点,得小区平均产量 7.69kg;B法取9个样点,得小区平均产量 8.77kg。

25、试检验A、B两种取样法的小区产量差异是否显著?,H0 :1=2; 即A、B两种取样法的小区产量相同;HA :12 ; 即A、B两种取样法的小区产量不相同。,1. 提出假设,2、计算 u 值,已知,先计算出,=,=,=0.4899(kg),所以,=,= 2.204,3、统计推断,因为计算所得的 |u| 介于u0.05=1.96与 u0.01=2.58之间,故0.01 p 0.05,否定H0: 1=2 ,接受HA :12 ,即A、B两种取样方法所得的小区产量差异显著。,在两个样本的总体方差 和 为未知、但 ,且为小样本时,用 t 检验法。,【例45】 测得马铃薯两个品种鲁引1号和大西洋的块茎干物质

26、含量结果如表4-3所示。试检验两个品种马铃薯的块茎干物质含量有无显著差异。,4-3 两个马铃薯品种干物质含量(%),提出假设,2、计算t值 t值计算公式为,(4-9),H0 :1=2; HA :12 。,其中,n1、n2 , 、 分别为两样本含量、平均数; 为样本均数差数标准误,计算公式为,(4-10),当n1=n2=n时,,=,=,其中, 、 分别为两样本均方。,此例,,于是,3、统计推断,根据df=n1+n2-2=6+5-2=9 ,查附表3得:t0.05(9) =2.262,因为计算得的| t |1.922 t0.05(9) ,故p0.05,不能否定H0: 1=2 ,表明两个马铃薯品种的块

27、茎干物质含量差异不显著,可以认为两个马铃薯品种的块茎干物质含量相同。,注意,两个样本平均数差异显著性检验的无效假设H0与备择假设HA,一般如前所述,但也有例外。例如通过收益与成本的综合经济分析知道,施用高质量的肥料比施用普通肥料提高的成本需用产量提高 d 个单位获得的收益来相抵,那么在检验施用高质量的肥料比施用普通肥料收益上是否有差异时,无效假设应为H0: 1-2=d,备择假设为HA: 1-2 d(两尾检验);,在检验施用高质量肥料的收益是否高于施用普通肥料时,无效假设应为 H0: 1-2=d;备择假设为 HA: 1-2d (一尾检验)。,此时,t 检验计算公式为:,二、配对设计两个样本平均数

28、的假设检验,配对设计是指先根据配对的要求将试验单位两两配对,然后将配成对子的两个试验单位随机实施某一处理。配对的要求是,配成对子的两个试验单位的初始条件尽量一致,不同对子间试验单位的初始条件允许有差异,每一个对子就是试验处理的一个重复。,例如,在相邻两个小区、两个盆钵实施两种不同处理,在同一植株(或器官)的对称部位上实施两种不同处理,在同一供试单位上进行处理前和处理后的对比等,都是配对试验设计,所得观测值称为成对数据。,【例47】 选取生长期、发育进度、植株大小和其他方面皆比较一致的相邻的两块地(每块地面积为666.7)的红心地瓜苗构成一组,共得6组。每组中一块地按标准化栽培,另一块地进行绿色

29、有机栽培,用来研究不同栽培措施对产量的影响,得每块地瓜产量如表4-4所示,试检验两种栽培方式差异是否显著。,表4-4 两种栽培方法的地瓜产量 (kg/666.7),采用两尾t检验法。,1、提出假设 H0:d=1-2=0;,HA:d=1-20。,其中,1为第一个样本所在的总体平均数,,2为第二个样本所在的总体平均数,,d为两个样本各对数据之差数dj=x1j-x2j (j=1,2, ,n)所在的总体平均数, d=1-2。,2、计算t值 计算公式为,,(4-16),(4-17),其中, , 为差数标准误,n为配对的对子数 。,本例,,391.525,于是,,=1.725,3、统计推断,查附表3,当d

30、f=6-1=5时,t0.05(5)=2.571,计算所得的| t |1.725t0.05(5),故p0.05,不能否定H0: d=1-2=0 ,表明两种栽培方法的地瓜产量差异不显著,可以认为两种栽培方法的地瓜产量相同。,第四节 百分率资料的假设检验,由具有两个属性类别的质量性状利用统计次数法得来的次数资料进而计算出的百分率资料,如结实率、发芽率、病株率、杂株率以及一对性状的杂交后代中某一性状的植株占总株数的百分率等是服从二项分布的。这类百分率资料的假设检验应按二项分布进行。,当样本含量n足够大,p不过小,np和nq均大于5时,二项分布接近于正态分布,此时可近似地采用u检验法(称为正态近似法)对

31、服从二项分布百分率资料进行假设检验。适用于正态近似法所需的二项分布百分率资料的样本含量n见表4-5。,表4-5 适用于正态近似法所需要的二项分布百分率资料的样本容量n,一、单个样本百分率的假设检验,检验一个服从二项分布的样本百分率 与已知的二项总体百分率p0差异是否显著,其目的在于检验一个样本百分率 所在二项总体百分率p是否与已知二项总体百分率p0相同,换句话说,检验该样本百分率 是否来自总体百分率为p0的二项总体。,这里所讨论的百分率是服从二项分布的,当满足n足够大,p不过小,np和nq均大于5的条件时,可近似地采用u检验法,即正态近似法来进行假设检验;若np和nq均大于30,不必对u进行连

32、续性矫正。,【例48】 用糯玉米和非糯玉米杂交,预期F1植株上糯性花粉粒的百分率为p0=0.50。现检视150粒花粉,得糯性花粉68粒,糯性花粉粒百分率 =0.453,问此结果和理论百分率p0=0.50是否相符?,本例的糯性花粉粒百分率服从二项分布,但样本容量n=150较大,np=75、nq=75均大于5(注意,此处假定p=p0=0.50,q=q0=(1-p0)=0.50来计算np和nq),所以采用正态近似法来进行假设检验;且要回答的问题是糯性花粉粒样本百分率 =0.453与理论百分率 p0=0.50是否相符,故采用两尾u检验;由于np=75、nq=75均大于30,不必对u进行连续性矫正。,检

33、验步骤如下:,统计假设,H0:p=p0=0.50;HA:pp0=0.50,2、计算u值 u值的计算公式为:,(4-18),其中, 为样本百分率, =0.5为已知总体百分率, 为样本百分率标准误:,(4-19),其中,n为样本容量。,本例,,于是,,3、统计推断,计算所得的|u|u0.05=1.96,故p0.05,不能否定H0:p=p0=0.50,表明糯性花粉样本百分率 0.453和p0=0.50差异不显著,可以认为糯性花粉粒样本百分率 =0.453所在的总体百分率 p 与理论百分率 p0 =0.50相同。,二、两个样本百分率的假设检验,检验服从二项分布的两个样本百分率 、 差异是否显著,其目的

34、在于检验两个样本百分率 、 所在的两个总体百分率p1、p2是否相同。,当两样本的np、nq均大于5时,可以采用正态近似法,即u检验法进行检验;若两样本的np和nq均大于30,不必对u进行连续性矫正。,【例49】 调查春大豆品种A的 120个豆荚(n1=120),其中有瘪荚38荚(f1=38),瘪荚率31.7%( );调查春大豆品种B的135个豆荚(n2=135),其中有瘪荚52荚(f2=52),瘪荚率38.5%( )。试检验这两个品种的瘪荚率差异是否显著?,本例为服从二项分布的百分率资料,样本容量较大,n1 =120,n2 =135,且,均大于5(注意,假定 p1=p2成立, 为合并样本百分率

35、,由(4-22)式计算),可以采用正态近似法,即u检验法进行假设检验,要回答的问题是两个品种的瘪荚率差异是否显著,故采用两尾u检验;由于 , 均大于30,不必对u进行连续性矫正。,,,检验步骤如下:,1、统计假设,H0:p1=p2; HA:p1p2。,2、计算u值 u值的计算公式为:,(4-20),其中, , 为两个样本百分率, 为样本百分率差异标准误,,(4-21),为合并样本百分率,,(4-22),本例,,10.3530.647,于是,,3、统计推断,由于计算所得的 |u|0.05,不能否定H0:p1=p2,表明两个品种的瘪荚率差异不显著,可以认为两个品种的瘪荚率相同。,三、百分率资料假设

36、检验的连续性矫正,(一) 单个样本百分率假设检验的连续性矫正,检验一个服从二项分布的样本百分率与已知的二项总体百分率差异是否显著,当满足n足够大,p不过小,np和nq均大于5的条件时,可近似地采用u检验法,即正态近似法来进行假设检验;如果此时np和(或)nq小于或等于30,还须对u进行连续性矫正。,将连续性矫正后计算的值记为uc, uc的计算公式为:,(4-23),检验的其它步骤同【例48】。,(二) 两个样本百分率假设性检验的连续性矫正,检验服从二项分布的两个样本百分率差异是否显著,当两样本的np、nq均大于5时,可以采用正态近似法,即u检验法进行检验;如果此时两样本的np和(或)nq小于或

37、等于30,还须对u进行连续性矫正。,uc值的计算公式为:,(4-24),检验的其它步骤同【例49】。,【例410】调查大豆A品种20荚,其中三粒荚14荚,两粒以下荚 6荚,三粒荚百分率为0.70;B品种25荚,其中三粒荚7荚,两粒以下荚18荚,三粒荚百分率为0.467。问两个大豆品种的三粒荚百分率差异是否显著?,由于本例,n120, n2 25,,f114, f27,均大于5,可以采用正态近似法,即u检验法进行假设检验,要回答的问题是两个品种的三粒荚百分率差异是否显著,故采用两尾u检验;但由于小于30,须对u进行连续性矫正。,检验步骤如下:,1、统计假设,H0:p1=p2;HA:p1p2。,2

38、、计算 uc 值,因为,于是,,3、统计推断,由于计算所得的|u|介于1.96与2.58之间,故0.01p0.05,否定H0:p1=p2,两个大豆品种的三粒荚百分率差异显著,这里表现为A品种的三粒荚百分率显著高于B品种。,第五节 参数的区间估计,参数估计就是用样本统计数来估计总体参数,有点估计(point estimation)和区间估计(interval estimation)之分。将样本统计数直接作为总体相应参数的估计值叫点估计。点估计只给出了总体参数的估计值,没有考虑试验误差的影响,也没有指出估计的可靠程度。,区间估计是在一定概率保证下给出总体参数的可能范围,所给出的可能范围叫置信区间(

39、confidence interval),给出的概率保证称为置信度或置信概率(confidence probability)。,一、正态总体平均数 的置信区间,设有一来自正态总体的样本,包含 n 个观测值x1, x2, , xn,样本平均数 , 标准误 ,总体平均数为 。,因为 服从自由度为n-1 的 t 分布,两尾概率为 时,有:,也就是说,t 在区间 -t, t 内取值的可能性为1-,即:,对 变形得:,(4-25),亦即,( 4-25)式称为总体平均数 置信度为1-的置信区间,,称为置信半径;,置信下限 置信上限,置信上、下限之差称为置信距,置信距越小,估计的精确度越高。,总体平均数 的

40、95%和99%的置信区间如下:,(4-26),(4-27),【例411】 测得某高产、抗病小麦品种的8个千粒重,计算得千粒重平均数 ,标准误 。试求该品种小麦千粒重在置信度为95的置信区间。,查附表3,当df=(8-1)=7时,得t0.05(7)=2.365,故95的置信度区间为:,(45.22.3650.58)g(45.2+2.3650.58)g,43.828g46.572g,说明置信度为95时,该高产、抗病小麦品种的千粒重在43.82846.572g之间。,二、二项总体百分率p的置信区间,求总体百分率的置信区间有两种方法:正态近似法和查表法,这里仅介绍正态近似法。,当n1000,p1% 时

41、,总体百分率p的95%、99%置信区间为:,(4-28),(4-29),其中, 为样本百分率, 为样本百分率标准误, 的计算公式为:,(4-30),【例412】 调查某品种水稻1200株,受二化螟危害的有200株,即 =200/1200=0.1667。试估计置信度为95%的二化螟危害率的置信区间。,先计算样本百分率标准误 ,得:,根据(4-28)式,求得置信下限L1和置信上限L2如下:,L1=0.16671.960.0108=0.1455,L2=0.1667+1.960.0108=0.1879,即水稻二化螟危害率的95%置信区间为14.55%18.79%。,作业,思考:1、2、3、4、5 书面作业:6、7、8、9、10、11、12、13、14,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 医学治疗 > 检验医学

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报