收藏 分享(赏)

第五章 χ2检验.ppt

上传人:ysd1539 文档编号:7033981 上传时间:2019-05-03 格式:PPT 页数:81 大小:806.50KB
下载 相关 举报
第五章 χ2检验.ppt_第1页
第1页 / 共81页
第五章 χ2检验.ppt_第2页
第2页 / 共81页
第五章 χ2检验.ppt_第3页
第3页 / 共81页
第五章 χ2检验.ppt_第4页
第4页 / 共81页
第五章 χ2检验.ppt_第5页
第5页 / 共81页
点击查看更多>>
资源描述

1、1,连续型资料,资 料,离散型资料,小样本,大样本,2,第五章,2检验,3,二、2检验与连续型资料假设检验的区别,一、2检验的定义,三、2检验的用途,4,2 检验(Chi-square test),对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验,即根据样本的频数分布来推断总体的分布。,一、2检验的定义,5,2检验与测量数据假设检验的区别(1),测量数据的假设检验,其数据属于连续变量,而2检验的数据属于点计而来的间断变量。,6,测量数据所来自的总体要求呈正态分布,而2检验的数据所来自的总体分布是未知的。,2检验与测量数据假设检验的区别(2),7,测量数据的假设检

2、验是对总体参数或几个总体参数之差所进行的假设检验,而2 检验在多数情况下不是对总体参数的检验,而是对总体分布的假设检验。,2检验与测量数据假设检验的区别(3),8,二、2检验与连续型资料假设检验的区别,9,三、2检验的用途,适合性检验,独立性检验,同质性检验,10,适合性检验(吻合度检验),是指对样本的理论数先通过一定的理论分布推算出来,然后用实际观测值与理论数相比较,从而得出实际观测值与理论数之间是否吻合。因此又叫吻合度检验。,11,是指研究两个或两个以上的计数资料或属性资料之间是相互独立的或者是相互联系的假设检验,通过假设所观测的各属性之间没有关联,然后证明这种无关联的假设是否成立。,独立

3、性检验,12,在连续型资料的假设检验中,对一个样本方差的同质性检验,也需进行2 检验。,同质性检验,13,第一节: 2检验的原理与方法,2检验的基本原理,2检验统计量的基本形式,2值的特点,2检验的基本步骤,2检验的注意事项,14,2检验就是统计样本的实际观测值与理论推算值之间的偏离程度。实际观测值与理论推算值之间的偏离程度就决定其2值的大小。理论值与实际值之间偏差越大, 2值就越大,越不符合;偏差越小,2值就越小,越趋于符合;若两值完全相等时, 2值就为0,表明理论值完全符合。,原理,15,理论值,观测值,16,2检验统计量的基本形式,2 ,(OiEi)2,Ei,O实际观察的频数(obser

4、vational frequency),E无效假设下的期望频数(expectation frequency),17,876只羔羊性别调察,抽样误差?,实质性变化?,18,要回答这个问题,首先需要确定一个统计量,将其用来表示实际观测值与理论值偏离的程度;然后判断这一偏离程度是否属于抽样误差,即进行显著性检验。,判断实际观测值与理论值偏离的程度,最简单的办法是求出实际观测值与理论值的差数。,19,羔羊性别观察值与理论值,由于差数之和正负相消,并不能反映实际观测值与理论值相差的大小。,0,20,为了避免正、负相抵消的问题,可将实际观测值与理论值的差数平方后再相加,也就是计算:,(OE)2,O实际观察

5、的频数,E无效假设下的期望频数,21,羔羊性别观测值与理论值,22,值越大,观测值与理论值相差也就越大,反之越小。,23,200元,0元,奖学金,一等,三等,10元,10元,实际得到190元,实际得到60元,谁的贡献大?,5,14,24,这两组观测值与理论值的偏离程度是不相同的,两组差数虽然相同,但其差数占理论值的比重不同。,25,为了弥补这一不足,可先将实际观测值与理论值的差数平方,即(OE)2,再用差数的平方除以相应的理论值,将之化为相对数,从而来反映(OE)2 的比重,最后将各组求和,这个总和就是2 。,26,羔羊性别观测值与理论值,2 ,(OiEi)2,Ei,2值就等于各组观测值和理论

6、值差的平方与理论值之比,再求其和。,27,2值的特点,可加性,非负值,随O和E而变化,28,2值与概率P成反比, 2值越小,P值越大,说明实际值与理论值之差越小,样本分布与假设的理论分布越相一致;,2越大,P值越小,说明两者之差越大,样本分布与假设理论分布越不一致。,29,观测值与理论值的差异由抽样误差引起,即观测值理论值。同时给出相应的备择假设HA :观测值与理论值的差值不等于0,即观测值理论值。,一般确定为0.05或0.01,1.提出无效假设H0,基本步骤,2.确定显著水平,30,3.计算样本的2值,4.进行统计推断,2 2,P ,2 2,P ,31,1、任何一组的理论次数Ei 都必须大于

7、5,如果Ei 5,则需要合并理论组或增大样本容量以满足Ei 5,2、在自由度1时,需进行连续性矫正,其矫正的2c为:,c 2 ,( OiEi 0.5 )2,Ei,2检验的注意事项,32,2分布是连续型变量的分布,每个不同的自由度都有一个相应的2分布曲线,所以其分布是一组曲线。,33,由于检验的对象次数资料是间断性的,而2分布是连续型的,检验计算所得的2值只是近似地服从2分布,所以应用连续型的2分布的概率检验间断性资料所得的2值就有一定的偏差。,由次数资料算得的2均有偏大的趋势,即概率偏低。当df=1,尤其是小样本时,必须作连续性矫正。,34,比较观测数与理论数是否符合的假设检验。,适合性检验,

8、定义,第二节:适合性检验,35,用 途,遗传学中用以检验实际结果是否符合遗传规律,样本的分布与理论分布是否相等,适合性检验的df由于受理论值的总和等于观测值总和这一条件的约束,故df=n-1,36,鲤鱼遗传试验F2观测结果,(1) H0:鲤鱼体色F2分离符合3:1比率;HA:鲤鱼体色F2分离不符合3:1比率;,37,(2)取显著水平0.05,(3)计算统计数2 :,df= k-1 = 2-1 =1,在无效假设H0正确的前提下,青灰色的理论数为:,Ei 16023/4=1201.5,红色理论数为: Ei 16021/4=400.5,需要连续性校正,38,=75.41+226.22301.63,(

9、4)查2值表,当df=1时,20.05 3.84。现实得2c 301.6320.05 ,故应否定H0 ,接受HA ,即认为鲤鱼体色F2分离不符合3:1比率。,39,在遗传学中,有许多显、隐性比率可以划分为两组的资料,如欲测其与某种理论比率的适合性,则2值可用下表中的简式进行计算:,40,检验两组资料与某种理论比率符合度的2值公式,1:1,2:1,3:1,15:1,9:7,r:1,r:m,41,大豆花色遗传试验F2观测结果,例,(1) H0 :大豆花色F2分离符合3:1比率;HA :大豆花色F2分离不符合3:1比率;,(2)取显著水平 0.05,(3)计算统计数2值:,42,2 20.05,(4

10、)查值表,进行推断,接受H0 ,即大豆花色F2分离符合3:1比率,df =1,P0.05,43,对于资料组数多于两组的值,还可以通过下面简式进行计算:,Oi 第 i 组的实际观测数,pi 第 i 组的理论比率,n总次数,44,F2代,共556粒,豌豆,?,此结果是否符合自由组合规律,根据自由组合规律,理论分离比为:,45,豌豆杂交实验F2分离结果,方法一,(1) H0 :豌豆F2分离符合9:3:3:1的自由组合规律;HA :豌豆F2分离不符合9:3:3:1的自由组合规律;,(2)取显著水平 0.05,46,(3)计算统计数2值:,2 0.016+0.101+0.135+0.2180.470,(

11、4)查值表,进行推断:,df =4-13,2 20.05,P0.05,接受H0 ,即豌豆F2分离符合9:3:3:1的自由组合规律。,47,方法二,2 0.016+0.101+0.135+0.2180.470,48,第三节:独立性检验,独立性检验的定义,22 列联表的独立性检验,2列联表的独立性检验,r列联表的独立性检验,49,独立性检验(independence test),又叫列联表(contigency table)2检验,它是研究两个或两个以上因子彼此之间是独立还是相互影响的一类统计方法。,50,(一)22列联表的独立性检验,设A,B是一个随机试验中的两个事件,其中A可能出现r1 、r2

12、个结果,B可能出现c1、c2个结果,两因子相互作用形成4格数,分别以O11 、O12 、O21 、O22表示,下表是22列联表的一般形式,51,22列联表的一般形式,52,检验步骤,1.提出无效假设H0 :事件A和事件B无关, 同时给出HA :事件A和事件B有关联关系;,2.给出显著水平,3.依据H0 ,可以推算出理论数,计算2值,4.确定自由度,df=(r-1)(c-1),进行推断。,H0 HA,H0 HA,2 2,P ,P ,2 2,53,给药方式与给药效果的22列联表,1.H0 :给药方式与给药效果相互独立。,HA :给药方式与给药效果有关联。,2.给出显著水平0.05,54,3.根据H

13、0,运用概率乘法法则:事件A与事件B同时出现的概率为:P(AB)=P(A)P(B),口服与有效同时出现的理论频率口服频率有效频率,即P(AB)=P(A)P(B)98/193 122/193,理论频数Ei理论频率总数, (98/193 122/193) 193,(98 122)/193=61.95,即EijRiCj/T=行总数列总数/总数,55,E11= R1 C1/T=61.95 E12= R1 C2/T=36.05,E21= R2 C1/T=60.05 E22= R2 C2/T=34.95,给药方式与给药效果的22列联表,56,计算2值:由于df=(r-1)(c-1)=(2-1)(2-1)=

14、1,故所计算的2值需进行连续性矫正:,57,4.查2表,当df=1时, 20.05 3.841,而2c =1.057 20.05 , P0.05,应接受H0 ,拒绝HA ,说明给药方式与给药效果相互独立.,58,2 2列联表的2检验可利用以下简式而不必计算理论次数:,T/2为矫正数,59,60,(二)2c列联表的独立性检验,2c列联表的一般形式,由于df=(2-1)(c-1) 2,故计算值时不需作连续性矫正,61,检测甲、乙、丙三种农药对烟蚜的毒杀效果,结果如下,使分析这三种农药对烟蚜的毒杀效果是否一致?,三种农药毒杀烟蚜的死亡情况,例子,62,1. H0 :对烟蚜毒杀效果与农药无关,农药类型

15、间互相独立; HA :二者有关,2.取显著水平0.05,3.统计数的计算,63,64,理论值的计算:,2值的计算:,65,(4)查2值表,进行推断查2表,当df=(2-1)(3-1)=2时, 20.05 5.99,现实得27.69420.05 ,则拒绝H0 ,接受HA ,说明三种农药对烟蚜的毒杀效果不一致。,66,简便计算公式,67,68,(三)rc列联表的独立性检验,rc列联表是指r3、c 3的计数资料,上表是rc列联表的一般形式。df=(r-1)(c-1)1,故不需进行连续性矫正。,69,rc列联表的计算公式:,i = 1, 2, r j = 1, 2, , c,70,例,某医院用碘剂治疗

16、地方性甲状腺肿,不同年龄的治疗效果列于下表,试检验不同年龄的治疗效果有无差异?,不同年龄用碘剂治疗甲状腺肿效果比较,71,1. H0 :治疗效果与年龄无关; HA :治疗效果与年龄有关,即不同年龄治疗效果不同;,2.给出显著水平0.01,72,3.计算统计数2 :,73,4.查2表,当df=(3-1)(4-1)6时,20.0116.81,所以246.98820.01, P0.01,应拒绝H0 ,接受HA,说明治疗效果与年龄有关。,74,在治疗效果与年龄有关的基础上,可以将下面的34列联表做成3个24列联表,测验2个年龄段疗效的差异:,1130岁与3150岁两个年龄段疗效的比较,1130岁与50

17、岁以上两个年龄段疗效的比较,3150岁与50岁以上两个年龄段疗效的比较,75,(1) 1130岁与3150岁两个年龄段疗效的比较,76,(2) 1130岁与50岁以上两个年龄段疗效的比较,77,(3) 3150岁与50岁以上两个年龄段疗效的比较,78,1130岁与3150岁两个年龄段疗效的比较2 21.202(极显著),1130岁与50岁以上两个年龄段疗效的比较 2 38.37(极显著),3150岁与50岁以上两个年龄段疗效的比较 2 9.574(显著),df=(2-1) (4-1)=3 20.05=7.81 20.01=11.34,79,适合性检验,2检验,独立性检验,多组资料,显隐性 两组资料,22列联表,2c列联表,rc列联表,80,多组资料,显隐性 两组资料,r : m,81,22列联表,2c列联表,rc列联表,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 医学治疗 > 检验医学

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报