1、卡方检验(二),流行病学与卫生统计学系 刘 芬 一教楼230,839117787 2012.3,复习,卡方检验的适用资料类型:用于两个样本率的比较(四格表资料和配对资料)用于多个样本率之间比较两组或多组资料内部构成比之间差别的检验,四格表资料分析公式的适用条件,当n=40,且各格子的理论数T5 时,用Pearson 2 .(2) 当n=40,但其中有一个格子的理论数1T5时,应计算校正的卡方值.(3) 当n40,或有T1时需改用四格表的确切概率法.,四格表资料卡方检验,基本公式专用公式,四格表资料检验的校正公式,6,例1:将27名某病患者随机分两组,分别用新旧两种药物治疗,结果为,Fishe
2、r确切概率法,超几何分布公式:,7,Fisher确切概率法的基本思想,在四格表边缘合计不变的条件下,共有“周边合计数中最小数+1”中组合,计算各种组合的概率。 将所有小于等于原样本四格表概率的所有四格表概率值相加,得到双侧检验P值。 原样本四格表以左(包括原样本)的所有四格表概率之和为左侧概率,原样本四格表以右(包括原样本)的所有四格表概率之和为右侧概率,左侧概率和右侧概率中较小者为单侧检验P值。根据检验水准,做出是否拒绝H0的结论。,8,组合:共有6种,9,H0 :两组药物疗效相同 H1 :两组药物疗效不相同 =0.05 计算各组合四格表概率双侧检验概率单侧概率取较小的左侧概率确定P值,判断
3、结果,第二节 两相关样本率检验(McNemar检验),配对四格表资料的 检验,与计量资料推断两总体均数是否有差别有成组设计和配对设计一样,计数资料推断两个总体率(构成比)是否有差别也有成组设计和配对设计,即四格表资料和配对四格表资料。,例9-4 用两种不同的方法对53例肺癌患者进行诊断,收集得到的结果如表9-4所示,问两种方法的检测结果有无差别?,表9-4 两种方法诊断肺癌的检测结果,上述配对设计实验中,就每个对子而言,两种处理的结果不外乎有四种可能:,两种方法均+(甲乙)数(a); 两种方法均-(甲乙)数(d); 其中一种+(甲乙 )数(b); 其中一种+(甲乙)数 (c)。,其中,a, d
4、 为两法观察结果一致的两种情况, b, c为两法观察结果不一致的两种情况。 差异性检验也称McNemar检验(McNemars test),检验统计量为,如果b+c40,则用校正的x2,解:1、建立检验假设H0: b=c,即两种方法的总体检出率相同;H1: bc,即两种方法的总体检出率不同;2、确定检验水准=0.05 。3、计算统计量2 值因为b+c=2+11=1340,所以,要使用连续性校正公式,4、确定P 值自由度=1, =3.84P0.055、判断结果,作出统计推断按=0.05的水准拒绝H0 ,差异有统计学意义。可以认为两种方法的阳性检出率不同。根据表9-4,甲法阳性检出率为25/53=
5、50.9%,乙法阳性检出率为36/53=67.9%,可认为乙法阳性检出率高于甲法。,注意:,本法一般用于样本含量不太大的资料。因为它仅考虑了两法结果不一致的两种情况(b, c),而未考虑样本含量n和两法结果一致的两种情况(a, d)。所以,当n很大且a与d的数值很大(即两法的一致率较高),b与c的数值相对较小时,即便是检验结果有统计学意义,其实际意义往往也不大。,第三节 行列(RC)表资料的2检验,RC表的2检验通用公式,例 9-8,三个不同民族血型样本的频数分布 地区 A B O AB 合计 汉族 60 70 45 100 275 回族 43 32 19 31 125 满族 19 23 22
6、 20 84 合计 122 125 86 151 484,解:1、建立检验假设H0:民族与血型无关;H1:民族与血型有关;2、确定检验水准=0.05 。3、计算统计量2 值,4、确定P 值自由度=6, P0.055、判断结果,作出统计推断按=0.05的水准拒绝H0 ,差异有统计学意义。可以认为民族与血型有关联。,RC表2检验的应用注意事项,1. 对RC表,若较多格子(1/5以上)的理论频数小于5 或有一个格子的理论频数小于1,则易犯第一类错误。出现某些格子中理论频数过小时怎么办?(1)增大样本含量(最好!)(2)删去该格所在的行或列(丢失信息!)(3)根据专业知识将该格所在行或列与别的行或列合
7、并。(丢失信息!甚至出假象)(4)改用Fisher确切概率法。,例13:某年某地各年龄组钩虫感染情况,221/5=4.4,相邻的行合并之后做2检验,注意事项(续)2值分割,在行列的2检验中,若P 0.05,拒绝无效假设H0,只能作出总的结论,即总的来说各组差异有统计学意义 若要进行两两比较,还需要把行列表进行分割,才能对每两两之间差异有无统计学意义作出结论 采用Bonferroni法进行两两比较 采用=/比较次数,计算调整的水准,某医师用三种疗法治疗周围面神经麻痹的疗效,资料见下表,进一步作两两比较时,不能再用原来的检验水准=0.05,作为是否拒绝H0的标准。因为重复多次的假设检验,将使第一类
8、错误扩大,必须重新规定检验水准,作为拒绝H0的根据 其检验水准按下式估计k为分组数,(一)多个实验组间的两两比较,(二)各实验组与同一个对照组的比较,注意事项(续),3.多组比较时,若效应有强弱的等级,如+,+,+,最好采用后面的非参数检验方法。2检验只能反映其构成比有无差异,不能比较效应的平均水平。4.行列两种属性皆有序时,可考虑趋势检验或等级相关分析。,小 结,(1)成组(四格表)资料的2检验 n40,T5时,n40,1T5时n40或T1时,不能用2检验,四格表资料的Fisher确切概率法,当n40,T1 Fisher确切概率法 其理论依据是超几何分布,并非2检验的范畴 实际应用中常用它作为四格表资料假设检验的补充,(2)配对资料的2检验 配对设计资料陈述形式,差异性检验,38,(3)行列表资料的2检验 行列表,.,总样本量不能太小,至少50例; 理论数不能小于1; 理论数在15间的不能多于1/5的总格子数。,