1、第六章 2检验,医学统计学余松林主编,本章内容,第三节 独立性检验 第四节 趋势检验 第五节 多个四格表的联合分析 第六节 四格表的费歇尔精确概率检验,第三节 独立性检验,本节介绍应用2检验推断两个或两个以上总体率(或构成比)之间有无差别及两分类变量间有无相关关系。,一、四格表资料的2检验 (两个样本率的比较),什么是四格表资料? 凡是两个率或构成比资料都可以看做四格表资料。,例6-1:,某医生欲了解洛赛克治疗消化道溃疡的疗效,以雷尼替丁作对照,试验结果见表6-1。问两种药物治疗4周的疗效有无差别(两组性别、年龄、病程、病情等方面均衡)?,表6-1 两种药物治疗消化道溃疡效果,1.2检验的基本
2、公式,上述基本公式由Pearson提出,因此软件上常称这种检验为Pearson卡方检验,下面将要介绍的其他卡方检验公式都是在此基础上发展起来的。它不仅适用于四格表资料,也适用于其它的“行列表”。,解一:,一、建立假设,确定检验水准: H0:两种药物疗效相等(1=2) H1:两种药物疗效不等(12) 检验水准=0.05。,二、计算检验统计量:,三、确定P值,得出结论:,查2界值表得, 2=4.1320.05(1)=3.84 ,P 0.05,统计:按照=0.05的检验水准,拒绝H0,接受H1,差异有统计学意义。,专业:结合本例,两组药物治疗溃疡愈合率有差别。,2.四格表专用公式,为了不计算理论频数
3、T, 可由基本公式推导出,直接由各格子的实际频数(a、b、c、d)计算卡方值的公式:,解二:,2检验的适用条件,例6-2:,某医生欲研究不同分娩方式与重症肝炎孕产妇的结局的关系,资料见表6-2。问两种分娩方式的结局有无差别?,表6-2 重症肝炎孕产妇不同分娩方式的结局,解:,一、建立假设,确定检验水准: H0:重症肝炎孕产妇剖宫产的死亡率与阴道分娩相等(1=2) H1:重症肝炎孕产妇剖宫产的死亡率与阴道分娩不等(12) 检验水准=0.05。,二、计算检验统计量:,三、确定P值,得出结论:,查2界值表得, 2=3.0320.05(1)=3.84 ,P0.05,统计:按照=0.05的检验水准,不拒
4、绝H0,差异无统计学意义。,专业:结合本例,还不能认为重症肝炎孕产妇不同分娩方式的结局有差别。,若未经校正2 =4.47,P0.05,这显然不合理。,二、行列表资料的2检验,四格表是指只有2行2列,当行数或列数超过2时,统称为行列表。行列表的x2检验是对多个样本率(或构成比)的检验。,基本公式:,专用公式:,自由度:=(R-1)x(C-1),适用条件:表中不宜有1/5以上格子的理论频数小于5,或有一个格子的理论频数小于1。,1.多个样本率的比较,例6-3:三种不同治疗方法治疗慢性支气管炎的疗效如表6-3,试比较三种方法治疗慢性支气管炎的疗效。,表6-3 三种不同方案治疗慢性支气管炎的疗效,解:
5、,一、建立假设,确定检验水准: H0:三种治疗方法的有效率相等 H1:三种治疗方法的有效率不等或不全相等 检验水准=0.05。,二、计算检验统计量:,三、确定P值,得出结论:,查2界值表得P0.05,统计:按照=0.05的检验水准,拒绝H0,接受H1,差异有统计学意义。,专业:结合本例,可以认为三种方法治疗慢性支气管炎的效果不同或不全相同。,2.两组或多组样本构成比的比较,例6-4:欲了解儿童白血病患者的血型分布是否与成年患者有所不同,资料见表6-4。试分析儿童白血病患者与成年患者的血型分布构成比有无差别?,表6-4 儿童急性白血病患者与成人急性白血病患者的血型分布,解:,一、建立假设,确定检
6、验水准: H0:儿童白血病患者与成人患者的血型分布构成比相同 H1:儿童白血病患者与成人患者的血型分布构成比不相同 检验水准=0.05。,二、计算检验统计量:,三、确定P值,得出结论:,查2界值表得P0.05,统计:按照=0.05的检验水准,不拒绝H0,差异无统计学意义。,专业:结合本例,尚不能认为儿童急性白血病患者与成人患者的血型分布构成比不同。,3.RC列联表资料的2检验,取自于某总体的一样本,按照两个或多个定性变量不同水平分组时,所产生的数据,排成双向交叉的统计表,称为列联表。,例6-5:观察依沙酰胺治疗皮肤真菌感染效果的临床试验,见表6-5。试分析该病的疗效是否与病程有关?,表6-5
7、依沙酰胺治疗皮肤真菌感染疗效,解:,一、建立假设,确定检验水准: H0:依沙酰胺治疗皮肤真菌感染疗效与病程无关 H1:依沙酰胺治疗皮肤真菌感染疗效与病程有关 检验水准=0.05。,二、计算检验统计量:,三、确定P值,得出结论:,查2界值表得P0.05,统计:按照=0.05的检验水准,拒绝H0,接受H1,差异有统计学意义。,专业:结合本例,可以认为依沙酰胺治疗皮肤真菌感染疗效与病程有关。,列联系数:进一步说明相关的密切程度,P值在01之间,0表示完全无关,1表示完全相关 P值愈近于0,说明几乎没有关系, P值愈近于1,说明关系愈密切。,本例:Pearson列联系数=0.232,4.行列表2分割法
8、,行列表2检验有统计学意义,只能认为各总体率或构成比之间总的来说有差别,但不能说明它们彼此之间都有差别,或某两者之间有差别。若要进一步说明问题,可用行列表2分割法。,例6-6:对例6-3三种治疗方案有效率的分析结果进一步两两比较,从表6-3可知单独西药与单独中药方案的有效率差异最小,将它们分割出来,作四格表2检验。,表6-6 西药与中药比较,2=1.49,=1,P 0.05将这两组合并,资料重组为表6-7,表6-7 单用西药或中药与中西医结合比较,2=25.53,=1,P0.05,综合结果说明:单独西医或单独中医治疗的效果差异无统计学意义,而中西医结合治疗的效果与单独西医或单独中医治疗效果差异
9、有统计学意义,可以认为中西医结合的效果优于单独中医或单独西医治疗。,5.行列表2检验时应注意的问题,1. 对RC表,若较多格子(1/5)的理论频数小于5 或有一个格子的理论频数小于1,则易犯第一类错误。,5.行列表2检验时应注意的问题,2.当效应按强弱分为若干个级别,则按试验结果可整理为单向有序行列表,在比较各处理组的效应有无差别时,宜用秩和检验、Ridit分析等;如作2检验只说明各组构成比的差异有无统计学意义。 3.当多个样本率或构成比比较的2检验,统计推论为拒绝检验假设,只认为总体率或总体构成比之间总的来说有差别,但不能说明每两两之间有差别,若要对每两个率或构成比进行比较,须进行行列表的2
10、分割。,三、配对四格表资料的2检验,例6-7:,某研究室用两种不同国产试剂检测132份HBsAg阳性血清,结果见表6-8。问两种试剂的检出率有无差别?,表6-8 两种血清学检验结果比较,分析:,解:,一、建立假设,确定检验水准: H0:两法总体阳性检出率相同,即B=C H1:两法总体阳性检出率不同,即BC 检验水准=0.05。,二、计算检验统计量:,三、确定P值,得出结论:,查2界值表得P0.05,统计:按照=0.05的检验水准,拒绝H0,接受H1,差异有统计学意义。,专业:结合本例,故可认为甲乙两种试剂的HbsAg检出率不同。,本例b+c=10+31=4140,则,第四节 趋势检验,当某因素
11、是按自然顺序的等级分层或者在连续性资料等级化后再分层的情况下,可采用趋势检验以分析率是否随分层等级而变化的趋势。,N:总人数 n:各组人数 T:阳性数总数 t:各组阳性数 Z:各组的分数:(1)按数量分组的资料:评分的原则与分组间隔相适应。(2)按性质分组的资料:评分的原则是1,2,3,。,例6-8:,调查了不同工龄的纺织女工神经衰弱的患病情况,按工龄长短分别统计患病率如表6-9。问纺织女工的神经衰弱患病率有无随工龄增加而增加的趋势?,表6-9 不同工龄的纺织女工的神经衰弱的患病率,解:,一、建立假设,确定检验水准: H0:纺织女工神经衰弱的患病率无随年龄增加而增加的趋势 H1:纺织女工神经衰
12、弱的患病率有随年龄增加而增加的趋势 检验水准=0.05。,二、计算检验统计量:,三、确定P值,得出结论:,查2界值表得P0.05,统计:按照=0.05的检验水准,拒绝H0,接受H1,差异有统计学意义。,专业:结合本例,故可认为纺织女工神经衰弱的患病率有随年龄增加而增加的趋势。,第五节 多个四格表的联合分析,病例-对照研究中为排除混杂因素干扰,常常需对多个四格表进行联合分析。其中第i层的简表形式如下:,例6-9:,在吸烟与肺癌关系的研究中,年龄是一个混杂因素,试根据表6-10资料计算调整年龄后吸烟与肺癌关系的优势比,并作假设检验。,表6-10 两个年龄组吸烟与肺癌的病例对照研究,解:,一、建立假
13、设,确定检验水准: H0:调整年龄后吸烟与肺癌关系优势比OR=1 H1:调整年龄后吸烟与肺癌关系优势比OR1 检验水准=0.05。,二、计算检验统计量:,三、确定P值,得出结论:,查2界值表得P0.05,结论:按照=0.05的检验水准,拒绝H0,接受H1,故可认为调整年龄后,吸烟1包/天及以上者与1包/天以下者相比,患肺癌的优势比为2.91,且有统计学意义。,第六节 四格表的费歇尔精确概率检验,适用条件:n40或T1。,计算方法:在四格表的边缘合计不变的条件下,直接计算表内四个格子数据的满足某条件的各种组合的概率。,例6-10:,为了比较新药与旧药的疗效,试验结果见表6-11,试问两组疗效有无
14、差别?,表6-12 新药与旧药的疗效比较,解:,一、建立假设,确定检验水准: H0:两种药物疗效相等(1=2) H1:两种药物疗效不等(12) 检验水准=0.05。,二、计算概率:,三、确定P值,得出结论:,结论:按照=0.05的检验水准,不拒绝H0,尚不能认为两种药物治疗效果有差别。,表16-3 直接计算概率用表,P2tail=P(a=0)+ P(a=1)+ P(a=2)+ P(a=5)=0.006+0.065+0.245+0.382+0.248+0.054=0.37,单侧检验,在表6-13中排在表6-12四格表(包含表6-12)之前所有四格表组合概率之和称为左侧概率,记为PL。 在表6-13中排在表6-12四格表(包含表6-12)之后所有四格表组合概率之和称为右侧概率,记为PL。,设PA、PB分别表示旧药与新药的改善率。,(1)当PAPB时,H1:AB,则P单=PR。,(1)当PAPB时,H1:AB,则P单=PL。,本例:P单=PL=P(a=0)+P(a=1)+P(a=2)=0.006+0.065+0.245=0.32,