1、金英良 流行病学与卫生统计学教研室,第八章 检验,Chi-square Test,本章主要内容:,第一节 四格表 检验 第二节 配对四格表 检验 第三节 行列表 检验,分布,是一种连续型分布,可用于检验资料的实际频数和按检验假设计算的理论频数是否相符等问题。早在1875年,F. Helmet即得出来自正态总体的样本方差的分布服从卡方分布。1900年,K. Pearson也独立地从检验分布的拟合优度发现这一相同的卡方分布。,Karl Pearson (1857-1936),个相互独立的标准正态变量ui(i=1,2, )的平方和称为 变量,即,它的分布即为卡方分布,其自由度为。,卡方分布,2检验读
2、作卡方检验,是一种用途广泛的统计方法,主要用于: 检验两个(或多个)总体率或构成比之间是否有统计学意义,从而推断两个(或多个)总体率或构成比是否相同。,2检验的用途,检验实际频数(A)和理论频数(T)的差别是否由抽样误差所引起的, 也就是由样本率(或样本构成比)来推断总体率(或总体构成比)。,2检验的基本思想,基本计算公式,式中,A为实际频数(actual frequency),T为理论频数(theoretical frequency),back,例8.1 为了解某中药治疗原发性高血压的疗效,将70名高血压患者随机分为两组,试验组用该药加辅助治疗,对照组用安慰剂加辅助治疗,观察结果见表8-1。
3、,问:该药治疗原发性高血压是否有效?,1、建立检验假设并确定检验水准 H0:1=2 ,即试验组与对照组的总体有效率相等 H1 :12 ,即试验组与对照组的总体有效率不等 =0.05 2、计算检验统计量,用基本公式计算卡方值:,四格表卡方检验的专用公式:,3、查界值表,确定P值,做出推断结论 自由度=1,20.05(1)=3.84, 2 20.05(1), 所以 ,P0.05,在=0.05的检验水准下,拒绝H0, 差异有统计学意义,也就是试验组与对照组的总体有效率不等.,推倒过程,卡方分布是连续型的分布,卡方界值是由其分布计算而来的。而卡方检验用于分类资料比较时,原始数据是不连续的,用卡方界值表
4、确定P值时可能存在误差。四格表资料中,当n40,有理论频数1T5时,因为理论值太小,会导致2值变大,易出现假阳性结论。,四格表2值的连续性校正,连续性校正公式,四格表资料2公式的正确选择,1)当n40,所有T 5时,用专用公式或普通公式; 2)当n40,但有理论频数1T5时,用校正公式; 3) n40或有T1,或P时,用确切概率法。,连续性校正仅用于 的四格表资料,当 时,一般不作校正。,例8.2 某医学院抽样调查大学四年级和五年级学生近视眼患病情况,四年级学生的近视率为7.14%,五年级学生的近视率为35.71%,调查结果见下表,试问该大学四年级与五年级学生的近视眼患病率是否一样?,表8-2
5、 两个年级大学生的近视眼患病率比较,1、建立检验假设并确定检验水准 H0: 1=2 ,即四年级与五年级学生的近视眼患病率相同 H1 :12 ,即四年级与五年级学生的近视眼患病率不同 =0.05 2、计算检验统计量,3、查界值表,确定P值,做出推断结论 自由度=1, 20.05(1)=3.84, 20.05,在=0.05的检验水准下,不拒绝H0,说明四年级与五年级学生近视眼患病率差别没有统计学意义,可认为尚未发现四年级与五年级学生近视眼患病率有显著性差异。,若不采用校正公式:,在=0.05水准下,2 2 0.05(1),则P0.05。,back,注意:a、b、c、d代表对子数!,表8-16 配对
6、四格表基本结构的,甲属性的阳性率:(a+b)/n 乙属性的阳性率:(a+c)/n 若H0成立,则有(a+b)/n- (a+c)/n=0,即(b-c)/n=0 可见,两个变量阳性率的比较只和b、c有关,而与a、d无关。 若H0成立,两种属性不一致的两个格子理论频数都应该是(b+c)/2,配对检验公式推导:,式中,a, d 为两法观察结果一致的两种情况, b, c为两法观察结果不一致的两种情况。,配对卡方检验公式使用条件:,例8.4 现有198份痰标本,每份标本分别用A、B两种培养基培养结核菌,结果如下表,A培养基的阳性培养率为36.36%,B培养基的阳性培养率为34.34%,试问A、B两种培养基
7、的阳性培养率是否相等?,表8-5 两种培养基的培养结果,A 培养基,B培养基,结果统计,1、建立检验假设并确定检验水平 H0:1=2 ,即两种培养基的阳性培养率相等 H1 : 12 ,即两种培养基的阳性培养率不相等 =0.05 2、计算检验统计量,3、查界值表,确定P值,做出推断结论 查2界值表,=1, 20.05(1)=3.84, 2 0.05,在=0.05的检验水准下,不拒绝H0,尚不能认为两种培养基的培养率不同。,back,一、行列表2检验 行或列超过两组时称为行列表,或称RC表。,例8.5 某医院用3种方案治疗急性无黄疸型病毒肝炎254例,观察结果如下表,试比较3种疗法的有效率是否一样
8、。,表8-3 3种方案治疗肝炎的疗效,1.建立检验假设并确定检验水准 H0:三种治疗方案的有效率相同 H1 :三种治疗方案的有效率不全相同 =0.05 2.计算检验统计量,3.查2界值表,确定P值,做出推断结论 =2, 20.05(2)=5.99, 2 20.05(2),则P0.05,在=0.05的水准下,拒绝H0,可以认为三种治疗方案的有效率有差别。,例8.6 某研究人员收集了亚洲、欧洲和北美洲人的A、B、AB、O血型资料,结果见下表,其目的是研究不同地区的人群血型分类构成比是否一样。,表8-1 三个不同地区血型样本的频数分布,图8-1 三个不同地区血型样本构成情况,代如基本公式:,代如通用
9、公式:,1、建立检验假设确定检验水准 H0:不同地区的人群血型分布总体构成比相同 H1 :不同地区的人群血型分布总体构成比不全相同 =0.05 2、计算检验统计量,3、查界值表,确定P值,做出推断结论 查2界值表,=6,20.05(6)=12.59, 2 20.05(1) ,则P0.05,在=0.05的水准下,拒绝H0,认为三个不同地区的人群血型分布总体构成比有差别。,二、多个样本率间多重比较 行列表2检验的结果说明差异有统计学意义,需作两两比较时,先调整值,再进行率的两两比较。,检验水准=0.05,做多次比较时,按概率理论,两两比较均正确的概率为(1-0.05)(1-0.05)(1-0.05
10、)(1-0.05),将使类错误扩大,因此,必须重新规定检验水准。,1.多个实验组间的两两比较= /N,N为要进行两两比较的次数,k为参加检验的组数。,1、建立检验假设并确定检验水准 H0:西药与中药治疗肝炎的有效率相同; H1 :西药与中药治疗肝炎的有效率的有效率不同; =0.05/3=0.017,表8-4 西药与中药治疗肝炎疗效的比较,3、查2界值表,确定P值,做出推断结论 =1, 20.017(1)=5.70, 2 0.017,在=0.017的水准下,不拒绝H0,故可以认为西药与中药治疗肝炎的有效率差异没有统计学意义。,2、计算检验统计量,=1, 20.017(1)=5.70, 2 20.
11、017(1),则P0.017,在=0.017的水准下,拒绝H0,可以认为西药与中西医结合治疗肝炎的效果不同。,表8-5 西药与中西药结合治疗肝炎疗效的比较,=1, 20.017(1)=5.70, 2 20.017(1),则P0.017,在=0.017的水准下,拒绝H0,可以认为中药组与中西医结合组治疗肝炎的效果不同。,表8-6 中药与中西药结合治疗肝炎疗效的比较,2.多个实验组与同一对照组的比较,本书推荐公式:,为原来的检验水准,k为参加检验的组数。,在多个率的卡方检验中,经常遇到多个实验组均与同一对照组进行比较的情况。显然这种比较比任意两组都进行统计学检验的次数要少。,例8.4 现有三种药物
12、,欲研究其治疗心绞痛的疗效。另设一组安慰剂作为对照,实验结果见下表,试问各组间的心绞痛缓解率是否相同?,表8-7 三种药物治疗心绞痛与安慰剂疗效的比较,1、建立检验假设并确定检验水准 H0:四种疗法的心绞痛缓解率相同; H1 :四种疗法的心绞痛缓解率不同或不全相同; =0.05 2、计算检验统计量,3、查2界值表,确定P值,做出推断结论 =2, 20.05(3)=7.81, 2 20.05(3),则P0.05,在=0.05的水准下,拒绝H0,可以认为各组疗法的心绞痛缓解率差别有统计学意义,即四种疗法的心绞痛缓解率不同或不全相同。,1、建立检验假设并确定检验水准 H0:安慰剂与A药治疗心绞痛的缓
13、解率相同; H1 :安慰剂与A药治疗心绞痛的缓解率不同; =0.05 2、计算检验统计量,表8-8 安慰剂与A药治疗心绞痛的疗效比较,3、查2界值表,确定P值,做出推断结论 =1, 20.017(1)=5.70, 2 20.05(2),则P0.017,在=0.017的水准下,拒绝H0,接受H1,故可以认为安慰剂与A药的缓解率差异有统计学意义,A药的缓解率高于安慰剂组。 同理,可以进行B药与安慰剂组比较,C药与安慰剂组比较,=1, 20.017(1)=5.70, 2 20.05(2),则P0.017,在=0.017的水准下,拒绝H0,接受H1,故可以认为安慰剂与B药的缓解率差异有统计学意义。,=
14、1, 20.017(1)=5.70, 2 20.05(2),则P0.017,在=0.017的水准下,拒绝H0,接受H1,故可以认为安慰剂与C药的缓解率差异有统计学意义。,三、行列表2检验时的注意事项,1、行列表中各理论频数不应小于1,并且1T5的格子数不宜超过总格子数的1/5,若发生上述情况,可采用下述方法: (1)增大样本含量以增加理论频数。 (2)根据专业知识,考虑删去理论频数太小的行或列,将理论频数过小的格子所在的行或列与性质相近的邻行或列中的实际频数合并。 (3)改用双向无序RC 表资料的Fisher确切概率法。2、行列表2检验有统计学意义,并不等于任意两组之间都有统计学意义,要继续做多个样本率的多重比较。,3、有序的RC 表资料不宜用2检验。,表8-10两种药治疗慢性气管炎的疗效,