1、第四章 分类变量资料的2检验 (Chi-square test),用于: 对多个独立样本率的比较,也适用于两个率的比较; 对多组构成比的比较; 对按照两个变量分组的资料,检验此两变量的关系; 对频数分布做拟合优度检验。,第一节 四格表(fourfold table)资料的2检验,一.普通2检验,例 6.2 表6.2 两种药物治疗消化道溃疡效果,处理 愈合 未愈合 合计 愈合率(%),洛赛克 雷尼替丁 合计,64 51 115,21 33 54,85 84 169,75.29 60.71 68.05,解 H0:1= 2; H1:1 2; =0.05,A:实际频数(actural frequenc
2、y) T:理论频数(theoretical frequency),(通用公式),2 分布的性质,2 分布为连续型分布, 2 自0至,永远大于0。 2 分布同t分布、F分布一样,也是随自由度的不同而形成簇状分布。 2 分布的形态随自由度而变化,自由度越小,偏态越甚;自由度越大,其分布越趋近于正态分布。 2 具有可加性。,T11= 85, T21= 84, T12 = 85, T22 = 84,,115,169,115,169,54,169,54,169,如何计算理论频数T?,合计愈合率:115/169,(57.84) (27.16) (57.16) (26.84),处理 愈合 未愈合 合计 愈合
3、率(%),洛赛克 雷尼替丁 合计,64 51 115,21 33 54,85 84 169,75.29 60.71 68.05,2 =,(64- T11)2,T11,+ + +,(21- T12)2,T12,(51- T21)2,T21,(33- T22)2,T22,=4.13, =(R-1)(C-1)=(2-1)(2-1)=12 1,0.05 =3.84, 2 2 1,0.05 , P0.05, 拒绝H0。简化公式:,a b c d,(四格表专用公式),普通2检验适用条件: n40且所有T 5。,二. 2检验的校正公式,2 = (n40但有1T5)简化公式:,(|A-T|-0.5)2,T,三
4、. Fisher确切概率法 (Fishers exact probabilities),适用于n 40或有T 1时。 基本思想:在四格表周边合计不变的条件下,获得某个四格表的概率为,例 两型慢性布氏病的PHA皮试反应,病人分型 阳性数 阴性数 合计 阳性率(%),活动型 稳定型 合计,1(2.4) 3(1.6) 4,14(12.6) 7(8.4) 21,15 10 25,6.67 30.00 16.00,解 H0:1= 2; H1:1 2; =0.05 表中活动型的阳性率 P1 =0.067,稳定型的阳性率 P2=0.300,两者差别 | P1-P2| =0.233,该表出现的概率为将该表分解
5、成若干种不同的情况,使得周边数不变:,极端情况的概率: P=P(0)+P(1)+P(4)=0.0166+0.1423+0.1079=0.2668 按=0.05水准不拒绝H0,尚不能认为两型布氏病患者PHA反应阳性率有差别。,确切概率法计算表(四格表周边合计数不变),序号(i) 阳性 阴性 P1 | P1-P2| P(i)P2,01234,0 4 1 3 2 2 3 1 4 0,15 6 14 7 13 8 12 9 11 10,0.000 0.400 0.067 0.300 0.133 0.200 0.200 0.100 0.267 0.000,0.4000.2330.0670.1000.26
6、7,0.01660.14230.1079,设两样本的差值 | P1-P2| =D,双侧检验取 | P1-P2| D的各种组合的累计概率为双侧P值;单侧检验取 P1-P2 D或 P1-P2 - D的各种组合的累计概率为单侧P值。若两样本例数相等,则 P1-P2 D和 P1-P2 - D的P值相等,可先计算一侧P值,再乘以2得双侧检验的概率。,补充题: 用某种化学物质进行诱发肿瘤实验,实验组15只小白鼠中4只发生癌变,对照组10只无1只发生癌变,问两组发癌率有无差别?,极端情况的概率: P=P(0)+ P(4)= 0.1079+0.0166=0.1245 按=0.05水准不拒绝H0,尚不能认为两组
7、发癌率有差别。,确切概率法计算表(四格表周边合计数不变),序号(i) 阳性 阴性 P1 | P1-P2| P(i)P2,01234,4 0 3 1 2 2 1 3 0 4,11 10 12 9 13 8 14 7 15 6,0.267 0 0.2 0.1 0.133 0.2 0.067 0.3 0 0.4,0.2670.10.0670.2330.4,0.10790.0166,第二节 配对四格表资料的 2检验,例6.8 两种血清学检验结果比较,乙 法,甲 法,+ -,合 计,+- 合 计,80(a) 31(c) 111,10(b) 11(d) 21,90 42 132,解:H0:两法总体阳性检出
8、率无差别,即B=C;H1:两法总体阳性检出率不同,即BC; =0.05Tb=Tc=(b+c)/2,则,, =1,(b + c40),校正公式,, =1,(b + c40),本例, =1,查表得P 0.005,按=0.05水准,拒绝H0,接受H1,可以认为甲乙两法的血清学阳性检出率不同。,练习 用两种方法检验已确诊的癌症患者140名。甲法的检出率为65%,乙法的检出率为55%,甲乙两法一致的检出率为40%。试分析两法的优劣。,第三节 行列表的2检验,行列表包括2 2、R 2、2 C、R C表等。,适用条件:不能有T 1,并且 1T 5的格子数不超过总格子数的1/5。,一.多个率的比较,例 研究复
9、方哌唑嗪和复方降压片对高血压病治疗效果,并与安慰剂作对照,结果如下表所示,问三种药物的治疗效果有无差别?,处理 有效 无效 合计 有效率(%),复方哌唑嗪 复方降压片 安慰剂 合计,35 20 7 62,5 10 25 40,40 30 32 102,87.50 66.67 21.88 60.78,解:H0:三种处理方法的有效率相等; H1:三种处理方法的有效率不 全相等; =0.05。 2 =102352/(40 62) +202/(30 62)+ 72/(32 62)+ 52/(40 40)+ 102/(30 40)+ 252/(32 40)-1 = 32.74 =(3-1)(2-1)=
10、2 查表得P 0.005,按=0.05水准拒绝H0,接受H1,可以认为三种药物治疗高血压病效果不全相同。,二.率的多重比较,1.各实验组皆与对照组进行比较,例 复方哌唑嗪、复方降压片分别与安慰剂比较,(1)复方哌唑嗪与安慰剂的比较,组别 有效 无效 合计,复方哌唑嗪 安 慰 剂 合 计,35 7 42,5 25 30,40 32 72,H0:复方哌唑嗪与安慰剂的有效率相同; H1:复方哌唑嗪与安慰剂的有效率不同,查表得P 0.005,按=0.025水准拒绝H0,接受H1,可以认为复方哌唑嗪的有效率显著地高于安慰剂。,(2)复方降压片与安慰剂的比较,组别 有效 无效 合计,复方降压片 安 慰 剂
11、 合 计,20 7 27,10 25 35,30 32 62,H0:复方降压片与安慰剂的有效率相同; H1:复方降压片与安慰剂的有效率不同,查表得P 0.005,按=0.025水准拒绝H0,接受H1,可以认为复方降压片的有效率显著地高于安慰剂。,2.多组间的两两比较,例 对前例资料进行两两比较,复方哌唑嗪与安慰剂比较的2 =31.500,复方降压片与安慰剂比较的 2 =12.636,按=0.0167都应拒绝H0,结论同前。 在多组间的两两比较中,还需进行复方哌唑嗪与复方降压片的比较。,组别 有效 无效 合计,复方哌唑嗪 复方降压片 合 计,35 20 55,5 10 15,40 30 70,H
12、0:复方哌唑嗪与复方降压片的有效率相同; H1:复方哌唑嗪与复方降压片的有效率不同。,查表得P 0.025,按=0.0167水准不能拒绝H0,不能认为两药的疗效不同。,三.多个构成比的比较,例 欲了解女性血栓形成患者的血型分布是否与正常妇女有所不同,资料见表,试分析血栓形成患者与正常妇女血型分布构成比有无差别?正常妇女与血栓形成者的血型分布表,分组 A型 B型 AB型 O型 合计,血栓形成组 正常妇女组 合计,32 51 83,8 19 27,10 12 22,9 70 79,59 152 211,H0:血栓形成患者与正常妇女血型分布构成比相同;H1:血栓形成患者与正常妇女血型分布构成比不同;
13、 =0.05。 2 =211322/(59 83) +82/(59 27)+ 102/(59 22)+ 92/(59 79) + 512/(152 83)+ 192/(152 27)+ 122/(152 22)+ 702/(152 79) -1= 18.77 =(2-1)(4-1)=3 查表得P 0.005,按=0.05水准,拒绝H0,接受H1,可以认为血栓形成患者与正常妇女血型分布构成比不同。,四. 两种属性间的关联性(association)检验,P67例6.6.,P值在01之间,0表示完全无关,1表示完全相关。,若需进一步说明相关的密切程度,可计算列联系数:Pearson列联系数,五.条
14、件不满足时的处理方法,增大样本例数使理论频数变大; 删去理论频数太小的行或列; 将理论频数过小的格子所在的行或列与性质相近的邻行或邻列合并,使重新计算的理论频数增大; 精确概率法。,例 某地防疫站用碘剂局部治疗219例地方性甲状腺肿,结果列于下表,试分析年龄与疗效有无关联?,年龄/岁 治愈 显效 好转 无效 总和,11-20 21-30 31-40 41-50 50以上 总和,35(19.9) 32(25.4) 17(21.9) 15(17.4) 10(24.4) 109,1(8.4)8(10.7) 13(9.2) 10(7.6) 11(10.3) 43,1(9.6)9(12.3) 12(10
15、.6)8(8.8) 23(11.9) 53,3(2.5)2(3.3)2(2.8) 2(2.2)5(3.1) 14,40 51 44 35 49 219,地方性甲状腺肿患者的年龄与疗效的关系,练习 某医院研究急慢性白血病与血型之间有无关系,资料见下表,问白血病的种类与患者血型的型别之间有无关联性?白血病的种类与血型之间关系的资料,白血病 病例数,种类 血型: A B O AB 合计,急性 慢性 合计,58 43 101,49 27 76,59 33 92,18 8 26,184 111 295,第四节 不同类型RC表资料的统计分析方法,一.双向无序,表1 某地6094人按两种血型系统划分的结果,
16、ABO 血型,人 数,MN血型: M N MN 合计,O A B AB 合计,431 388 495 137 1451,490 410 587 179 1666,902 800 950 325 2977,1823 1598 2032 641 6094,研究目的:两种血型系统是否独立? 适用方法: 2检验,研究目的:缓慢心率失常种类与发生心肌梗塞部位之间 是否独立? 适用方法: Fisher精确检验,表2 心率失常种类与心肌梗塞部位的关系,缓慢心率失常种类,梗塞例数,部位: 下壁 前壁 真后壁 心内膜下 合计,窦性过缓 被动心率 房室阻滞 束支阻滞 合计,8 1 6 1 16,7 1 3 16
17、27,2 0 1 1 4,18 2 11 18 49,1 0 1 0 2,二.单向有序,表3 3种药物疗效的观察结果,疗 效,人 数,药物: A B C 合计,治愈 显效 好转 无效 合计,15 49 31 5 100,4 9 50 22 85,1 15 45 24 85,20 73 126 51 270,研究目的:比较不同药物的疗效。 适用方法;秩和检验或Ridit分析。,三.双向有序且属性不同,表4 眼晶状体混浊度与年龄之关系,晶状体 混浊程度,眼 数,年龄: 20 30 40 合计,+ + + 合计,215 67 44 326,131 101 63 295,148 128 132 408
18、,494 296 239 1029,若研究目的:分析不同年龄组晶状体浑浊程度之间有无差别; 适用方法:秩和检验或Ridit分析。 若研究目的:分析两有序分类变量间是否存在线性相关关系; 适用方法;等级相关分析、典型相关分析。 若研究目的:分析两有序分类变量间是否存在线性变化趋势; 适用方法:线性趋势检验。,四.双向有序且属性相同,例 两名放射科医师对200名棉屑沉着病可疑患者的诊断结果见表5: 表5 200名棉屑沉着病可疑患者的诊断结果,第一人检查,第二人检查,正常 I型 II型,合计,正常 I 型 II 型 合计,78 6 0 84,5 56 10 71,0 13 32 45,83 75 4
19、2 200,研究目的:两人检测结果的一致性; 适用方法;一致性检验(或称Kappa检验)。,第六节 2 检验的应用小结,类型 原假设 实际计算的 2 自由度,曲线拟合的 吻合度检验两个样本率或构成比的比较2 2表多个样本率或构成比的比较R C表,独 立 设 计,H0:F(x)=F0(x),H0:两个总体率或构成比相等,H0:多个总体率或构成比相等,精确概率法:,m-1-r,(2-1)(2-1),(r-1)(c-1),类型 原假设 实际计算的 2 自由度,配对设计,H0:两种处理的效应相同,H0:两因子无相关关系,1,(r-1)(c-1),两种处理的比较,相关分析,Pearson列联系数:,第七
20、节 SPSS演示,四格表2检验:例6.2 View Variable:,View Data:,Data Weight Cases Weight Cases by Frequency Variable:f OK AnalyzeDescriptive Statistics Crosstabs Rows:r Columns:c Statistics:Chi-square Continue OK,配对四格表2检验:例6.8 View Variable:,View Data:,Data Weight Cases Weight Cases by Frequency Variable:f OK AnalyzeDescriptive Statistics Crosstabs Rows:a Columns:b Statistics:McNemar Continue OK,行列表的2检验:例6.4 View Variable:,View Data:,Data Weight Cases Weight Cases by Frequency Variable:f OK AnalyzeDescriptive Statistics Crosstabs Rows:r Columns:c Statistics:Chi-square Continue OK,