1、1,定量资料统计推断 x2 检验,公共卫生系 刘慧刚,2,x2检验是利用x2统计量的分布规律作假设检验。x2值计算的基本公式:式中A为实际频数,T为理论频数。,x2检验的原理,3,大量的调查资料表明,豚鼠出生时的雌雄比例是1:1。而在一次培育试验中若干只母豚鼠生产的124只幼豚鼠中,雌雄幼鼠分别为70只和54只。本次试验得到的实际数与理论数不相同。造成实际数与理论数差异的原因:1、抽样误差引起;2、培育试验本身对雌雄比例有影响。,4,x2检验的实质就是检验实际频数与理论频数的吻合程度。二者吻合得越好,x2值就越小,则二者的差异由抽样误差引起的可能性就大;二者吻合不好,x2值就大,即有本质差异的
2、可能性就大。,5,x2检验时,要根据自由度查x2界值表。当自由度确定后,x2分布曲线下右侧尾部的面积为a时,横轴上相应的x2值记作x2(a,v) 。,6,x2值与P值的对应关系见x2分布界值表。由表可知,在自由度确定后,x2值愈大,P值愈小;反之,x2值愈小,P值愈大。若检验水准为a,当x2x2(a,v)时,Pa,拒绝H0,接受H1;当x2x2(a,v)时,Pa,不拒绝H0。,7,x2检验的应用 (一)四格表资料x2检验(两个样本率) (二)配对四格表x2检验 (三)RC(行列)表x2检验,8,两样本率比较x2检验,也称四格表资料x2检验。 例9-1,为了解某中药治疗原发性高血压的疗效,将70
3、名高血压患者随机分为两组。试验组用该药加辅助治疗,对照组用安慰剂加辅助治疗,观察结果见表8-1,问该药治疗原发性高血压是否有效?,第一节 四格表资料x2检验 (两样本率比较),9,一、 x2检验的通用公式:式中A为实际频数,T为理论频数。,10,表8-1 两种疗法治疗原发性高血压的疗效比较,11,1、基本公式法: 检验步骤如下: 1、建立假设,确定水准:H0: 1=2 H1: 12 =0.05 2、计算x2值: 四个格子的实际数分别为:A11(a)=20 A12(b)=24 A21(c)=21 A22(d)=5,12,表8-1 两种疗法治疗原发性高血压的疗效比较,13,理论频数:是根据无效假设
4、推算的频数。无效假设H0:两种方法治疗的有效率相同,即都等于合计率58.57%。,14,据此,对照组治疗的44人中理论上有: 人有效(T11).,15,同样,理论上实验组观察有效的人数(T21)为:,16,理论上对照组观察无效的人数(T12)为:,17,理论上试验组观察无效的人数(T22)为:,18,由此可以推出理论频数的计算公式为:,19,由于行列的合计数是固定的,也可由减法计算:,20,计算x2值:,21,确定概率:计算自由度:v=(行-1)(列-1)=(2-1)(2-1)=1查x2值表:x20.05(1)=3.84 x20.01(1)=5.63现:x2=8.405.63则: p0.01,
5、22,判定结果:按=0.05的水准,p0.01,拒绝H0,接受H1,可以认为可认为该中药治疗原发性高血压有效。,23,二、 四格表x2检验的专用公式a、b、c、d分别为四个格子的实际频数,N为总例数。,24,表8-1 两种疗法治疗原发性高血压的疗效比较,25,将标有a、b、c、d四个格子的实际数及N代入公式即可计算x2值。,26,三、四格表x2检验的校正公式x2分布是一种连续性分布,而资料属于分类变量,是一种离散型分布。因此理论频数太小时,四格表资料按基本公式(或专用公式)计算出来的x2值偏大,所得概率值偏小,易出现假阳性结论。因此,当理论频数较小时需要对x2值校正。,27,校正的条件:1、1
6、T5,且N40时,需要按校正公式计算x2值。2、T1,或N40时,不能作x2检验,而要用直接求概率的方法来判定结果。,28,x2检验的校正公式,29,例. 某医学院抽样调查大学四年级和五年级学生近视眼患病情况,四年级学生的近视率为7.14,五年级学生的近视率为35.71,调查结果见表8-2。问该大学四年级与五年级学生的近视眼患病率是否不同?,表8-2 两个年级大学生的近视眼患病率(%)比较,30,计算最小理论数:,31,检验步骤:1、建立假设,确定水准;H0:1=2 H1: 12 =0.052、计算x2值:本例有T40,故应用校正公式。,32,3、确定概率:查x2值表:x20.05(1)=3.
7、84 x20.10(1)=2.71现:2.713.84,P0.05,则拒绝H0,差别有统计学意义。,33,四、四格表资料的Fisher确切概率法当 n40,或 T1时,用四格表资料的Fisher确 切概率法。本法不属于x2检验范畴,但可作为四格表x2检验应用上的补充。,基本思想,四格表确切概率的基本思想是:在四格表的周边合计不变的条件下,用公式直接计算表内四个数据的各种组合之概率。,35,配对资料是指按配对设计的要求,获得的资料。有同源配对和异体配对之分。获得资料为数值型即配对计量资料,用t检验分析;获得资料为分类型即配对计数资料,可用x2检验。,第二节 配对四格表资料x2检验,36,例:为调
8、查乙型肝炎与肝癌发生的关系,可设计病例和对照的研究。选择有肝癌的病人若干人,再一 一配上非肝癌的人,分别询问过去是否患过肝炎。调查结果可有四种情况:1、病人有肝炎史,对照无肝炎史2、病人无肝炎史,对照有肝炎史3、病人对照均无肝炎史4、病人对照均有肝炎史,37,38,注意区别一般四格表:两种疗法治疗原发性高血压的疗效比较,39,表8-5 A、B两种培养基的培养结果对比,例9-4:现有198份痰标本,每份标本分别用A、B两种培养基培养结核菌,结果见表8-5。问A、B两种培养基的阳性培养结果是否不等?,40,每份标本分别用A、B两种培养基培养结核菌, , , ,198 份 痰标本,B培养基,痰标本,
9、观察结果:“+”或者“-”,配对,. .,.,. .,. .,. .,. .,+,A培养基,-,41,A培养基,198 份 痰标本,B培养基, , , ,198 对 培养基, , , ,注意: 一 一 配对,42,A培养基,B培养基,可能出现的结果:,a,b,c,d,43,48(a),24(b),A培养基,20(c),106(d),B培养基, ,44,检验基本公式(Mc-Nemar test) :(b+c40时)(b+c40时),45,48(a),24(b),A培养基,20(c),106(d),B培养基, ,46,24(b),A培养基,20(c),B培养基,47,检验步骤: 1、建立假设,确定
10、水准。H0:B=C;H1:BC;=0.05 2、计算x2值:已知:b=24;c=20;b+c=4440;,48,3、确定概率: v=1查x2值表:x20.05(1)=3.84 x20.50(1)=0.45现: 0.360.50 4、判定结果:按=0.05的水准, p0.50,不拒绝H0。尚不能认为两种培养基的培养结果不同。,49,A培养基,B培养基,24(b),20(c),48(a),24(b),A培养基,20(c),106(d),B培养基, ,50,b(多),A培养基,c(少),B培养基, ,51,检验基本公式(Mc-Nemar test) :(b+c40时)(b+c40时),52,b,A培
11、养基,c,B培养基, ,53,注意!,配对设计的四格表资料只能用配对检验,不能直接用两样本X2检验公式。,54,表8-5 A、B两种培养基的培养结果对比,55,两样本X2检验公式专用公式a、b、c、d分别为四个格子的实际频数,N为总例数。,56,X2=52.426.63,P0.01,57,但将配对设计的资料换转为两样本四格表后,可以用两样本X2公式检验。,58,表8-5 A、B两种培养基配对设计的培养结果对比,59,A培养基,198 份 痰标本,B培养基, , , ,198 对 培养基, , , ,注意: 一 一 配对,配对方法:,60,A培养基,198 份 痰标本,B培养基, , , ,A、
12、B培养基各198 个 ,共396个, , , ,不配对方法:,61,A培养基,B培养基,配对时可能出现的结果:,a,b,c,d,62,+,+,A培养基,B培养基,-,-,不配对时可能出现的结果:,a,b,c,d,+,-,63,48(a), ,24(b),A培养基,20(c),106(d),B培养基, ,配对时的结果, , ,64,不配对时的结果,+,+,+,-,-,+,-,-,72(a),+,+,126(b),A培养基,+,-,68(c),-,-,130(d),B培养基,-,+, ,48,24,20,106,65,X2=0.1770.50,66,思 考,配对计量资料t检验(P29-31)与配对
13、计数资料x2检验有何异同? 1、资料性质不同 2、无效假设不同(H0:B=C;H1:BC;) 3、判断结果的方式不同,67,多个样本率(或构成比)比较的x2检验RC表的x2检验。(R2或C2资料)检验公式:,第三节 行列表资料x2检验,68,例8.4 某医院用三种方案治疗急性无黄疽型病毒肝炎254例,治疗结果见表8-6,问三种疗法的有效率是否不同。,69,表9-6 三种方案治疗急性无黄疽型 病毒肝炎肝炎的疗效对比,70,检验步骤:1、建立假设,确定水准;H0:1=2=3H1:三种治疗方案的有效率不等或不全等。=0.05,71,2、计算x2值:,72,表8-6 三种方案治疗急性无黄疽型 病毒肝炎
14、肝炎的疗效对比,73,表8-6 三种方案治疗急性无黄疽型 病毒肝炎肝炎的疗效对比,74,表8-6 三种方案治疗急性无黄疽型 病毒肝炎肝炎的疗效对比,75,表8-6 三种方案治疗急性无黄疽型 病毒肝炎肝炎的疗效对比,76,表8-6 三种方案治疗急性无黄疽型 病毒肝炎肝炎的疗效对比,77,表8-6 三种方案治疗急性无黄疽型 病毒肝炎肝炎的疗效对比,78,3、确定概率:计算自由度: v=(3-1)(2-1)=2查x2值表: x20.05(2)=5.99现:x2=22.815.99则:p0.05 4、判定结果:按=0.05的水准,p0.005,拒绝H0,接受H1,可以认为三种疗法的有效率不等或不全等。
15、,79,例8.5 某研究人员收集了亚洲、欧洲和北美洲人的A、B、AB、O血型资料,结果见表8-7,问不同地区人群ABO血型分类构成比是否不同。 此资料属于多个构成比的比较:3行4列。,80,检验步骤:1、建立检验假设并确定检验水准H0:不同地区人群血型分布总体构成比相同H1:不同地区人群血型分布总体构成比不同或不全同a0.05,81,2、计算x2值:,82,3、确定概率:计算自由度: v=(4-1)(3-1)=6查x2值表: x20.05(6)=12.59 x20.005(6)=18.55 现:x2=297.3618.55则:p0.005 4、判定结果:按=0.05的水准,p0.005,拒绝H
16、0,认为三个不同地区的人群血型分布总体构成比有差别。,83,行列表资料x2检验应用注意事项,1、行列表资料x2检验,若p,接受H0时,说明各样本所在的总体无统计学差异,分析可结束;若p,接受H1时,还需要作进一步的两两比较x2分割。,84,检验步骤:1、建立假设,确定水准;H0:1=2=3H1:三种治疗方案的有效率不等或不全等。=0.05即H1表示: 123或:12 =3或:1=2 3,85,表8-6 三种方案治疗急性无黄疽型 病毒肝炎肝炎的疗效对比,二、多个样本率间两两比较-x2分割法(书上P91:Bonferroni 法),86,表8-6 三种方案治疗急性无黄疽型 病毒肝炎肝炎的疗效对比,
17、87,表8-6 三种方案治疗急性无黄疽型 病毒肝炎肝炎的疗效对比,88,行列表资料x2检验应用注意事项,2、对行列表资料作x2检验时,不能有1/5格子的理论数5,也不能出现理论数1,否则将可能产生错误的结论。如果上述情况,则要采取一定的措施来处理:(1)增加样本含量(2)合并较小理论数所在的行或列;(3)删除较小理论数所在的行或列。,89,行列表资料x2检验应用注意事项,3、对于多个样本率或多个样本构成比比较的资料资料可用x2检验说明各率(构成比)的差异有无统计学意义,根据P值大小决定是否需要作x2分割。 但对于双向有序列联表资料,作x2检验后若P,则需要进一步计算Pearson列联系数来说明
18、两个分类变量的相关性。,90,表8-6 三种方案治疗急性无黄疽型 病毒肝炎肝炎的疗效对比,注意: 不是现成的RC表,91,92,本章节重点掌握的内容,1、x2检验的原理、应用条件; 2、两样本率比较的x2检验方法及各方法应用注意事项; 3、配对计数资料x2检验与两样本率比较x2检验的区别; 4、多个率比较x2检验应用注意事项。,93,练 习,某医生收治200名患者,随机分成2组,每组100人。一组用A药,另一组用B药。经过2个月的治疗,A药组治愈了90人,B组治愈了85名患者,请根据现有结果评议下列说法是否正确,为什么? 1. A药组的疗效高于B药组。 2. A药的疗效高于B药。,94,某医生
19、收治200名患者,随机分成2组,每组100人。一组用A药,另一组用B药。经过2个月的治疗,A药组治愈了90人,B组治愈了85名患者,请根据现有结果评议下列说法是否正确,为什么? 1. A药组的疗效高于B药组。(对) 2. A药的疗效高于B药。(不对,这是针对总体而言的),95,计算标准化死亡率的目的是: A. 减少死亡率估计的偏倚 B. 减少死亡率估计的抽样误差 C. 便于进行不同地区死亡率的比较 D. 消除各地区内部构成不同的影响 E. 便于进行不同时间死亡率的比较,96,计算标准化死亡率的目的是 A. 减少死亡率估计的偏倚 B. 减少死亡率估计的抽样误差 C. 便于进行不同地区死亡率的比较
20、 D. 消除各地区内部构成不同的影响 E. 便于进行不同时间死亡率的比较,97,影响总体率估计的抽样误差大小的因素是 A. 总体率估计的容许误差 B. 样本率估计的容许误差 C. 检验水准和样本含量 D. 检验的把握度和样本含量 E. 总体率和样本含量,98,影响总体率估计的抽样误差大小的因素是: A. 总体率估计的容许误差 B. 样本率估计的容许误差 C. 检验水准和样本含量 D. 检验的把握度和样本含量 E. 总体率和样本含量,99,研究某种新药的降压效果,对100人进行试验,其显效率的95%可信 区间为0.8620.926,表示 A.样本显效率在0.8620.926之间的概率是95% B
21、. 有95%的把握说总体显效率在此范围内波动 C. 有95%的患者显效率在此范围 D. 样本率估计的抽样误差有95%的可能在此范围 E. 该区间包括总体显效率的可能性为95%,100,研究某种新药的降压效果,对100人进行试验,其显效率的95%可信 区间为0.8620.926,表示 A.样本显效率在0.8620.926之间的概率是95% B. 有95%的把握说总体显效率在此范围内波动 C. 有95%的患者显效率在此范围 D. 样本率估计的抽样误差有95%的可能在此范围 E. 该区间包括总体显效率的可能性为95%,101,某研究根据以下资料说明沙眼20岁患病率最高,年龄大的反而患病率下降,你同意
22、吗?说明理由。 某研究资料沙眼病人的年龄分布,102,参考答案 不正确,此为构成比替代率来下结论,正确的计算是用各年龄段的沙眼人数除各年龄段的调查人数得到患病率。,103,某研究根据以下资料说明沙眼20岁患病率最高,年龄大的反而患病率下降,你同意吗?说明理由。 某研究资料沙眼病人的年龄分布,104,比较两组阳性反应率, 在样本量非常小的情况下(如), 应采用 A. 四格表检验 B. 校正四格表检验 C. Fisher确切概率法 D. 配对检验 E. 校正配对检验,105,比较两组阳性反应率, 在样本量非常小的情况下, 应采用: A. 四格表检验 B. 校正四格表检验 C. Fisher确切概率法 D. 配对检验 E. 校正配对检验,