1、1,预防医学分类变量资料统计推断,2,第八章 分类变量资料统计推断主要内容:总体率(构成比)的估计总体率(构成比)的显著性检验,3,第一节 率的抽样误差和总体率的估计一、率的抽样误差与标准误在抽样调查中,由抽样造成的样本率与总体率之差,称为率的抽样误差,其大小可用率的标准误描述。,4,率的标准误的计算公式:,p为总体率的标准误, 为总体阳性率, n为样本含量。,5,当未知时,可用样本率p作为估计值,计算出样本率的标准误Sp ,作为p估计值.,6,二、总体率的估计点估计:p区间估计:按一定的概率(1),以p来估计所在的范围。一般0.05或0.01。,7,1、查表法n50资料,根据样本阳性数X和n
2、,直接查二项分布参数的置信区间表。,8,2、正态近似法条件:n足够大,p和(1p)均不太小,且np5和n(1p)5时,p近似服从正态分布。,公式:pusp0.05 u0.051.96 0.01 u0.012.58,9,总体率的95可信区间:p1.96sp总体率的99可信区间:p2.58Sp,10,置信区间的意义理论上,此范围内包括总体率的可能性为95(99)。在100次抽样估计中,95(99)次正确,5(1)次错误。,11,例11.1 某地随机抽样368名5岁儿童,检查龋齿患病率为62.50。估计该地儿童龋齿患病率的95的置信区间。,p1.96sp0.62501.960.02520.57560
3、.6744该地儿童龋齿患病率的95的置信区间为57.5667.44。,12,第二节 率的u检验应用条件当n足够大,p和(1p)均不太小,且np5和n(1p)5时,p近似服从正态分布。,13,一、样本率与总体率的比较为总体率,一般为理论值、经验值或大量观察获得的稳定值。,14,例11.3 已知某地一般人群高血压患病率为13.26,某医师在农村随机抽取460人进行观察,有43人确诊为高血压。问该人群患病率是否低一般人群?,15,假设H0:=0=0.1326H1: 0=0.1326=0.05(单侧),16,计算u值n460 X43 p43/4600.0935,17,确定P值,判断结果u=2.4727
4、2.326,P0.01,按=0.05的水准拒绝H0,接受H1。可认为该人群患病率低一般人群。,18,二、两样本率比较应用条件n1与n2均较大p1、(1p1)、p2、(1p2)均不太小, n1p1、n1(1p1)、n2p2、n2(1p2)均5,19,计算公式:,两样本率之差的标准误 X1、X2两样本的阳性数,20,例11.4 为研究人群中HBV感染的性别差异,某医师对115例受检者进行分析,其中男性受检者62例,感染12例;女性受检者53例,感染3例。问男女HBV感染率是否有性别差异?,21,假设H0:1=2H1: 12=0.05,22,计算u值n162 X112 p112/620.1935n2
5、53 X23 p23/530.0566,23,确定P值,判断结果u=2.1731.96,P0.05,按=0.05的水准拒绝H0,接受H1。可认为HBV感染率有性别差异,男高于女。,24,第三节 2检验(chi-square test)2检验(卡方检验)可用于两个及两个以上样本率(构成比)的比较、两属性变量间的关联分析等。,25,一、四格表资料2检验,26,(一)2检验的基本思想以例11.5说明,27,根据H0 :120 0.2195,T110.219523050.49,T1223050.49179.51,T210.219518039.51,T2218039.51140.49,50.49 179
6、.51 39.51 140.49,28,理论频数的计算公式:,R为行数,C列数 nR行合计频数,nC列合计频数,29,40 190 50 130,30,基本公式的2值,反映实际数与理论数相差的情况。,若H0成立,则实际数与理论数相差不应太大,较大2值出现的概率较小。2值越大,越有理由推翻H0 。,31,2大小与格子数有关,格子数越多,v越大,2越大。若22 0.05,v(查2界值表P196),则可按0.05的检验水准拒绝H0 。,32,33,(二)2检验的步骤1、基本公式应用条件:n40,且每格T5。,例11.5 假设H0:1=2H1: 1 2=0.05,34,计算2值,V(R1)(C1) (
7、21)(21) 1,35,确定P值,判断结果查2界值表:20.05,1=3.8420.01,1=6.6320.01,1220.05,1,0.01P0.05,按=0.05的水准拒绝H0,接受H1。故可认为两组发病率的差别有统计学意义,服药组较低。,36,2、专用公式(例11.5),结论同前。(略),37,3、四格表资料2检验的校正应用条件:n40,有1T5,38,例11.6 某研究所研制出甲乙两种隔离服,用于预防传染病。在某医院随机抽取11名医生穿甲隔离服,30名医生穿乙隔离服。其感染情况如表11-2。问穿两种隔离服的医生感染率是否有差别?,39,40,假设H0:1=2H1: 1 2=0.05,
8、计算2值(最小)T111114/413.76(5),41,V(R1)(C1) (21)(21) 1,42,确定P值,判断结果查2界值表,20.05,1=3.8420.01,1=6.63220.05,1,P0.05,按=0.05的水准不拒绝H0。故还不能认为穿两种隔离服医生的感染率的差别有统计学意义。,43,四格表资料2检验的应用条件n40,且每格T5 专用或基本 n40,且有1T5 校正公式 n40,或T1 确切概率法,44,配对结果: 甲乙 甲乙 甲乙 甲乙,a对 b对 c对 d对,二、配对设计四格表资料2检验,45,46,例11.7 某医师对55例类风湿关节炎患者,分别采用免疫比浊法(IT
9、A)与乳胶凝集试验(LAT)法检测类风湿因子(RF),结果见表11-3。问两种方法检测效果有无差别?,47,48,假设H0:B=C H1: BC=0.05,计算2值因 bc40,V1,49,确定P值,判断结果查2界值表,20.05,1=3.8420.01,1=6.632 2 0.01,1 P0.01,按=0.05的水准拒绝H0,接受H1。故认为两种方法检测效果有差别,ITA检出率高于LAT。,50,三、行列表资料2检验(一)多个样本率(或构成比)比较率(或构成比)比较表中的R数和C数至少有一个2,称为RC表。,专用公式:,51,例11.8 1996年某医院住院病人不同季节呼吸道感染情况见表11
10、-4。问不同季节呼吸道感染率有无差别?,52,53,假设H0:四个季节感染率相同H1: 四个季节感染率不同或不全同=0.05,54,计算2值,55,确定P值,判断结果查2界值表,20.05,3=7.8120.01,3=11.342 2 0.01,3 P0.01,按=0.05的水准拒绝H0,接受H1。故认为不同季节呼吸道感染率有差别。,56,例11-9 某研究人员根据Rutter儿童行为问卷得分将发生过意外伤害的学龄儿童843人分为有、无行为问题两组。问两组儿童意外伤害的构成比有无差别?,57,58,假设H0:两组儿童意外伤害类型相同H1:两组儿童意外伤害类型不同 =0.05,59,计算2值,60,确定P值,判断结果查2界值表,20.05,4=9.4920.01,4=13.282 2 0.05,4 P0.05,按=0.05的水准不拒绝H0 。不能认为两组儿童意外伤害类型有差别。,61,(二)行列表资料2检验的注意事项1、当有1/5以上格子T5时,或有一个格子T1时,不宜进行RC表资料2检验。处理办法:增加样本例数性质相近的相邻格子合并删除T太小格子所对应的行或列,62,2、推断多个率(或构成比)时,如结论为拒绝H0、接受H1时,只能认为各总体率(或构成比)不等或不全相等(至少两个总体率不等),不能确定其中任意两个总体率不相等。,63,