1、2 检验,目的要求: 1.掌握分类变量资料的统计推断的方法和计算过程。 2.掌握proc freq语句的格式、用途,且能对结果作全面分析。,一、复习有关内容,1.应用: (1)分类变量资料; (2)推断两个或两个以上的样本率或构成比之间有无差异;,2. 四格表资料的2 检验,(1)四格表的形式 (2)2 检验的基本思想 (3) 基本公式 自由度 =(行数-1)(列数-1), 当Ti5,且n 40时 使用普通2 检验,可用基本 公式或专用公式,a、b、c、d为实际频数, 四格表2 值的校正公式,当1T 5,且n40时,需校正2 检验 a .基本公式的校正:b.专用公式的校正:,3、行列表资料的2
2、 检验,公式:,RC表资料的2检验适用条件,1.理论数不能小于1 2.理论数1T,且小于5的格子数不超过总格子数的1/5。 若条件不适合,需作如下处理:A 增大样本例数 B 删除理论数太小的行或列 C 合并(性质相同),二、完全随机设计的2检验(SAS),例1 某医院用内科疗法治疗一般类型胃溃疡患者80例,治愈63例;治疗特殊类型胃溃疡患者99例,治愈31例。问内科疗法对两种类型胃溃疡的治愈率差别有无显著意义?,表 两种类型胃溃疡内科疗法治疗结果,data ex1; input r c count ; cards; 1 1 63 1 2 17 2 1 31 2 2 68 ; proc freq
3、; tables r*c/chisq expected nopercent nocol; weight count; run;,结果,结果解释,本例n40且各格子的期望值均大于5,因而选用Chi-Square的2统计量及其显著性水平,即239.927,P=0.0001,拒绝H0,认为内科疗法对两种类型胃溃疡的治愈率差别有统计学意义,一般类型的治愈率高于特殊型。,例2 某省三地区花生黄曲霉素B1污染率比较,地区,未污染,污染,合计,污染率(%),甲 乙,6 30 8,23 14 3,29 44 11,79.3 31.8 27.3,丙,合计,44,40,84,47.6,程序1:一般输入方法,dat
4、a ex2; input r c count; cards; 1 1 6 1 2 23 2 1 30 2 2 14 3 1 8 3 2 3 ;,程序2:循环输入法,data ex2; do r=1 to 3; do c=1 to 2; input count; output;end;end; cards; 6 23 30 14 8 3 ;,proc freq; tables r*c/chisq expected nopercent nocol; weight count; run;,结果,本例各格子期望值均大于5,选用Chi-Square的2统计量及其显著水平,即2=17.907,P=0.0001,按=0.05的检验水准拒受H0,认为三地花生黄曲霉素B1污染率有差别。,