1、第十四章 卡方检验(二),第一节2C表2的计算公式和2值的分割,一、公式:行列表的2值计算可以用基本公式、专用公式或下述的其他三个公式,最后计算结果相同,可以任意选用.,二、 2值及自由度的分割 2检验有统计学意义只能认为各总体率或构成比之间总的来说有差别,但不能说明它们彼此之间都有差别,或某两者间有差别。可用2分割解决此问题 2分割的原理是值及自由度的可加性(类似于方差分析) 将计数资料进行计量化转换,1为阳性,0为阴性,则各组均数等于各组率,总均数等于总率。,上述卡方的分子就是离均差平方和。ANOVA中,离均差平方和可按来源分成几部分,其各部分总和等于总离均差平方和。 2公式中分母都相同(
2、pq),则2值也可分成几部分,各部分的总和等于总2值,相应的自由度也或分割,第二节 组内分组资料的2检验,P174,例132。先按男女分组,在男女中再分别按是否患病分组,称组内分组 1、计算总2值: 自由度处理数(列数)1 2、计算病人与对照组间2值 男性组分2小组,自由度为21,女性亦然,因而病人对照间自由度为(2-1)+(2-1)=2,3、计算男女间2值 男女共分两组,自由度为21 注意:如果检验结果男女组间差别有统计意义,则计算病人对照间的2时,分子两项要分别除以男女的阳性率和阴性率的乘积p1q1和p2q2,这样计算结果则男女间2值与病人对照间2值之和不再正好等于总2值,但相差是不大的
3、组内分组三级或更多时,方法相同,第三节 内部构成不同的两个率差别的统计意义检验,上节中,男女组间阳性率差别无统计意义,因此,可将男女两组资料合并成四格表来进行卡方检验。 若男女阳性率不同,且男女比例在两组中不一致时,改用下述方法检验:三种,一、加权2检验法(Cochran 法) P176,例133,先列加权2检验计算表,再求两个率差值的加权平均数、方差、卡方值,亦可用u检验,u=d/Sd 此方法与前述两个率差别的统计学检验的原理类似,只是考虑到内部构成不同,平均差数用的是加权平均数,方差用的是各分表方差piqi的加权平均方差,权数为(1/n1i+1/n2i)的倒数 内部构成在两种以上情况同样可
4、用此方法,见P178例134,二、 2值相加 例133的资料,由于成人与儿童治愈率相差较大,不宜将数据合并检验,可分别计算成人和儿童分表的2值,然后2值相加,相应的自由度也相加,再检验 上例成人2 1.3157,自由度为1 儿童2 0.8736,自由度为1 总2 2.1896,总自由度2 2 0.05(2)=5.99, P0.05,同样适用于内部构成两种以上分类时,计算四格表的卡方时,仍需注意理论数不可过小的规则,且不用校正公式计算各2值 三、 值相加 各分表的方向不一致时,如成人一般疗法高,而儿童新疗法高时,不可用2值相加,改用值(2的平方根),根据方向加上正负号进行检验,公式如下,k为分表
5、数,第四节 分表理论数合并法,原理:按各分表分别计算理论数,然后将各分表相应的格子理论数相加作总表理论数,进行2检验 缺点:总表理论数不是由总表中实际数算得,理论上中有问题的。通常此法较保守,可能将应当有统计意义的判断为无统计意义。犯第二类错误,22表用加权、2和值相加较合理 用这种方法来解决内部构成不同的行列表,还是可取,因无较简单的类似方法可用。如果此时计算的2结果稍低于有统计意义的水平时,做结论要慎重。,第五节 行列表的分割,类似于ANOVA的各均数间相互比较 一、2k表的分割 P183,例137,分析资料提示,吸烟对慢性支气管炎的作用以早年开开始吸烟关系较大:故将原始资料按21岁和21
6、及以上分成两个部分,先对21岁及以上的三个组作2检验。,若结果无统计意义,可将三个合并为一组再与21岁组进行比较检验 最后,总表的自由度两个分表自由度之和 但,总表2值与两个分表的2值之和略有差异,并非仅由四舍五入所致,但差异通常不大。若分割后仍用总表频数所得的理论值,则2值相加正好等于总2值。 二、行列表的分割 先研究资料,再决定可能将哪些组合并,检验无统计意义后,正式合并,做检验,第六节 2C表线性回归的 统计意义检验,可认为是百分比(率)趋势的统计意义检验 P185例139,可见, 2值为36.8798,自由度为5, P0.0001,认为不同工龄工作某病患病率不是一样的。但当百分率不是依
7、次递增或递减时,并不能说,“ 随着工龄的延长,工人的患病率有升高或降低的趋势”。可用下述方法作趋势检验,一、按性质分组的资料 例138,问是不是有病情越重的组女病人所占的比例越高的趋势? 先给三组病人按病情轻重给一个人为的分数Z,1、0、1,并用x表示性别男为0、女为1,这样可得到一个不同程度甲亢病人女性百分比对分数(病情轻重)的回归,回归系数为,2检验是用于b有无统计意义:与0的差别有无统计意义;自由度为1 决定分数Z的方法: Z10.5(c-1),Z2=-0.5(c-3),Z3=-0.5(c-5) 式中c是百分数的个数。如c为3时,Z为1、0,1。C为4时,Z为-1.5,-0.5,0.5,1,5 二、按数量分组资料 只需改变一下评分方法。评分原则是与分组间隔相适应。,如各组工龄的组中值为0.5、1.5、3、5、7、10,若每组减5,可得-4.5、-3.5、-2、0、2、5。其计算分析方法同前 三、百分率很小或很大的资料 进一步将2计算公式简化为,四、药物疗效比较 计算的公式同前,实例见P189,例1313,