1、四格表资料分析 卡方检验 以及Poisson资料分析,内容,卡方检验入门,概 述,卡方检验是以卡方分布为基础的一种常用假设检验方法,主要用于分类变量,它基本的无效假设是(不包括配对资料): H0:行分类变量与列分类变量无关联 H1:行分类变量与列分类变量有关联 =0.05 统计量 ,其中Ai是样本资料的计数,Ti是在H0为真的情况下的理论数(期望值)。,卡方检验,在H0为真时,实际观察数与理论数之差AiTi 应该比较接近0。所以在H0为真时,检验统计量服从自由度为k-1的卡方分布。即: ,拒绝H0。上述卡方检验由此派生了不同应用背景的各种问题的检验,特别最常用的是两个样本率的检验等。,方法原理
2、,方法原理,理论频数 基于H0成立,两样本所在总体无差别的前提下计算出各单元格的理论频数来,方法原理,从卡方的计算公式可见,当观察频数与期望频数完全一致时,卡方值为0; 观察频数与期望频数越接近,两者之间的差异越小,卡方值越小; 反之,观察频数与期望频数差别越大,两者之间的差异越大,卡方值越大。 当然,卡方值的大小也和自由度有关。,方法原理,卡方分布 显然,卡方值的大小不仅与A、E之差有关,还与单元格数(自由度)有关,操作步骤,1. 建立检验假设和确定检验水准 H0:使用含氟牙膏和一般牙膏儿童龋患率相等 H1:使用含氟牙膏和一般牙膏儿童龋患率不等 2. =0.05 3.计算检验统计量2值,操作
3、步骤,4. 确定P值和作出推断结论 查附表8,2界值表,得p0.05。按 = 0.05水准,不拒绝H0,尚不能认为使用含氟牙膏比使用一般牙膏儿童的龋患率低。 对于四格表,卡方的计算公式又可进行简化,以方便手工计算,卡方检验假设的等价性,两组儿童的龋齿率相同 两组发生率的比较使用不同的牙膏并不会影响龋齿的发生(两个分类变量间无关联) 两变量的相关分析,四格表2值的校正,英国统计学家Yates认为,2分布是一种连续型分布,而四格表资料是分类资料,属离散型分布,由此计算的2值的抽样分布也应当是不连续的,当样本量较小时,两者间的差异不可忽略,应进行连续性校正(在每个单元格的残差中都减去0.5) 若n
4、40 ,此时有 1 T 5时,需计算Yates连续性校正2值 T 1,或n40时,应改用Fisher确切概率法直接计算概率,确切概率法,分析实例,注意:确切概率法不属于2检验的范畴,但常作为2检验应用上的补充。,分析实例,1建立检验假设和确立检验水准 H0:新药组与对照组疗效相等,即 1 = 2 H1:新药组与对照组疗效不等,即 1 22计算概率和确定P值 本例n=a+b = 36 40,不满足2检验的应用条件,宜采用四格表确切概率法。,方法原理,在四格表周边合计不变的条件下,在相应的总体中进行抽样,四格表中出现各种排列组合情况的概率 本例即28、8、22、14保持不变的条件下,若H0成立,计
5、算出现各种四格表的概率,方法原理,然后将其中小于等于现有样本概率的概率值相加,即为P值: 本例中P值=P(0)+ P(6)+P(7)+P(8)=0.03610.05,一点补充,确切概率法可以考虑单边检验 对于较大的行乘列表,确切概率法的计算量将变得十分惊人,有可能超出硬件系统可以支持的范围,配对设计两样本率比较的2检验,方法原理,例6.9 用A、B两种方法检查已确诊的乳腺癌患者140名,A法检出91名(65%),B法检出77名(55%),A、B两法一致的检出56名(40%),问哪种方法阳性检出率更高?,方法原理,显然,本例对同一个个体有两次不同的测量,从设计的角度上讲可以被理解为自身配对设计上
6、述问题为:两种“处理”之差别分析,方法原理,注意 考虑该例四格表中两处理阳性检出率是否相同只要考虑四格表中的非对角元素的差异假设检验步骤如下: H0:两法总体阳性检出率无差别,即B = C H1:两法总体阳性检出率有差别,即B C,方法原理,注意事项,McNemar检验(配对卡方检验)只会利用非主对角线单元格上的信息,即它只关心两者不一致的评价情况,用于比较两个评价者间存在怎样的倾向。因此,对于一致性较好的大样本数据(a,d较大且b,c较小时),McNemar检验可能会失去实用价值。 例如对1万个案例进行一致性评价,9995个都是完全一致的,在主对角线上,另有5个分布在左下的三角区,显然,此时
7、一致性相当的好。但如果使用McNemar检验,此时反而会得出两种评价有差异的结论来。此时,可以考虑边际卡方检验,见P130,注意事项,配对四格表卡方与成组设计卡方由于配对设计的资料同一对观察结果间一般是非独 立的,而成组设计的资料一般可以认为是独立的, 所以配对四格表资料不能用成组设计的2或 Fisher检验的,而要用配对设计的2或配对设计 的直接计算概率法进行检验。,Poisson分布资料推断,Poisson分布资料是离散型资料,但不具有分类特征,故视为计量资料。Poisson分布两样本来自总体均数是否相等的比较 1.两样本观察单位相同:在每个样本的观察值大于20时,基于正态近似可以构造两样本总体均数的检验。 2.两样本观察单位不等:应将观察计数化为观察单位相同的平均水平,再基于正态近似构造两样本总体均数的检验,Thank You !,