1、,方积乾 中山大学公共卫生学院,医学统计学,Chapter 7 Chi-Square 检验,6.1 Chi-Square 分布 和拟合优度检验,给定一组观察到的频数分布 f1, f2, f3 欲检验数据是否遵从某种理论. 若该理论成立,我们将有一组理论频数分布:e1, e2, e3 比较 f1, f2, f3 和 e1, e2, e3 如果两者很不相同, 则该理论不成立否则,该理论可以接受.,6.1.1 Chi-square 分布,Figure 6.1 若干 Chi-square 分布 的概率密度曲线,6.1.2 拟合优度 2 检验 (大样本),H0: 样本来自某理论分布H1: 样本并非来自该
2、理论分布当 H0 成立时 Chi-square 分布,fi 观察频数 ei 理论频数,=k1 用以计算 ei 的参数个数,6.2 比较两独立样本频率的 2 检验,大样本,例6.1 某医院对164例曾用过洋地黄药与51例 未用过洋地黄药的肺心病患者作心电图检查, 结果见表6.2。试问两组病人的心律失常发生 率的差异是否有统计学意义。,建立检验假设 H0: 1=2H1: 12 选择统计量,计算理论频数 计算 Chi-square的当前值关于 22 表的专用公式,计算自由度 =4121对于 22 表(21)(21)1 确定P值和统计决策 当 2 2-分布的临界值 , 拒绝 H0否则,不拒绝 H020
3、.05(1)=3.84现 2=2.30280.05, 不拒绝 H0.,要求大样本:,例 败血症,怎么办?,参见 * 6.7 四格表精确概率检验法,6.3 22交叉分类资料的2检验,社区随机抽样50岁以上男性人群, 研究刚血压与体型关联性,前述比较两独立样本概率的方法依然有效!,检验 P(B+ A+) =P(B + A-) ? 若 P(B+ A+) =P(B + A-) , 则 B 的结果独立于 A的结果 若 P(B+ A+) P(B + A-) , 则 B 的结果依赖于 A的结果,例6.2 有260份血清样品,每份样品一分为 二,用两种不同的免疫学检测方法检验 类风湿因子,其结果如表6.4所示
4、。试问 这两种免疫学检验的结果是否相互独立?,两个问题: (1) A 方法和 B 方法的结果有联系吗? (2) 两种方法的阳性率相等吗?,6.3.1 两个二值变量独立性检验 A 方法和 B 方法的结果有联系吗? 检验 P(B+ A+) =P(B + A-) ? 若 P(B+ A+) =P(B + A-) , 则 B 方法的结果独立于 A方法的结果 若 P(B+ A+) P(B + A-) , 则 B 方法的结果依赖于 A方法的结果,前述比较两独立样本概率的方法依然有效!,6.3.2 两种处理概率相等的检验 (McNemer检验) 两种方法的阳性率相等吗?欲检验 P(A+) = P(B+) ?P
5、(A+) (172+8)n , P(B+) (172+12)n P(A+) - P(B+) 完全取决于 8 和 12 欲检验 H0:12210.5, H1:AB 当 H0 成立时, e12e21(f12f21)2,6.3.2 两种处理概率相等的检验 (McNemer检验) 两种方法的阳性率相等吗?欲检验 P(A+) = P(B+) ?P(A+) (f11+f12)n , P(B+) (f11+f21)n P(A+) - P(B+) 完全取决于 f12 和 f21 欲检验 H0:12210.5, H1:AB 当 H0 成立时, e12e21(f12f21)2,问: 两种方法的阳性率相等吗?,不能
6、拒绝 H0,可以认为两个阳性率相等。,6.4 RC 表的 2 检验,6.4.1 比较几个独立样本频率的 2 检验,例6.4 在血型与疾病关系的研究中,随机抽取胃 溃疡病人、胃癌病人及对照人群的样本,根据 ABO血型分类(本例中因AB血型的例数较少, 故省略不计) 。试探讨不同病种是否具有不同 的血型分布。,一般公式和以前相同专用公式,6.4.2 比较R 组概率分布的分割 2 检验,是否每二种疾病的血型分布都不相同?,H0:胃癌组与对照组血型分布一致; H1:两组血型分布不一致,H0:胃溃疡组与非胃溃疡组血型分布一致;H1:两组血型分布不一致,6.4.3 RC交叉分类资料的2检验,6.4.3 R
7、C表资料的关联度测定,22表 和 RC 表都称为列联表(contingencytable) , 22表是 RC 表的特例。 2. RC 表的资料来自两种不同的设计:设计1:多组样本,比较概率分布;设计2:一组样本,探讨两个分类变量的独立 性或关联性。 3. 配对设计的资料是设计2的特例,可以探讨两 种测定方法的独立性或关联性。配对设计的资料还可以比较两种方法的阳性率, 但是,不能采用两组独立样本比较的2统计量, 需采用McNemer检验的2统计量,两者是不同的。,小 结,4. R 组独立样本比较 2 检验的结果:“不拒绝 H0 ”,表示尚不能认为多组概率 分布间差异具有统计学意义;“拒绝 H0
8、 ”, R 2 时,只意味着组与组 间差异具有统计学意义,但并不一定各组都不 相同。需要进一步通过列联表的分割与合并发 现那些组之间具有统计学差异。 5. RC 表资料独立性检验的结果:“不拒绝 H0 ”,表示尚不能认为两个分类 变量间具有关联性;“拒绝 H0 ”,意味着两个分类变量间具有 关联性。需要进一步计算Pearson 关联系数, 描述关联的强度。,5. 2 检验要求大样本 : 经验中, 4/5 格子中的理论频数大于5每个格子中的理论频数都要大于 1。否则,不能直接使用2 检验。 6. 样本量不大时,两组独立样本概率比较可采 用Fisher精确概率检验(Fishers exact probability test)。,The End,