06-ch6_Chi-square_检验.ppt-道客多多

资源描述

1、,方积乾中山大学公共卫生学院,医学统计学,Chapter 7 Chi-Square 检验,6.1 Chi-Square 分布和拟合优度检验,给定一组观察到的频数分布 f1, f2, f3 欲检验数据是否遵从某种理论. 若该理论成立，我们将有一组理论频数分布:e1, e2, e3 比较 f1, f2, f3 和 e1, e2, e3 如果两者很不相同, 则该理论不成立否则,该理论可以接受.,6.1.1 Chi-square 分布,Figure 6.1 若干 Chi-square 分布的概率密度曲线,6.1.2 拟合优度 2 检验 (大样本),H0: 样本来自某理论分布H1: 样本并非来自该

2、理论分布当 H0 成立时 Chi-square 分布,fi 观察频数 ei 理论频数,=k1 用以计算 ei 的参数个数,6.2 比较两独立样本频率的 2 检验,大样本,例6.1 某医院对164例曾用过洋地黄药与51例未用过洋地黄药的肺心病患者作心电图检查，结果见表6.2。试问两组病人的心律失常发生率的差异是否有统计学意义。,建立检验假设 H0: 1=2H1: 12 选择统计量，计算理论频数计算 Chi-square的当前值关于 22 表的专用公式,计算自由度 =4121对于 22 表(21)(21)1 确定P值和统计决策当 2 2-分布的临界值 , 拒绝 H0否则，不拒绝 H020

3、.05(1)=3.84现 2=2.30280.05, 不拒绝 H0.,要求大样本：,例败血症,怎么办？,参见 * 6.7 四格表精确概率检验法,6.3 22交叉分类资料的2检验,社区随机抽样50岁以上男性人群，研究刚血压与体型关联性,前述比较两独立样本概率的方法依然有效！,检验 P(B+ A+) =P(B + A-) ? 若 P(B+ A+) =P(B + A-) , 则 B 的结果独立于 A的结果若 P(B+ A+) P(B + A-) , 则 B 的结果依赖于 A的结果,例6.2 有260份血清样品，每份样品一分为二，用两种不同的免疫学检测方法检验类风湿因子，其结果如表6.4所示

4、。试问这两种免疫学检验的结果是否相互独立?,两个问题: (1) A 方法和 B 方法的结果有联系吗? (2) 两种方法的阳性率相等吗?,6.3.1 两个二值变量独立性检验 A 方法和 B 方法的结果有联系吗? 检验 P(B+ A+) =P(B + A-) ? 若 P(B+ A+) =P(B + A-) , 则 B 方法的结果独立于 A方法的结果若 P(B+ A+) P(B + A-) , 则 B 方法的结果依赖于 A方法的结果,前述比较两独立样本概率的方法依然有效！,6.3.2 两种处理概率相等的检验（McNemer检验）两种方法的阳性率相等吗?欲检验 P(A+) = P(B+) ?P

5、(A+) (172+8)n ， P(B+) (172+12)n P(A+) - P(B+) 完全取决于 8 和 12 欲检验 H0：12210.5, H1：AB 当 H0 成立时, e12e21(f12f21)2,6.3.2 两种处理概率相等的检验（McNemer检验）两种方法的阳性率相等吗?欲检验 P(A+) = P(B+) ?P(A+) (f11+f12)n ， P(B+) (f11+f21)n P(A+) - P(B+) 完全取决于 f12 和 f21 欲检验 H0：12210.5, H1：AB 当 H0 成立时, e12e21(f12f21)2,问: 两种方法的阳性率相等吗?,不能

6、拒绝 H0，可以认为两个阳性率相等。,6.4 RC 表的 2 检验,6.4.1 比较几个独立样本频率的 2 检验,例6.4 在血型与疾病关系的研究中，随机抽取胃溃疡病人、胃癌病人及对照人群的样本，根据 ABO血型分类(本例中因AB血型的例数较少，故省略不计) 。试探讨不同病种是否具有不同的血型分布。,一般公式和以前相同专用公式,6.4.2 比较R 组概率分布的分割 2 检验,是否每二种疾病的血型分布都不相同？,H0：胃癌组与对照组血型分布一致； H1：两组血型分布不一致,H0：胃溃疡组与非胃溃疡组血型分布一致；H1：两组血型分布不一致,6.4.3 RC交叉分类资料的2检验,6.4.3 R

7、C表资料的关联度测定,22表和 RC 表都称为列联表(contingencytable) , 22表是 RC 表的特例。 2. RC 表的资料来自两种不同的设计：设计1：多组样本，比较概率分布；设计2：一组样本，探讨两个分类变量的独立性或关联性。 3. 配对设计的资料是设计2的特例，可以探讨两种测定方法的独立性或关联性。配对设计的资料还可以比较两种方法的阳性率，但是，不能采用两组独立样本比较的2统计量，需采用McNemer检验的2统计量，两者是不同的。,小结,4. R 组独立样本比较 2 检验的结果：“不拒绝 H0 ”，表示尚不能认为多组概率分布间差异具有统计学意义；“拒绝 H0

8、 ”， R 2 时,只意味着组与组间差异具有统计学意义，但并不一定各组都不相同。需要进一步通过列联表的分割与合并发现那些组之间具有统计学差异。 5. RC 表资料独立性检验的结果：“不拒绝 H0 ”，表示尚不能认为两个分类变量间具有关联性；“拒绝 H0 ”,意味着两个分类变量间具有关联性。需要进一步计算Pearson 关联系数，描述关联的强度。,5. 2 检验要求大样本 : 经验中, 4/5 格子中的理论频数大于5每个格子中的理论频数都要大于 1。否则，不能直接使用2 检验。 6. 样本量不大时，两组独立样本概率比较可采用Fisher精确概率检验(Fishers exact probability test)。,The End,

展开阅读全文