1、精品第五章假设检验的功效与样本量当假设检验不拒绝H 0 时,推断正确的概率称为检验功效。临床科研中不时遇到假设检验无统计学意义,此时,很有必要对检验功效作出评价。5.1两类错误与功效1. 两类错误的概率H 0 : 0 , H 1:0(5.1) (略)X0(5.2)(略)Z n任何假设检验都可能出现两类错误,用两个概率来度量第类错误概率P( 拒绝 H 0 H 0 为真 )(5.3)第类错误概率P( 不拒绝 H 0 H 1 为真 ) (5.4a)也可以理解为第 类 错 误 概 率 P( 不 拒 绝 H 0 H 0 为 假 ) (5.4b)如果将诊断是否患有某病也视为一个假设检验问题:H 0:无病,
2、H 1 :有病第类错误:假阳性误诊,概率P( 阳性无病 ) ()第类错误:假阴性漏诊,概率P( 阴性有病 ) ()两类错误的背景:拒绝 H 0 时可能犯第类错误不拒绝 H 0 时可能犯第类错误两类错误的后果:第类错误可能将“真实无效误作有效”误诊第类错误可能将“真实有效误作无效”漏诊一般,的数值要在科研设计时事先确定2. 功效(power)假设检验 发现真实差异的功效就不低于 1- ,即检验功效 P( 拒绝 H 0 H 1为真 ) 1- (5.5)检验功效 P( 拒绝 H 0 H 0为假 ) 1- (5.5)功效就是真实有效的药物被发现的概率疾病被诊断出来的概率5.2影响功效的四要素- 可编辑
3、 -精品假设检验的功效至少受四个要素的影响,参看(5.2) 式X0Z(5.6)n功效的影响因素为:= x0 , n ,X 0 +Z(5.7)(略)n现用 X 分布图形来定性地讨论四要素对功效的影响1. 客观差异越大,功效越大X N(,2/n)(5.8)(略)若 H 0 为真, X N(0,2 /n)(5.9)(略)若 H 1 为真, X N(0+, 2 /n)(5.10)(略)H0H00x0xHH111-110+1x1-220+2x(a)均数间实际距离 d1 较小 (1.5);(b)均数间实际距离d2较大 (1.8)图 5.1 均数间差异越大 ,功效越大2. 个体间标准差越小, 功效越大 。3
4、. 样本量越大,功效越大H0H0x0x0H1H11-110+x1-220 +x(a)个体标准差 s1较大或样本量 n1较小 ;(b)个体标准差 s2较小或样本量 n2较大图 5.2个体间标准差越-可小编辑或-样本量越大,功效越大精品4. 值越大,功效越大筛 选 新 药 时大 些 , 以 免 漏 掉 有 苗 头 的 新 药(=0.10/0.20)新药上市前小些,以免误将真实无效的新药大量生产(=0.01)HH000x0x1HH11- 11- 2120+ 1x0+ 2(a) 1较小 ;(b)2 较大图 5.3值越大 ,功效越大x5.3功效与四要素的定量关系1. 单组样本均数的检验0Zn0Zn简化后
5、得到ZZ/ n(5.11)(略)(5.12)例 5.1 某药的平均有效时间原为 6 小时,现改进了配方, 据称可延长至 7 小时。为核实这一点,某研究组观察了25 例该病患者,得到的却是阴性结果(P 0.05) ,即不能认为平均有效时间长于6 小时,试分析原因。解这个问题实际上是检验假设H 0:6 , H 1 : 6据题意,不妨令 1 。的数值可参考此次25 例的观察结果,设连同以往经验猜测 2 。将 1 , 2 , n 25 和单侧 Z0.05 1.64 代入 (5.12)式Z n251Z2Z0 .05 0.86查标准正态分布表得0.860.8051 ,即 1- 0.8051果表明,此项检验
6、的功效为80.51%- 可编辑 -精品2. 两组样本均数的检验欲检验假设H 0 :1 2 , H 1 :1 2(5.13)(略)H 0 : 1-2 0 , H 1:1-2 0(5.14)Z X 1X 2(5.15) (略)2 nH 1 :1 -2 Z2 nZ2 n简化后得到(5.16)(5.17)(略)Z n 2Z(5.18)H0x1x2H11-x1x 2Z 2 n图 5.4 两组样本均数检验示意图例 5.2 一项关于降血压药的临床试验分设两组随机样本,各含 15 例同病患者。一组服用常规药,另一组服用新药。如果新药的降压效果至少比常规药平均高出0.8kPa 方可考虑在临床推广; 据以往经验,
7、 不论常规药还是这种新药,个体降压值的标准差约为1kPa 。经 0.05 水平的两组均数比较的统计检验,两组平均降压效果的差异尚无统计学意义,此事如何理解?解据题意,这是关于两组均数的一项单侧检验 0.8 , 1 ,n 15 ,单侧 Z 0.05 1.64 ,代入 (5.18)式得Z 0.815 2 - Z 0.05 0.55091查 标 准 正 态 分 布 表 , 得0.5509 0.7088 , 即 1-0.7088 只有 70.88% 的机会被此检验得出有差异的结论。3. 两组样本频率的检验(大样本 )- 可编辑 -精品欲检验假H 0:1 2 , H 1 :12 (5.19)(略)根据正
8、态近似两组样本均数的检验,有功效的计算公式Z nZ(5.20)111122其中,1-2例 5.3一项关于维生素C预防感冒作用的研究随机抽取两组正常人各 30 名,一组服用维生素C,另一组服用安慰剂,欲比较一定时期内发生感冒的频率。结果,安慰剂组有6人发生感冒,维生素 C组有 3 人发生感冒,经 0.05 水平的检验,差异无统计学意义,此事如何理解?解1 20% ,假定2 10% 或更低时认为值得重视,n 30 和 0.05 代入 (5.19) 式,Z0.10301.645 0.54460.200.10 10.20 10.10查 标 准 正 态 分 布 表 得0.5446 0.2929 , 即
9、1- 0.2929 ,功效只有 29.29%。5.4常用统计检验的样本量估算1. 单组样本均数的检验改写功效估计公式(5.12) 得Z Z2(5.21)n 估计样本含量的影响因素,类似于功效:,例 5.4 为较好地解决例 5.1 中的新药论证问题, 至少需要多大样本量 ?解 0.05, 0.01, 1, 2 ,以及 Z 0.05 1.64 ,单侧 Z 0.01 2.33,代入公式,n Z0.0522Z0.011.642.33 63.0436 631 20.5以 n 63 查 t 界值表,得 t 0.05(62) 与 t 0.01(62) 再次代入公式计算,如此多次迭代计算,当结果变化很小时便获
10、得n 的估计值。近似计算:在据Z和 Z求得的 n 值基础上再增补0.5Z 2作为最终的样本量估算值。这样,例5.3 的样本量可取为- 可编辑 -精品n 63.0436+0.5(1.64)2 64.3884 65 。2. 两组样本均数的检验类似地,改写(5.18) 式,我们又有ZZ2n 2(5.22)例 5.5为较好地解决例5.2 中新药论证问题,至少需要多大样本量 ?解仍象例 5.2 那样取 0.8, 1,单侧 Z 0.05 1.64 。为减少埋没较好药物的机会,令0.05 ,代入 (5.21)式,Z 0.05 Z21.64 1.642n 20.05 33.62 340.8 10.8类似地近似
11、计算得n 33.62+0.25(1.64)2 34.2924 35 。3. 两组样本频率的检验 (大样本 )改写 (5.20) 式,我们有样本量的计算公式n Z Z21 112 12(5.23)例 5.6 为较好地进行例 5.3 中维生素 C预防作用的研究,至少需要多大样本量 ?解仍取1 20%,2 10% 。为了不致埋没维生素C的预防作用,取 0.01 。将单侧 Z 0.05 1.64 , 单侧 Z 0.01 2.33连同1 和2的数值代入 (5.22) 式,n 1.642.3320.20(1-0.20)+0.10(1-0.10)0.10 394.0225 3945.5实例点评新药强力新甘草
12、甜素(SNMC)治疗慢性乙型肝炎的效果,资料与方法:1 病人选择2 试验药物及使用方法表 5.1治疗前的基本资料组 别年龄 (岁)性别病程( 月)HB 3 Ag病理 诊断X SD男女XCAHCPH肝硬化治疗组 32.9 1122334.22232122对照组28 8.423126.22402301- 可编辑 -精品表 5.2治疗前的主要肝功能指标(8 项 )肝功能治 疗组对 照组P 值功效例 数X SD例 数X SD1GOT(u)24199 74.623243 126.20.50.430.5白蛋白 (g)234.4 0.4244.5 0.50.50.19点评要点:( 1 )作者设计周密( 2 )因样本含量过小,功效很低(国家药监局规定每组 n100 )结论:尚不能认为新药与对照药疗效相同结语:重点是对两类错误、功效、样本含量估计的理解(计算次要)1. 对总体推论时要时刻想着两类错误问题2. 试验设计时必须事先估计检验功效与样本含量- 可编辑 -