收藏 分享(赏)

临床试验中样本量确定的统计学考虑 专家共识.pdf

上传人:weiwoduzun 文档编号:4478025 上传时间:2018-12-30 格式:PDF 页数:6 大小:255.99KB
下载 相关 举报
临床试验中样本量确定的统计学考虑 专家共识.pdf_第1页
第1页 / 共6页
临床试验中样本量确定的统计学考虑 专家共识.pdf_第2页
第2页 / 共6页
临床试验中样本量确定的统计学考虑 专家共识.pdf_第3页
第3页 / 共6页
临床试验中样本量确定的统计学考虑 专家共识.pdf_第4页
第4页 / 共6页
临床试验中样本量确定的统计学考虑 专家共识.pdf_第5页
第5页 / 共6页
点击查看更多>>
资源描述

1、中国临床试验生物统计学组成员 ( 按姓名拼音排序 ) : 陈峰 、陈平雁 、陈启光 、贺佳 、黄钦 、金丕焕 、李康 、李宁 、李卫 、李晓松 、凌莉 、刘玉秀 、苏炳华 、孙高 、王武保 、王彤 、魏朝晖 、夏结来 、姚晨 、易东 、尹平 、于浩 、张罗漫 、赵耐青 。专家共识 临床试验中样本量确定的统计学考虑CCTS 工作组 陈平雁 ( 执笔 )样本量确定 ( sample size determination) , 又称样本量估计 ( sample size estimation) , 是指为满足统计的准确性和可靠性 ( I 类错误的控制和检验效能的保证 ) 计算出所需的样本量 , 它是

2、临床试验设计中一个极为重要的环节 , 直接关系到研究结论的可靠性 、可重复性 ,以及研究效率的高低 。样本量估计也是一个成本 -效果和检验效能的权衡过程 。ICH E9 ( 1998) 指出 , 临床试验的样本量必须足够大 , 以可靠地回答研究假设所提出的相关问题 ; 同时又不至于太大而造成浪费 。样本量的估计方法应该在研究方案中详细阐述 , 包括计算样本量所依据的参数 , 如方差 、均数 、反应率 、阳性事件发生率 、差值等 。本文适用于确证性试验 。样本量估计需考虑的主要因素在确定临床研究的目的之后 , 首先考虑试验设计 ,包括对照的选择 ( 如标准对照 、阳性对照 、安慰剂对照 、剂量对

3、照等 ) 、比较类型 ( 如优效性试验 、非劣效性试验 、等效性试验 ) 、设计类型 ( 如平行设计 、交叉设计 、析因设计 、成组序贯设计等 ) 、主要指标 ( 定量 、定性 、生存时间 ) 等 ; 其次考虑统计分析方法 , 并提出效应量 ( effect size) 的假定 ; 然后根据试验特点定义统计特征 , 如统计分布 、检验水准 ( significant level) 、检验效能 ( power) 、单双侧和分配比例等 ; 再应用正确的样本量估计方法计算出样本量 ; 最后根据协变量 、试验中的脱落率 、剔除率和依从性等具体情况进行适当调整 。1. 研究目的与试验设计( 1) 研究目

4、的就临床试验而言 , 在确证性研究中研究目的主要体现在有效性评价和安全性评价两个方面 。样本量估计常用于有效性评价 。( 2) 比较类型及其检验假设临床试验常用的比较类型有优效性试验 ( superi-ority trial) 、等效性试验 ( 包括生物等效性试验 ) ( equiv-alence trial) 、非劣效性试验 ( non-inferiority trial) 等 。下面以两组效应量为均数的正向指标比较为例 , 设定优效 、等效和非劣效的界值为 , 说明它们的检验假设与推断结论 。优效性试验 : 试验的目的是验证试验组效应是否优于对照组 , 如果研究不设定优效界值 , 其检验假

5、设为 :H0: T=C;H1: TC。若 P, 且珔XT珔XC, 可推断试验组疗效优于对照组 。这里 , T和 C分别代表试验组和对照组的总体均数 ,珔XT和珔XC分别代表试验组和对照组的样本均数 。如果研究设定优效界值为 ( 0, 下同 ) , 即强优效 , 则检验假设为 :H0: TC;H1: TC。此时 , 若 P, 则可推断试验组疗效优于对照组 。等效性试验 : 试验的目的是验证试验组效应是否与对照组相当 。如果研究设定等效界值 , 其检验假设为 :H0: TC 或 TC;H1: TC。这是上下限相同的情况 。如果下限 1与上限 2不同 , 则检验假设为 :H0: TC1或 TC2;H

6、1: 1TC2。此时 , 若 P, 则可推断试验组疗效等效于对照组 。非劣性试验 : 试验的目的是验证试验组效应是否非劣于对照组 。如果研究设定非劣效界值 , 其检验假设为 :H0: TC;H1: TC 。此时 , 若 P, 则可推断试验组疗效非劣于对照组 。( 3) 设计类型临床试验的设计模型相对比较简单 , 常用的有平行设计 、交叉设计 、析因设计 、序贯设计 、群随机设计和适应性设计等 。有关这些设计的详细介绍可参考相关文献 。2. 主要指标727中国卫生统计 2015 年 8 月第 32 卷第 4 期临床试验的样本量通常依据对主要指标做出相应的假定后进行估计的 。在 II、III 期临

7、床试验中主要指标一般是有效性评价指标 , 上市后的 IV 期临床试验主要指标可以是有效性评价指标 , 也可以是安全性评价指标 , 或兼而有之 。如果样本量估计应同时依据主要有效性指标和主要安全性指标 , 在设计时应针对有效性和安全性分别提出统计假设 , 逐一计算样本量 , 最终样本量取其中最大者 。主要指标应在研究方案中明确定义 , 通常需根据专业知识确定 , 应是专业领域具有共识的或认可程度较高的指标 , 一般源于某一标准或指南 , 或源于专业领域公开发表的权威论著或专家共识等 。主要指标不宜太多 , 一般只有一个 。当主要指标有多个时 , 样本量估计要考虑假设检验的多重性问题 。在定义主要

8、指标过程中 , 不仅要说明指标的含义 ,其测量时点 、测量手段以及计算方法都应注明 。指标的类型要明确 , 这一点非常重要 , 因为样本量估计和数据分析都需要依此进行 。例如 , 某些指标可以有定量 、定性 ( 如有效和无效 ) 、等级 ( 如痊愈 、显效 、有效 、无效 ) 、生存时间等不同类型 。对应于指标的不同类型 ,样本量估计方法亦不相同 。所以 , 方案中对主要指标的定义要具体到指标类型上 。3. 效应量效应量是样本量估计所需的最重要参数之一 , 根据不同的指标类型 , 常见的效应量有 : 均数的组间差值或标准化差值 , 率的组间差值或比值 ( 、H) 、O, 或相关系数 、回归系数

9、等 。效应量参数的确定主要基于下述三种途径 :( 1) 本项目的任何既往研究结果 。即源于同一项目的预试验 、探索性试验 ( I 期或 II 期临床试验 ) 、单中心试验的结果等作为确定参数的依据 。由于此类研究结果属于内部证据 , 因此是首选途径 。( 2) 基于他人的研究结果 。当本项目的先前研究无法提供确切的参数数据 , 或尚未开展研究时 , 参数的确定可以以公开发表的研究结果作为依据 。由于此类研究结果属外部证据 , 因此是次选途径 。若公开发表的同类研究报道不止一个 , 最好是经 meta 分析所得合并效应量作为样本量估计的参数 。( 3) 基于本试验的预期结果 。如果本试验没有任何

10、之前的研究结果可以借鉴 ( 无论是自己的还是他人的 ) , 或以往的研究数据不能得到本试验设计所需的参数 ( 如本试验采用交叉设计 , 而以往研究数据均来自两平行组设计的研究 ) , 可以用预期的形式进行预设 , 通常以广义效应量表达 。若对试验药物或器械有充足信心 , 则预期效应量较大 ( 如设为 0. 8) , 此时所需样本量较小 。若对试验药物或器械信心不足 , 则预期效应量较小 ( 如设为 0. 2) , 此时所需样本量较大 。若对试验药物或器械的信心尚可 , 则预期效应量为中等水平 ( 如设为 0. 5) , 此时所需样本量也是中等大小 。此外 , 对于单臂设计或配对双臂设计 , 若

11、涉及标准对照参数 ( 或目标值 ) 的确定 , 其途径的优先顺序大致为国际标准 、国家标准 、行业标准 ( 含指南等 ) 、被权威机构认可的企业标准 、外部证据 ( 同类研究的综合结果 , 如 meta 分析结果 ) 。4. 统计特征样本量估计需要考虑的统计特征主要有统计分布 、检验水准 、检验效能 、单双侧和平衡与否等 。统计分布 : 样本量估计方法的选择与主要指标的统计分布假定密切相关 , 基于正态分布的假定会选择参数方法 , 基于非正态分布的假定会选择非参数方法 。同样 , 生存分析的样本量估计方法会因 Weibull 分布族的假定有所不同 。检验水准 : 检验水准也就是 I 类错误概率

12、 , 用 表示 , 以双侧 0. 05 的水准最为常用 。对于优效性检验设定单侧 =0. 025 的情形 , 以及等效性或非劣效性检验设定双单侧的 = 0. 025 的情形 , 其本质仍然是双侧0. 05 的检验水准 。但在某些情况下检验水准的设定会有所不同 。例如 , 为控制整体 I 类错误概率 , 涉及多重检验时 ( 如定义多个主要指标 ) , 每次检验的名义检验水准 *将小于或等于 ; 涉及期中分析时 , 考虑 消耗 , 每次检验的 *将小于 。此外 , 对于生物等效性检验 , 习惯取双侧 为 0. 1。检验效能 : 用 1- 表示 , 代表 II 类错误概率 。检验效能是指在设定的 基

13、础上 , 原假设 H0为假且检验结果拒绝了 H0的概率 。检验效能越高 , 发现差别的可能性越大 , 但同时所需样本量也越大 。临床试验中 ,检验效能通常不得低于 80%。在样本量估计过程中 ,可通过对检验效能的敏感性分析提供不同的样本量方案 , 供研究人员选择 。单侧和双侧检验 : 单侧检验的样本量会明显小于双侧检验的样本量 。一般而言 , 医学研究领域的统计检验约定俗成地使用双侧检验 , 如果采用单侧检验 , 需要给出充足的理由 。需要指出 , 对于一般意义的检验水准 0. 05 而言 , 如果取单侧水准为 0. 025 的话 , 其实质仍然是双侧 0. 05 水平 。平衡或非平衡设计 :

14、 所谓平衡设计 , 即每组的样本量相同 。在其他条件不变时 , 各组样本量相同时平衡设计效率最高 , 即试验所需总样本量最小 。因此 , 研究设计应尽可能采用平衡设计 。非平衡设计是指比较组间的样本量有明显差别 , 习惯上这种差别成倍数关系 ,例如 , 新药 III 期临床试验 , 因为安慰剂对照的疗效相对可以确定 , 同时出于伦理考虑 , 安慰剂对照组的样本量会安排的少一些 , 而试验组的样本量相对要大一些 ,比如是对照组的 2 倍或 3 倍 。827 Chinese Journal of Health Statistics, Aug 2015, Vol32, No4样本量估计原理和方法1.

15、 样本量估计原理样本量估计的方法通常是从检验统计量计算公式反推而来 。一般地 , 统计推断的效应量可认为是给定模型参数 的函数 f( ) , 用 T 表示 f( ) 的一个无偏估计统计量 , 若数据来自正态分布 , 或根据中心极限定理 , 有T f( )Var( T槡) N( 0, 1) ( 1)式中 , Var( T) 为统计量 T 的方差 。令检验水准为 , 检验效能为 1-, 并规定采用双侧检验 。在 H0假设下 , f( ) =0, 水平下的检验 H0的界值为|T/ Var( T槡) | Z1 /2( 2)在 H1假设下 , f( ) = d, 令 =dVar( T槡), 有1 = P

16、 |N( , 1) | Z1 /2 P N( , 1) Z1 /2= P N( 0, 1) Z1 /2 =( Z1 /2) ( 3)进一步求得Z1 Var( T槡) = d Z1 /2Var( T槡)Var( T) = d2/( Z1 + Z1 /2)2( 4)更为一般地 , Var( T) 可以表示为关于样本量的函数 , 据此求得样本量 。现以正态分布数据两组均值的比较为例 , 说明上述原理的应用 。令两样本均数之差为 T =珔XE珔XC, 两总体均数之差为 =EC, 两总体方差相同 , 为 2, 则Var( T) =2nE+2nC=r +1r2nC( 5)式中 , r 为两组样本量的比值

17、, nE= rnC。将公式( 5) 代入公式 ( 4) , 有2( Z1 + Z1 /2)2=r +1r2nCnC=r +1r( Z1 + Z1 /2)222( 6)上述推导是基于总体方差 2已知的情况 。当 2未知时 , 即用样本方差 S2作为其估计值时 , 检验统计量服从 t 分布 , 则上面公式中的 Z( )需要用 t( )替换值 。基于正态分布 , 有1 =rnE2( r +1) 槡2 Z1 /( )2( 7)基于 t 分布 , 则检验统计量服从非中心 t 分布 , 通过迭代计算可求出样本量 , 即1 = probtt1 /2, nE( r +1) 2, nE( r +1) 2,rnA

18、2( r +1) 槡( )2( 8)生存分析的样本量估计虽然有其特殊之处 , 但上述原理同样适用 。以基于指数分布假设的生存分析数据为例 , 令病例入组时间 ( accrual period) 为 AT, 试验时间全长 ( total time) 为 TT, 随访时间 ( follow-up peri-od) 为 TT-AT。假设第 i 组第 j 个病人生存时间 tij服从风险率 ( hazard rate) 为 i的指数分布 , 第 i 组的失访率服从风险率为 i的指数分布 , 入组时间 zij服从在AT 处截断的指数分布 , 其概率密度函数为 g( z) =e z/( 1 e AT) ,

19、0zAT, 式中 , 0 表示早期入组病例较多 ; 0 表示后期入组病例较多 ; =0 则一般定义为 g( z) =1/AT, 表示病人均匀入组 。每个个体的随访时间 xij及状态 ij可以表示为 ( xij, ij) = ( min( tij, TT zij) , I tijTT zij ) , 其中 =1 表示阳性事件 , =0 表示删失事件 。令试验组与对照组的风险率之差为 T =EC,其对应总体的风险率之差为 =EC, 则Var( T) =2( E)nE+2( C)nC( 9)将公式 ( 9) 代入公式 ( 4) , 并令 nE= rnC, nE和nC分别为试验组和对照组的样本量 ,

20、r 为试验组与对照组样本量的比例 , 则有2( E)nE+2( C)nC=2/( Z1 + Z1 /2)2nC=( Z1 + Z1 /2)2222( E)r+2( C( ) ( 10)式中 2( ) 经推导得 :2( i, i, i) =2iii+i+iie ( i+ i) TT( 1 e( i+ i ) AT)( i+i) ( i+ii) ( 1 e iAT )1,i = E, C ( 11)当统计量 T = logH 时 , 我们同样可以先求出 Var( T) , 然后代入公式 ( 4) 中计算样本量 , 此时所得样本量计算公式可拆解成一个关于所需阳性事件数 ( num-ber of ev

21、ents) 与个体发生阳性事件概率的表达式 , 这也是目前最常用的方法 。2. 样本量估计方法样本量估计方法 , 即样本量的计算公式 , 应根据研究背景 、研究假设 、设计模型 、主要评价指标的数据特征等做出正确选择 。由于样本量计算公式繁多 , 本文不做详细介绍 , 读者可参考 中国卫生统计 2012 年至2014 年连续刊发的 “样本量估计及其在 nQuery 和 SAS软件上的实现 ”系列文章 ( 共 19 篇 ) 9。该系列文章以样本量估计专业软件 nQuery Advisor 7. 0 为依据 , 系统介绍常用的样本量估计方法 , 给出计算公式及其权927中国卫生统计 2015 年

22、8 月第 32 卷第 4 期威出处 , 通过实例加以说明 , 同时还给出了 SAS9. 2 软件实现的程序 , 便于广大读者应用 。表 1 列出了常用的样本量估计方法 , 可看作通过统计检验方法正确选择样本量估计方法的一个索引 。表 1 临床试验中常用样本量估计方法索引统计分析方法 组数 检验类型 样本量估计方法所对应的统计检验均数比较或非参数方法单组差异性检验单样本 t 检验基于差值均数的配对 t 检验单因素重复测量方差分析基于 Greenhouse Geisser校正的单因素重复测量方差分析等效性 /非劣效性检验等效性配对 t检验两组差异性检验两样本 t 检验 ( 方差齐性 )Satter

23、thwaites t 检验 ( 方差不齐 )基于对数正态分布的两样本 t 检验基于比值的两样本 t 检验Wilcoxon/Mann Whitney 秩和检验 ( 连续变量 )Wilcoxon/Mann Whitney 秩和检验 ( 等级变量 )基于 Greenhouse Geisser 校正的两组重复测量方差分析2 2交叉设计的方差分析等效性检验平行组设计的双单侧等效性检验交叉设计的双单侧等效性检验基于比值平行组设计的等效性检验 ( 连续变量 )基于比值交叉设计的等效性检验 ( 连续变量 )基于比值平行组设计的等效性检验 ( 等级变量 )基于比值交叉设计的等效性检验 ( 等级变量)多组 差异性

24、检验One way ANOVA基于线性组合比较的单因素方差分析Two way ANOVA率的比较单组差异性检验单样本 2检验单样本率确切概率检验McNemar 2检验配对设计的确切概率检验多分类样本率的 2检验等效性检验配对设计一致率的等效性检验配对设计基于非劣效下限的检验 ( 试验组 对照组 )配对设计基于非劣效上限的检验 ( 试验组 对照组 )配对设计双单侧等效性检验 ( 试验组 对照组)两组差异性检验两样本率比较的 Pearson 2检验 ( 计算样本量或检验效能 )两样本率比较的 Pearson 2检验 ( 计算其中一个样本率 )两样本率比较的 Yetes 校正 2检验 ( 计算样本量

25、或检验效能 )两样本率比较的 Yetes 校正 2检验 ( 计算其中一个样本率 )Fisher 确切概率检验两组构成比检验CMH 检验校正 CMH检验等效性检验两样本率比较的等效性检验基于非劣效下限的检验 ( 试验组 对照组 )基于非劣效上限的检验 ( 试验组 对照组 )双单侧等效性检验 ( 试验组 对照组)多组 差异性检验多个样本率比较的 2检验二分类多组的线性趋势检验 ( logistic 回归 )多组构成比的比较生存分析 两组 差异性检验两组生存曲线比较的 log rank 检验两组指数分布生存曲线比较的参数检验两组指数分布生存曲线比较的非劣效性检验两组生存曲线比较的 log rank

26、检验 ( 特定的生存率 、风险率 、试验进入率 、删失率)相关分析 单组 差异性检验kappa 系数检验 ( 二分类变量 )相关系数检验 ( 连续变量 )Lin 和谐系数检验 ( 连续变量)样本量估计的其他考虑1. 样本量的调整根据统计学方法估计出的样本量是在给定条件下满足临床试验所需的最小样本量 。实际试验过程中 ,由于病例的脱落和剔除 、病例依从性差等原因 , 会导致可评价例数的减少 。因此 , 需要在样本量估计基础上适度扩大样本量 , 以保证最终的有效样本量可以满足最小样本量的要求 。从分析角度讲 , 需保证最终的可评价样本量 ( 即符合方案数据集 ( per-protocol set)

27、 的037 Chinese Journal of Health Statistics, Aug 2015, Vol32, No4例数 ) 应大于经样本量估计方法求得的样本量 。样本量调整通常会考虑不大于 20% 的脱落剔除率 , 具体的脱落剔除率如何确定 , 将视不同的研究项目而定 , 确定的依据主要来自专业方面的判断 , 或经由以往研究数据的 meta 分析为重要参考 。当亚组分析的结果是主要疗效指标时 , 则应保证最终的亚组可评价病例达到最小样本量 。临床试验结果可能受某些预后因素 ( 协变量 ) 的影响 , 如年龄 、性别 、病情程度等 。样本量估计时一般不考虑预后因素 , 主要是因为随

28、机分组可使各组间的协变量达到均衡 。2. 样本量再估计样本量再估计较多地用于适应性设计 。适应性设计样本量再估计常用的三种方法如下 。( 1) 成组序贯设计 : 每组的样本量固定 , 每次期中分析的目的是对是否终止试验 ( 成功或失败 ) 或进入下一周期的试验做出决策 。( 2) 固定期中分析 : 每次期中分析对参数重新进行估计 , 并据此对样本量做出新的估计和调整 , 但不对检验假设进行检验 。( 3) 上述两种方法的结合 : 每次期中分析既对参数重新进行估计 , 并据此对样本量做出新的估计和调整 ; 又对检验假设进行检验 , 以判断是否终止试验 ( 成功或失败 ) 或进入下一周期的试验 。

29、上述三种方法均属于期中分析的样本量估计问题 , 详细过程可参阅文献 9 。需要指出 , 基于期中分析的样本量再估计应尽可能地在盲态下进行 。临床试验方案中对样本量估计的要求在临床试验方案中 , 需要对样本量估计进行清晰和完整的阐述 , 应至少包含以下内容 : 试验的研究假设 , 对照的类型 , 比较类型 , 设计模型 , 主要指标 , 将要用到的统计分析方法 , 参数 ( 包括等效或非劣效界值 )的来源以及依据 , 检验水准 ( 若涉及多重检验或期中分析 , 需解释确定检验水准的依据 ) , 检验效能 , 单双侧检验 , 分配比例 , 样本量估计方法及其出处 ( 列参考文献 ) , 所用软件及

30、其版本 , 样本量调整及其依据 , 各组以及各中心的样本量分配 ( 列表 ) , 若竞争入组需特别说明 。常见问题回答Q1. 样本量估计有哪些专用软件 ?目前常用的样本量估计软件有 nQueryAdvisor +nTerim, PASS, DSTPLAN, G * Power, PC-Size, PS,SAS Power and Sample Size application ( PSS) , Stata,。这些软件中 , nQuery 和 PASS 是其中最常用的 , 它们涵盖了几乎所有的样本量统计方法 。下面对这些软件做一简要介绍 。nQuery Advisor + nTerim: 爱尔兰

31、 Statistical Solu-tions 公司开发的商业软件 , 由 nQuery Advisor 7 软件加入 nTerim 模块组成 , 前者原先是一独立样本量估计软件 , 后者是专门用于期中分析的样本量估计模块 。目前最新版本为 3. 0, 运行于 Windows 平台 。该软件同时得到美国 FDA、欧洲药品管理局 、日本 、韩国的官方认可 , 为世界制药企业和生物技术公司 50 强中的49 家所使用 。内容几乎已经涵盖了样本量计算的所有方面 。中国卫生统计 连载的系列文献系统介绍了常用的样本量估计方法 9, 给出了计算公式及其出处 , 并附有样本量估计专业软件 nQuery Ad

32、visor 7. 0的操作主界面和样本量估计中参数设置的界面 , 同时还给出了 SAS9. 2 软件实现的程序 , 便于广大读者应用 。PASS: 美国 NCSS 公司开发 , 是一款运行在 Win-dows 平台下的商业软件 , 目前最新版本为 13。类似于nQuery, 它也覆盖了几乎所有的样本量计算方法 , 其官方网站宣称用到的统计方法已经超过了 230 种 。DSTPLAN: 是一款运行在 Windows 环境下的免费软件 , 其本身是基于 Fortran 语言构造 , 由安德森癌症中心开发 。包括的统计分析方法有 t 检验 、相关分析 、率的比较 、2 N 的列联表检验 , 以及生存

33、分析的差异性检验 。G* Power: 是一款在 Windows 以及 Mac OS X 环境下运行的免费软件 , 由德国杜塞尔多夫大学开发 。包括的统计分析方法有 t 检验 、One-way ANOVA、回归分析 、相关分析以及拟合优度分析 。该软件在用户输入关键参数后就会立即给出效应量 。PC-Size: 是一款运行在 Windows 环境下免费的DOS 命令行软件 。包括的统计分析方法有 t 检验 、方差分析 、回归分析 、相关分析以及率的比较 。该软件也可计算效应量 。PS: 是一款运行在 Windows 环境下的免费软件 ,包括的统计分析方法有 t 检验 、卡方检验 、Fisher

34、确切概率法 、McNemar 检验 、回归分析以及生存分析等 。SAS/Power and Sample Size application ( PSS) :该软件运行于 Windows 环境 , 软件附带在整个 SAS 系列内随同安装 。虽然由 SAS 公司开发 , 但包括的统计分析方法非常有限 , 只有 t 检验 、率的比较 、相关分析 、回归分析 、方差分析以及生存分析 。Stata/: Stata 以及 严格说来应该是编程语言而不是现成的软件 。理论上只要编程得当 , 可以实现任何样本量计算的统计方法 。此外 , 还有大量在线的样本量估计软件或程序 , 但对于其正确性和权威性难以一一做评

35、 , 所以还是鼓励( 下转第 733 页 )137中国卫生统计 2015 年 8 月第 32 卷第 4 期示 , 恶性肿瘤 、损伤与中毒 、循环系统疾病是中年人的三大主要死亡原因 , 而且男性死亡人数明显高于女性 。作者认为 , 第一 、确实加强环境保护 ; 第二 、全社会要从社会 、心理和生理的多维角度关爱中年人 , 使中年人具有健康的身心和良好的生活习惯 , 减少疾病发生 ; 第三 、加强劳动安全 、驾驶安全的培训和相关安全制度的落实 , 安全重于泰山 , 尽量减少损伤和中毒造成的死亡 ; 第四 、医务人员要重视健康教育 , 防患于未然 , 努力做到恶性肿瘤等疾病的早发现 、早诊断和早治疗

36、 , 提高医疗质量 ,延长生存期 , 减少死亡率 。参 考 文 献 1 黄裕 . 护理干预对中年人高血压病患者的探讨 . 中国民族民间医药 , 2010, 19( 15) : 221. 2 杨光福 , 王玉章 . 预防中风 中老年未病人群危险度分层及调治 . 医学研究与教育 , 2010, 27( 2) : 54-59. 3 王凤 , 邓冰 . 贵阳市社区中年人健康状况及生存质量抽样调查 .贵阳医药 , 2010, 34( 2) : 169-170. 4 倪如莉 . 老年住院患者死因分析 . 中国医院统计 , 2008, 15( 2) :128-129. 5 杜春花 . 2005 至 2009

37、 某院住院中年患者死亡原因分析 . 中国医药指南 , 2010, 8( 19) : 62-64. 6 中国卫生事业发展情况统计公报 . 卫生统计信息中心 , 2007-05-09. 7 范晓欣 , 曹霞 . 45 岁 -59 岁住院死亡患者统计分析 . 中国病案 ,2010, 11( 8) : 31. 8 周小兰 , 石磊 . 2007 年 -2011 年 3030 例住院死亡患者特征分析 .华西医学 , 2012, 27( 7) : 1032-1035. 9 苑学愚 . 1993-2011 年中老年住院患者死亡病例分析 . 转化医学杂志 , 2012, 1( 2) : 97-99.( 责任编

38、辑 : 邓 妍 )( 上接第 731 页 )使用较为权威的 nQuery 和 PASS 等软件 , 也可依据权威的估计方法的出处自己编程实现 。Q2. 什么情况下可以不做样本量估计 ?对于确证性临床试验 , 均需要进行样本量估计 。对于预试验和探索性试验 ( 如新药临床试验 II 期 ) 可以不做样本量估计 , 但需要说明不做样本量估计的理由 。如果某种标准规定了最少试验例数 , 也可以不做样本量估计 。Q3. 根据样本信息计算检验效能的意义何在 ?检验效能用 1- 表示 , 其中 是 II 类错误概率 。由统计理论可知 , 在由参数决定的总体分布已知的情况下 , 才能计算 ; 而样本信息是无

39、法体现总体参数的 , 因而也就无法根据样本信息计算 , 同样也不能计算真实的检验效能 。因此 , 根据样本信息推断检验效能的大小是不可靠的 , 应当避免 ; 但如果是为进一步研究提供线索倒是可以参考的 。Q4. 亚组分析需要进行样本量估计吗 ?亚组分析是否需要估计样本量应根据研究目的来确定 。若研究目的要确证某一亚组的研究结论 , 如某一新药国际多中心研究 III 期临床试验的目的之一是确证该药对于中国大陆人群的有效性 , 那么该研究方案除了对整体的样本量进行估计外 , 还需要专门针对中国大陆人群这一亚组进行样本量估计 。若研究目的中并没有专门强调要对某一亚组或某几个亚组的研究结论进行确证 ,

40、 则无需针对亚组分析进行样本量估计 。这种情况下 , 即使数据处理结果显示亚组分析有统计意义 , 也不宜看作确证性的针对亚组的结论 。详见CCTS 的相应统计学考虑 。Q5. 注册管理办法所规定的最低样本量与统计学估计的样本量有什么不同 ?注册管理办法所要求的最低样本量主要是基于安全性评价的考虑 , 而基于统计学考虑估计的样本量主要是满足有效性评价的需要 。从上述两个方面确定的样本量很可能不同 , 最终的样本量应选择其中较大者 。参 考 文 献 1 ICH E 10: Choice of Control Group and elated Issues in ClinicalTrials US,

41、 Department of Health and Human Services Food andDrug Administration, 2001 2 ICH E 9: Statistical Principles for Clinical Trials US, Department ofHealth and Human Services Food and Drug Administration, 1998 3 国家食品药品监督管理局 药物临床试验质量管理规范 自 2003年 9 月 1 日起施行 4 CCTS 工作组 , 王彤 , 易东执笔 临床试验中多重性问题的统计学考虑 中国卫生统计

42、, 2012, 29( 3) : 445-450 5 Julious SA Sample Sizes for Clinical Trials Boca aton: Chapman Hall/CC, 2010 6 Machin D, Campbell MJ, Tan SB, et al Sample Size Tables for Clini-cal Studies UK: Wiley-Blackwell 3rdedit, 2009 7 yan TP Sample Size Determination and Power USA: John Wiley Sons, Inc, 2013 8 Cho

43、w SC Sample Size Calculations in Clinical esearch USA:Chapman Hall/CC 2nd Edit, 2008 9 陈平雁 样本量估计及其在 nQuery 和 SAS 软件上的实现 ( 系列论文 19 篇 ) 中国卫生统计 , 2012, 29( 1) -2014; 31( 2) 10 Elashoff JD nQuery Advisor Users Guide Ireland: Statistical Solu-tions Ltd2007 11 SAS Institute, Inc Getting Started with the SAS Power and SampleSize Application North Carolina: SAS Institute, Inc2004 12 Crisp A, Curtis P Sample size estimation for non-inferiority trials oftime-to-event data Pharmaceutical statistics, 2008, 7: 236-244( 责任编辑 : 邓 妍 )337Chinese Journal of Health Statistics, Aug 2015, Vol32, No4

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 统计学

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报