1、,临床研究的基本原理,1、病人抽样(样本),2、分组,3、疗效测量,4、疗效评价得出结论,5、将样本结论推广到目标人群,总体,人群中推广应用:既有临床意义,又有统计学意义!,设计时应考虑的主要统计学问题,研究假设/研究设计类型(研究目的得到) 主要疗效/安全性评价指标 对照组 基线的均衡可比性(随机、盲法) 试验例数(样本量) 检验效能(把握度) 正确及保守的统计分析方法,研究假设,由研究目的决定试验设计类型 优效性设计(superiority) 非劣效性设计(non-inferiority) 等效性设计(equivalence),优效性设计(Superiority),经典临床研究目的,证明
2、新药物 / 医疗器械 / 治疗方法,优于 阳性药物(安慰剂)/ 医疗器械 / 标准治疗方法,泮托拉唑静脉输注-消化道出血内镜治疗的辅助治疗:一项前瞻性、随机、对照研究,优效性设计,评价方法P值可信区间法:表示总体均数或率的变化范围(Confidence Interval, CI)95%CIs: 出错的概率 5%例:有效率:80%(95%CI: 68% - 87%),优效性设计评价方法,高优指标(有效率) 组间疗效差(T-C)的95%CI的下限0 低优指标(事件发生率) 组间疗效差(T-C)的95%CI的上限0,优效性试验评价方法 率差,优效,Null AlternativeHo H1Infer
3、ior Superior0T-C,(,率比:瞬时风险比(HR)、比数比(OR)一般为低优指标试验组与对照组发生事件风险(T/C)的95%CI 的上限 1,优效性试验评价方法率比,0 1,优效性试验评价方法(HR,低优指标),优效成立,ORT/C,优效不成立,95%CI上限,点估计,12,泮托拉唑静脉输注显著降低再出血发生率、补救治疗、输血单位、住院天数,RRR: 65% ARR: 12% NNT: 8,CHARM: 心血管死亡,0,1,2,3,年,5,10,15,20,25,30,%,0,安慰剂,必洛斯,HR 0.88 (95% CI: 0.79-0.97) RRR=12%, p=0.012,
4、3.5,有危险的例数 必洛斯 3803 3563 3271 2215 761 安慰剂 3796 3464 3170 2157 743,必洛斯使心血管死亡的风险降低12%,优效设计难度巨大,验证优效的难度较大 安慰剂对照研究不符合伦理/不可行 技术上没有新突破,与非常有效的药物对照,疗效差异很小,非劣效试验(Non-Inferiority trial),T可以比C差一些,但不能差太多(临床可以忽略不计) 阳性药物对照临床试验 差别:非劣效界值(,margin) 验证:试验药物/器械疗效不劣于某种已知的有效药物/器械(同样有效),非劣效试验评价方法,高优指标 两组疗效差/风险比的95%可信区间下限
5、 -M低优指标 两组疗效差/风险比的95%可信区间上限 M,非劣效,Null AlternativeHo H1Inferior Noninferior - 0T-C,:临床认可的非劣效界值,非劣效试验评价,解释,A,主要终点差异 vs. 对照组,B,C,D,E,F,双侧检验 Alpha = 5%,非劣效界值,非劣效且比标准治疗好,0 2,服用泮托拉唑 不增加患者MI复发危险,等效,Null Alternative NullHO H1 HONon-Equivalent Equivalent Non-Equivalent( )- 0 T-C,研究目的和试验设计类型,试验设计的类型不同 样本量计算方
6、法不同 疗效/安全性评价方法不同,主要疗效(安全性)评价指标,能被直接观察、客观地测量(例:死亡率、心梗复发率、手术成功率)应能回答研究问题、对产品应用有直接影响 (例:射频消融导管: 5分钟刺激成功率)尽量不选主观评价指标(生活质量)最大限度降低获得虚假结论的可能性,主要评价指标(主要终点),尽量设置唯一的主要评价指标 其余指标 一律归入次要疗效指标样本量仅基于主要指标!,主要研究终点,24,与安慰剂相比,泮托拉唑输注治疗能更有效降低再出血事件发生主要研究终点再出血事件发生率,是否有对照品?,一个好的临床试验应该设置对照组 将可评价偏倚降到最低 以便可以清楚、客观的评价器械的疗效,是否有对照
7、?,例:研究某药物治疗铅中毒的驱铅效果将铅中毒工人脱离现场后住院治疗的结果列出来分析,发现无论是“血铅”还是“尿铅”的数值,治疗后都明显低于治疗前,得出差异有统计学意义的结论自身对照研究,未排除患者自动排泄的影响,将人体自身排泄的血铅量和尿铅量都归功于驱铅药物的效果,自身前后对照,自身前后对照(最好不用) 无法区分是干预的效果,还是疾病自愈的效果 即使有效,仍无法定位所研究器械的疗效,对照的选择,对照人群 对照人群应与研究人群在重要的患者特征和影响因素上是可比的除了使用的器械不同外,其它方面应尽可能相同(基线均衡),对照品?,阳性对照(非劣效/等效性试验)目前临床正广泛使用的、对相应适应症的疗
8、效已被证实、得到社会公认的有效器械阴性对照(优效性试验)安慰器械(但必须符合伦理学要求),基线的均衡可比性,控制偏倚的重要措施随机,设计良好的随机对照临床试验永远是金标准 - 提供比其他任何试验都要高的数据质量- 最大限度降低治疗偏倚治疗的效果是由所研究被试产品产生的, 而不是由于疾病自愈、人为因素或其它治疗产生,临床研究的证据级别,随机对照、双盲试验,符合伦理 & 临床可行 最大限度进行 随机对照试验,控制偏倚的重要措施随机,推荐采用中央随机系统 (互联网、电话、传真),互联网(IWRS) 电话 (IVRS),中央随机系统,基线数据,36,P 0.05:组间有差异?,P 0.05:组间无差异
9、?,Propensity Score,PS=0.2,PS=0.5,PS=0.7,Treatment Control,Propensity Score,Before Matching,After Matching,样本量,例:前瞻性研究,伐尼克兰和尼古丁替代制剂对于无症状轻度COPD患者戒烟的疗效对比研究通过我院体检中心、戒烟门诊和张贴广告招募符合上述条件的患者共60名,随机分入伐尼克兰组和NRT组,每组30例,药物用法均按厂商提供的说明书进行,,计算依据?如果组间无差异,结论?,试验设计时 必须有样本量计算依据!,样本量计算依据?,方案中是否有样本量计算依据?P 0.05: 两组器械确实无差异
10、(实质等同) 检验效能不够(病例数太少),样本量估计的基本要素,无效假设H0(非劣效、优效、等效 ) 基于无效假设中的结果变量(连续、离散) 对照组主要疗效/安全性评价指标的效应(文献) 与对照器械相比,估计合理的组间治疗差异(),由临床专家估计 显著性水平() 检验效能(1-) 单、双侧检验,非劣效界值的确定,由临床专家和统计学家共同确定 两均数比较时,通常为对照组均数的1/3至1/2 对照组标准差的1/4 两率比较时,不得超过对照组有效率的10% 应提供选择某值的理由,显著性水平,按照惯例,显著性水平: 0.05(双侧) 0.025 (单侧)若重复100次同样的试验,将至少有95次试验结果
11、与本次试验结果相同(最多仅有5次结果不同),检验效能(power),检验效能(把握度)将差异正确检出的能力把握度不得低于80%,主要疗效指标定性(简化),优效/非劣效等效, :有临床意义的率差(由研究者、临床医生确定) 注:优效性试验时,=0单组试验时,pc为一目标概率,(Z+Z)2Pc(1-Pc)+PT(1- PT) -(PT-PC)2 (Z+Z/2)2 Pc(1-Pc)+PT(1- PT)-(PT-PC)2,n =,n =,两率相同,主要疗效指标定量,优效/非劣效等效,:两组合并方差 :有临床意义的差值(由研究者、临床医生确定) 注:优效性试验时,=0;单组试验时, C为一目标值,2(Z+
12、Z)2 2 -(T-C)2 2(Z+Z/2)2 2 -(T-C)2,n =,n =,两值相同,f(, )值表,多终点事件时样本含量的计算,多终点事件(心梗、死亡、脑卒中) 对每一个结果变量轮流计算样本量 选择最大的样本量 尽量不设多终点(考虑I型误差),样本量设计时考虑失访率?,质量很差的试验:失访率超过20% 统计效能(把握度)会随患者的失访而降低 样本量计算时应考虑,研究方案中样本量的描述?,根据文献XXX记载,当对照组成功率为98%,治疗与对照两组成功率差不超过5%时,认为两组疗效相当。则当评价其差的统计学显著性水平为0.05、把握度为80%、考虑10%的脱落时,每组至少应入选140例患
13、者。参考文献:作者,文章标题,发表杂志,刊登日期。,泮托拉唑研究样本量设计,The sample size estimation was based on an expected rate of re-bleeding of 20% after emergency endoscopic therapy. The trial was designed to detect a 33% difference in favor of the pantoprazole infusion with a type I error of 0.05, and a type II error of 0.8. At
14、 least 98 patients were required for each group.,Abbreviations: ACS, acute coronary syndrome; CV, cardiovascular; MI, myocardial infarction; UA, unstable angina.,正确且保守的统计分析方法,主要终点:Cox比例风险回归模型,所有随机入组患者进行意向性分析 (Intention-To-Treat, ITT),57,小 结,符合统计学原则的临床研究是 研究结果能够推广的基础! 临床意义 & 统计学意义 指导临床实践!,谢谢!,李卫 Email: liweimrbc-,