1、医学研究设计: 实验设计,研究设计,实验设计简介,1935年,Fisher 系统介绍研究设计,首次提出研究设计的基本原则。 The Design of Experiments.,RA Fisher(18901962),R.A. Fisher(1925)系统介绍近代统计学方法 The Statistical Methods for Research Workers,研究设计,研究分类,实验研究(experiment) 临床试验(clinical trial) 现场调查(survey),研究设计,实验设计内容提要:,概述 实验设计的基本原则 常用的研究设计,研究设计,1 概述,1.1 研究设计的作
2、用 1.2 研究设计的形式 1.3 研究因素与混杂因素 1.4 研究指标,研究设计,1.1 研究设计的作用,(1) 合理安排试验因素,提高研究质量。如规定实验组的条件,配置适当的对照组,选择研究方法等。 (2) 控制误差,使研究结果保持较好的稳定性。如对混杂因素的处理,对不同来源变异的分析,维护必要的均衡性等。 (3) 通过较少的观察例数,获取尽可能丰富的信息。如采用定量指标,选择线性或非线性回归分析,为使用高效率设计创造条件等。,研究设计,1.2 研究设计的形式,前瞻性与回顾性 试验研究与调查研究 前瞻性试验研究 前瞻性调查研究 回顾性试验研究 回顾性调查研究,研究设计,例:Doll和Hil
3、l 关于吸烟与肺癌关系的研究 (19481952年),回顾性病例-对照研究组别 吸烟 不吸烟 OR P 男 病例 649 2 647 14.043 0.000对照 649 27 622 女 病例 60 19 41 2.466 0.026对照 60 32 28,研究设计,例:Doll和Hill关于吸烟与肺癌关系的研究,前瞻性研究(19511976年)4次阶段小结:1954,1956,1964,1976共随访59600位医生,得到40701位的满意答复。吸烟者死亡率0.9,不吸烟者死亡率0.07, RR12.86。,研究设计,1.3 研究因素与混杂因素,研究因素:主要研究指标,与研究结果(效应)相
4、联系。 混杂因素:干扰研究结果的指标。,研究设计,例:电针引产,研究因素:产妇状况。产妇状况 成功 失败 合计 成功率 初产 428 176 604 70.9%经产 128 39 167 76.6% P=0.145,研究设计,例:电针引产,混杂因素:胎膜状况。胎膜状况 成功 失败 合计 成功率 已破 318 80 398 79.9%未破 238 135 373 63.8% P=0.000,研究设计,例:电针引产,混杂因素在两组的分布胎膜 产妇状况 已破 未破 已破率 初产 331 273 54.80% 经产 67 100 40.12% P=0.001,研究设计,例:电针引产,混杂因素不同状态时
5、,研究因素的分析。胎膜 产妇状况 例数 成功 成功率 P 已破 初产 331 258 77.9% 0.030 经产 67 60 90.0% 未破 初产 273 170 62.3% 0.332 经产 100 68 68.0%,研究设计,常见的混杂因素,年龄、性别 病程、病情 疾病史、家族史、伴发疾病,研究设计,对混杂因素的处理:,采用良好的设计: 排除,平衡;设计时考虑: 改为修饰因素,也能够统计方法进行分析和校正。,研究设计,1.4 研究指标,客观指标与主观指标 定量指标与定性指标 指标的连续性与非连续性,研究设计,例:小儿成长过程之免疫水平变化,组 序: 1 2 3 4 5 6 年龄段:03
6、月6月1岁3岁7岁14岁 缺点:(1) 6个均数,未能形成免疫水平动态变化的完整概念;(2) 各组确切年龄分布不规范;(3) 免疫水平的变化趋势不是简单的线性趋势,如IgG先降后升;分段后可能看不到这种趋势。(4) 总例数60名,而只得到了6个均数,设计效率低。,研究设计,2 研究设计的基本原则,对照(control)随机(randomization)重复(replication),对照的作用 对照的形式 对照组设置的要求,随机化的作用 随机的含义 分层随机、分段随机,重复的作用 重复的次数,研究设计,2.1 基本原则之一:对照(control),均衡性 (1) 对等 除处理因素外,对照组具备
7、与实验组对等的非处理因素。 (2) 同步 对照组与实验组设立之后,在整个研究进程中始终处于同一空间和同一时间。 (3) 专设 任何一个对照组都是为相应的实验组专门设立的。不得借用文献上的记载或以往的结果或其它研究的资料作为本研究之对照。,研究设计,对照组作用示意图,处理组 处理因素+非处理因素 处理效应+非处理效应 对照组 (无) 非处理因素 (无) 非处理效应比较结果 处理因素 处理效应 衬托处理因素的作用。,研究设计,2.2 基本原则之二:随机(random),客观性 (1) 抽样随机 每一个符合条件的实验对象参加实验的机会相同,即总体中每个个体有相同的机会被抽到样本中来; (2) 分组随
8、机 每个实验对象分配到不同处理组的机会相同; (3) 实验顺序随机 每个实验对象接受处理先后的机会相同。,研究设计,随机与随意,随机:random 机会均等, 客观性 随意:as will 随主观意愿,主观性随机化分组,不仅能控制已知的混杂因素(非研究因素),而且还能控制未知的混杂因素。,研究设计,简单随机 随机分组 随机排列分层随机,随机的方法,研究设计,简单随机分组、排列示意,(1) (2) (3) (4) (5) (6) (7) (8) (9) (10) ,136 643 557 604 384 708 218 061 555 871,136 643 557 604 384 708 21
9、8 061 555 871,A B B B A B A A A B,排列(8) (1) (7) (5) (9) (3) (4) (2) (6) (10) ,研究设计,2.3 基本原则之三:重复(repeated),可靠性 (1) 整个实验的重复。确保实验的重现性,以提高实验的可靠性; (2) 用多个实验单位进行重复(样本含量)。避免把个别情况误认为普遍情况,把偶然性或巧合的现象当作必然的规律,通过一定数量的重复,使结论可信; (3) 同一实验单位的重复观察。保证观察结果的精度。,研究设计,影响样本含量的因素,数据的种类 个体的变异 组间的差别 指标间的相关程度 设计方法 各组例数的分配 I型错
10、误和II型错误 研究的质量,研究设计,例:两均数比较时的样本含量估计(两组相等),:I 类误差,常取0.05 :II 类误差,常取0.20,0.10 1- :把握度 :标准差,个体变异 :临床上能接受的最小差别,研究设计,例:两均数比较时的样本含量估计( 两组不等),研究设计,例:降血脂,=20mg/L; =30mg/L;=0.05,1-=90%时Q1:Q2 N 1:1 78 4:6 823:7 922:8 1221:9 2161:19 406,N78时Q1:Q2 1- (%)1:1 90.0 4:6 88.93:7 85.02:8 75.61:9 54.41:19 35.6,研究设计,例:
11、n1 固定, n2 增加时,Power的变化趋势,n1=20Q1:Q2 Power Q1:Q2 Power 1:1 0.5589 1:6 0.78821:2 0.6824 1:7 0.7960 1:3 0.7330 1:8 0.80261:4 0.7601 1:9 0.8074 1:5 0.7769 1:10 0.8113,=20mg/L; =30mg/L;=0.05,研究设计,图 n1固定,n2增加时,Power的变化趋势 ( r = n2:n1 ),power,r,1,2,3,4,5,6,7,8,9,10,.5,.6,.7,.8,.9,研究设计,例:两个率比较时样本含量的估计,研究设计,例
12、:相关与回归分析时的样本含量估计,研究设计,例:相关与回归分析时的样本含量估计,0.05;0.10相关系数 样本含量0.1 10470.2 2590.3 1130.4 620.5 380.6 250.7 170.8 120.9 80.95 7,研究设计,实例1,剖腹产同时放置宫内节育器735例的初步观察将施行剖腹产手术1562例中的735例作为实验组,在剖腹产的同时放置宫内节育器。比较两组被观察对象的术后出血、恶露干净时间和术后副反应等情况。 规定实验组适应症为:破膜和总产程都不超过24小时,无感染(无阳性体征,血常规正常)以及第一胎产后本人同意放置宫内节育器者。 另将筛选剩下的827例作为对
13、照组,不放置宫内节育器。 本例,两组除处理因素(放置节育环)不同,受试对象的基本条件也不同,试验组较好,而对照组差,缺乏可比性。 中华妇产科杂志,1985;20(1):4950。,研究设计,实例2,乳腺癌发病危险因素的研究研究采用病例 对照方法调查607对病例与对照,配对的条件是年龄相仿,上下不超过5岁。原文在未作假设检验的情况下,认为“两组年龄相仿”。 年龄 病例组人数 对照组人数20 3 630 72 8440 193 24450 228 19960 101 67 70 10 72=17.25,P=0.004 中华流行病学杂志,1981;2(4):253,研究设计,实例3,对治疗炎症的某注
14、射液作临床试验,以另一注射液为对照。适应症为生殖道感染疾病或口腔感染疾病。 研究者设计了3个组:试验组:30例生殖道感染,30例口腔感染对照组:30例生殖道感染,30例口腔感染开放组:外科感染疾病28例,滴虫性阴道炎15例。 开放组为了增多试验组病例,研究者将试验组和开放组合并,并与对照组作比较。,研究设计,问题所在,对照组缺乏均衡性!,研究设计,讨论1,欲观察丹栀逍遥散治疗混合性焦虑抑郁障碍的临床疗效,以某西药作为对照组。将64例符合入组和排除标准的病例按诊疗次序交替分组,即单号为中药组,双号为西药组。请讨论:该分组方法是否符合随机原则?,丹栀逍遥散治疗混合性焦虑抑郁障碍的临床研究(河南中医
15、2004年第24卷第8期第62页),研究设计,讨论2,利多卡因手控定量雾化吸入治疗激素抵抗型哮喘的研究目的是观察定量手控雾化吸入利多卡因治疗激素抵抗型(SR)哮喘的疗效。受试者吸入利多卡因3个月,观察治疗前后临床疗效和口服激素减停剂量的情况。,利多卡因手控定量雾化吸入治疗激素抵抗型哮喘的研究(临床内科杂志2004年6月第21卷第6期415页),研究设计,讨论3,通过回顾分析某院1990年1 月至1998 年3 月期间28例单宫颈双子宫畸形早孕人工流产的结果,发现人流术前先给予米索前列醇素制剂可使流产更容易、安全,减少病人痛苦且可避免并发症的发生。 两组的分组方法为:所有病例按就诊先后顺序分组,
16、1995年10月以后为A组,1995年10月以前为B组。A组(米索组)于术前3小时顿服米索600g或术前1小时后穹窿放置米索200g,然后进行人工流产吸宫术,共14例;B组(对照组)单纯采用常规流产术机械扩张宫颈后吸宫。作者认为该法“符合随机分配法则”。 请讨论:对照组的设置是否合适?,单宫颈双子宫畸形28例人工流产分析(中国实用妇科与产科杂志1999年3月第15卷第3期172页),研究设计,问题所在,不符合研究设计三原则!,研究设计,常用的研究设计,完全随机分组设计同质性好,无须控制,完全随机 区组化设计总体同质性差,部分同质性好, 区组化区组控制,区组内随机,研究设计,设计方法分类,单因素
17、 多因素不控制 完全随机设计 析因设计单向区组控制 随机区组设计 裂区设计(重复区组)双向区组控制 拉丁方设计 交叉设计(重复拉丁方) 三向区组控制 希腊-拉丁方设计,研究设计,研究设计(1): 完全随机设计,完全随机设计(completely random design):单向分组,单因素,多水平,研究设计,四种饲料喂养大白鼠后的肝重比值(%),研究设计,方差分析表,Bartlett的方差齐性检验:2=4.069, P0.2,研究设计,两两比较: q检验,D C B A3.3200 3.0975 2.6850 2.4025,研究设计,结论:,方差分析(ANOVA)及SNK两两比较结果表明,四
18、种饲料喂养大白鼠后的肝重比值不完全相同(F=10.40,P0.05)。,研究设计,正确应用完全随机设计,完全随机设计是最常用的一种设计方法,不受组数的限制; 各组样本含量可以相等,也可以不等,但在总样本含量不变的情况下,各组样本含量相等时的设计效率最高; 对照组可以不止一个;各组应达到均衡一致; 各处理组应同期平行进行; 对个体间同质性要求较高 ,在个体同质性较差时,完全随机设计并不是最佳设计,,研究设计,研究设计(2):析因设计,析因设计(factorial design):多向分组:多因素,多水平,研究设计,22析因设计,观察两种药物对大白鼠子宫兴奋的作用。 A药: 0剂量, 0.1mg
19、B药: 0剂量, 1 mg 观察指标:子宫收缩描记高度(mm)。,研究设计,药物对子宫兴奋的作用,研究设计,药物对子宫兴奋的作用,研究设计,22析因设计的方差分析,结论:A药和B药均有兴奋子宫的作用;两者同时使用有协同作用。,研究设计,正确应用析因设计,析因设计各处理组间在均衡性方面的要求与完全随机设计一致,各处理组样本含量应尽可能相同;析因设计对各因素不同水平的全部组合进行试验,故具有全面性和均衡性; 析因设计可以提供三方面的重要信息: 各因素不同水平的效应大小 各因素间的交互作用 通国比较各种组合,找出最佳组合 析因设计比一次只考虑一个因素的实验效率高,比如,22析因设计是一次考虑一个因素
20、实验的1.5倍。从得到的信息来看,它节省了组数和例数; 当考虑的因素较多,处理组数会很大(比如,4个因素各3个水平的处理数为3481种),这时采用析因设计不是最佳选择,可选用正交设计。 析因设计的优点之一是可以考虑交互作用,但有时高阶交互作用是很难解释的,实际工作中常只考虑一、二阶交互作用。,研究设计,研究设计(3):配对设计,配对设计(paired design)总体同质性差,按某种条件配对,对内随机,研究设计,配对的原则,条件相近,对内同质,研究设计,配对设计,对一组胃癌病人先后用两种泌酸刺激剂,然后分别测定其最大酸排量(mEq/h),以分析两药的效果。,研究设计,分析思路:,配对t检验:
21、, Sd=0.6040,t=9.8339, P=0.0000差值的95CI:1.021.57(mEq/h),回归分析回归系数的95CI:0.880.92。,研究设计,五肽胃泌素与加大组织胺的最大排酸量的线性回归,研究设计,结论:,胃癌病人用加大组织胺后的最大排酸量比五肽胃泌素平均多1.30(95%CI:1.021.57)mEq/h; 回归分析显示,五肽胃泌素的最大排酸量是加大组织胺的90。,研究设计,正确应用配对设计,当实验对象的同质性欠佳时,采用配对设计可以提高处理组间的可比性和均衡性; 配对设计的成败取决于配对的条件,只有当两组观察值间的相关大于0时,配对才是成功的,且能提高具有效能; 当
22、采用左右配对设计时,实验因素的效应必须是局部的,不可以通过神经、体液等途径影响对侧; 采用自身前后配对设计时,应考虑到环境、气候或疾病的自然进展等引起的效应改变; 配对设计的资料结合相关或回归分析,有时能得到更丰富的结论。,研究设计,研究设计(4):区组设计,随机区组设计(randomized block design)总体同质性差,部分同质性好, 区组控制,区组内随机是配对设计的扩展,研究设计,随机区组设计,区组内同质、随机,研究设计,单向区组控制示意,研究设计,配伍组设计,将人的血滤液放置不同时间,测定其血糖浓度。放置时间分4种(0,45,90,135分钟),取八个健康人的血液,各分成4份
23、,按配伍组设计,结果见下表。,研究设计,配伍组设计的方差分析,两两比较结果:,研究设计,血滤液的放置时间于血糖浓度的关系,lg (103-Y) = 0.282021+0.006881*Time,研究设计,结论:,人血滤液中的血糖浓度在放置0135分钟期间,随时间的延长而下降,起初下降不明显,而后逐渐加快,成指数下降。,研究设计,正确应用随机区组设计,配伍组设计是配对设计的扩展,在个体同质性较差时,采用配伍设计可以提高各处理组间的可比性和均衡性; 同一区组内的个体应尽可能同质; 当处理因素是温度、时间、浓度、剂量、PH值等连续性指标时,结合回归分析可以提取更丰富的信息。此时处理组应在4组以上;
24、实际上配伍设计是两因素多水平的试验,由于每种组合只作一次试验,故不能分析交互作用; 采用配伍设计时,要尽可能使观察值不缺失,虽然有估计缺失值的方法,但缺失时信息的损失是较大的。,研究设计,常用的研究设计(5),拉丁方设计(Latin square design)双向的区组设计行区组控制,列区组控制方内随机,研究设计,拉丁方设计:双向区组,双向的误差控制,研究设计,拉丁方的随机化 (1、4行交换 2、4列交换),研究设计,Fisher 在Rothamste 农场进行的拉丁方试验。,研究设计,纪念Fisher 的 拉丁方窗户。,研究设计,拉丁方设计,为研究5种防护服对脉搏的影响,考虑到处理的水平数
25、为5,决定用5名受试者,在5个不同日期继续试验。试验按拉丁方设计。,研究设计,拉丁方设计资料的方差分析,结论:五种防护服对脉搏的影响是相同的。,研究设计,常用的研究设计(6),交叉设计(cross-over design)重复的拉丁方设计 交叉设计示意:准备阶段 时期1 清洗期 时期2(run in) 处理A (wash out) 处理B准备阶段 时期1 清洗期 时期2(run in) 处理B (wash out) 处理A,研究设计,22交叉设计,试验研究高剂量(A)和低剂量(B)的阿司匹林对病人胃出血的影响,将16例病人随机分为两组,一组用药顺序为AB,另一组用药顺序为BA,每个病人用药某剂量阿司匹林一周,休息一周后,在再给予另一剂量的阿司匹林一周。试验结果如下。,研究设计,22交叉试验设计的方差分析,A 3.8125 B 2.8875,研究设计,正确应用交叉设计,交叉设计是成组设计与自身配对设计的综合运用,其适用范围与自身配对设计相同; 两个处理因素必须没有蓄积作用(延滞作用),两次处理间应有足够长的间歇期以洗脱延滞效应。 多处理多阶段的交叉设计。,