1、,朱 益 民 浙江大学医学院 流行病与卫生统计学系,病例对照研究 case-control study,流行病学研究基本方法,某单位某日发生许多腹泻病人,初步调查发现可能与该单位食堂就餐有关。如何调查此次事件的病因?,问 题,以目标人群中患有某种疾病的人(病例组)和未患该病或正常人(对照组)为研究对象,调查过去暴露于某个危险因素的情况及程度,比较两组暴露史的差别,以分析暴露因素与疾病有无关联以及关联程度的大小。,一、病例对照研究原理,对照组,a,b,c,d,是否患病,过 去,A/(a+b),c/(c+d),暴露率,人数,暴露状况,现 在,病例组,病例对照研究模式图,病例对照研究的特点,属于观察
2、性研究方法回顾性研究从果到因研究,二、病例对照研究的设计,1. 明确研究目的,提出假设,病例对照研究主要检验某因素与疾病之间的关系。通过查阅文献和描述性研究,提出研究假设-选题。检验性病例对照研究:吸烟与肺癌?农药接触与乳腺癌?探索性病例对照研究:无假设型,筛选青年女性阴道腺癌研究;肥胖相关的遗传易感性研究(全基因组),病例定义 在研究时已经患病的人。诊断标准代表性 疾病分型和严重程度病例来源医院:一家或多家医院已明确诊断病例。社区人群:普查结果;疾病发病或死亡登记报告资料。病例类型新发病例:回忆偏倚低;代表性好;受生存因素影响少;易合作现患病例死亡病例:易发生Neyman bias,2. 病
3、例选择,对照定义:研究时不患所研究疾病的人,包括其他病人和健康人 设立对照目的 排除非研究因素的影响 选择原则:代表性、可比性、暴露不能作为选择对照的依据。 对照来源以人群为基础的病例对照研究以医院为基础的病例对照研究,3. 对照选择,匹配概念 选择对照的方法,使对照在某些因素的分布与病例组保持一致。 匹配因素 常用的配比变量有年龄、性别、居住地、出生地、社会经济水平、民族、病情轻重、疾病类型。一旦被匹配后,就无法分析该匹配因素与疾病的关系。 匹配作用 增加病例组与对照组的均衡性与可比性。控制外部因素,消除非研究因素的作用,提高提高研究效率。 匹配类型:群体匹配和个体匹配,4.病例和对照的匹配
4、,频数匹配(frequency matching),在选择对照组时,使某些因素在对照组中与病例组中的分布在整体上相同。,年龄、性别、种族等分布一致,N2 对照,N1 病例,成组病例对照研究,实例:绿茶与子宫内膜癌的病例对照研究,按年龄频数匹配后,病例组和对照组年龄的分布,成组病例对照研究资料整理表,根据病例组中每个个体的匹配因素的特点,选择与其相匹配的对照。配比的病例对照研究,个体匹配 (Individual matching),controls,cases,配比的病例对照研究: 1 case: R controls 配对病例对照研究 1 case: 1 control研究效率,如何在病例数受
5、限的条件下,如少见病或罕见疾病,进行病因研究?,对照数量和研究效率,配对病例对照数据整理,配对病例对照研究的对子类型,实例:青年女性阴道腺癌的病因调查,1966-1969年波士顿Vincent纪念医院收治7例阴道腺癌患者,年龄15-22岁; 通常阴道癌占女性生殖系统肿瘤的2,而阴道腺癌仅占阴道癌的510;以往阴道腺癌的年龄均在25岁以上; 因此,这7例异常病例:肿瘤类型异常;时间、地区分布异常集中;年龄分布异常 分布差异提示了线索:该地区有某些因素与阴道腺癌异常发病有关。,病例组:8例(同地区另一医院一例),均经病理确诊; 对照组:每个病人配4个对照,共32个对照,选自与病例同一医院(病房)出
6、生、出生日期与病例前后不超过5天的女青年。 调查:设计几十种有关因素,对病例组、对照组及其她们的母亲进行了调查。研究因素包括母亲年龄、吸烟史、母亲以前流产史、此次怀孕阴道出血史、母亲怀孕期间使用过己烯雌酚激素的情况、哺乳史和妊娠期间射线接触史等。,研究背景,研究设计,研究结果,把不应该匹配的因素进行匹配,不仅增加了工作难度,而且使病例组和对照组在这个因素的分布人为一致。如果该因素与研究因素也存在联系,就可能使研究因素和疾病之间的关联减弱或消失。如在研究饮酒与食管癌关系时,吸烟是否应该作为匹配因素?,匹配过头(Overmatching),5、病例对照研究的样本含量,影响样本含量的因素 被研究因素
7、在对照人群中的暴露率(率越高样本越小)。 估计该因素造成的相对危险度(RR)或暴露比值比(OR) OR越大样本越小。 需要达到的检验显著性水平,=0.01样本大于=0.05。 把握度1-:把握度要求越高样本越大。 设计类型:成组设计和配比设计,p0和p1:对照组和病例组的估计暴露率 p1=(ORp0)/(1p0+ORp0); q0=1p0,q1=1p1; P=(p0+p1)/2, q=1p;,成组设计的病例对照研究样本含量估计,例:拟用病例对照研究方法研究吸烟与肺癌的关系,预期吸烟者肺癌的危险性OR=2,人群吸烟率约为20%,=0.05,=0.10,估计样本量n。,p1=(ORp0)/(1+p
8、0(OR-1)=(0.2*2)/(1+0.2*(2-1)=0.33,http:/ M = m/pe pe p0q1+p1q0 M为研究需要的总对子数,pe 为病例组和对照组暴露情况不一致的对子数出现的频率。 p0和p1分别是人群中估计的暴露率和病例组估计的暴露率。,1:1 配对病例对照研究的样本含量,对每一种暴露因素必须有严格的定义,并尽量与其他研究者的定义一致,以便相互比较。 根据研究目的精选暴露因素 回顾性方法调查暴露状况:问卷调查、查阅记录、电话访问等。 制定调查表,6、暴露资料的收集及测量,Never smokers were defined as subjects who had n
9、ever smoked or had smoked fewer than 100 cigarettes in his or her lifetime. Former smokers reported a history of smoking but had stopped at least 1 year before being diagnosed with lung cancer (or 1 year before enrollment in the study, for control subjects). Current smokers were currently smoking or
10、 had stopped smoking less than 1 year before being diagnosed with lung cancer (or less than 1 year before enrollment in the study, for control subjects).,吸烟的标准,四、病例对照研究资料分析,(1)资料整理:核对、分组、归纳、数量化。 (2)描述性统计分析: 研究对象的一般特征,如描述年龄、性别、职业等的分布频率; 资料均衡性检验。 (3)分析病例组与对照组之间有关因素的暴露率有无显著性差异 (4)暴露与疾病的关联强度分析。,1、病例对照研究
11、分析一般步骤,一般情况和均衡性比较,年龄:1515-45-65-,病例组 对照组 2 P,性别: 男女,疾病类型:,分析病例组与对照组的暴露率有无显著性差异?,3.84, P6.63, P0.01,2、成组病例对照研究的资料分析,相对危险度(RR):反映暴露与疾病发生(发病或死亡)关联强度的指标,危险比(risk ratio ),在病例对照研究中 RR一般无法计算,联系强度的计算,优势(odds)是某事件发生(暴露)与未发生(非暴露)的概率之比。反映病例与对照在暴露程度上的差异。,比值比 ( Odds ratio,OR ),优势比(OR),如所研究疾病的发病率较低 (5%),可用比值比来估计相
12、对危险度,比值比的计算,OR的95%可信区间,Woolf法:LnOR的95%可信区间,Miettinen法:,例 Doll和Hill关于吸烟与肺癌关系的病例对照研究,Doll 和Hill研究男性吸烟与肺癌关系,每日吸烟量0 1 5 15 合计 肺癌 2 (c) 33(a1) 250(a2) 364(a3) 649(n1) 对照 27(d) 55(b1) 293(b2) 274(b3) 649(n2) 合计 29(mo) 88(m1) 543(m2) 638(m3) 1298(n) OR 1.0 8.10 11.52 17.93,2趋势检验, 自由度为1,2=43.15, 自由度3, P0.00
13、1,剂量反应关系分析,2趋势检验, 自由度为1,Xi为每个暴露水平,在上一例中: T1=1625T2=8002T3=1625V=164.00392=40.01v=1,P0.01,(5)分层分析,(3)分析病例组与对照组的暴露率有无显著性差异,a,b,c,d分别代表病例和对照配对的对子数,3. 配对资料分析,联系强度OR=c/b,如把上述资料拆成成组资料:,选择偏倚:选入者与未选入者某些特征上存在差异引起 入院偏倚、现患-新发病例偏倚、检出征候偏倚、时间效应偏倚等 信息偏倚:收集信息时由于测量及获得数据的方法不正确而造成。回忆偏倚、测量偏倚 混杂偏倚:,五、病例对照研究中的偏倚,六、病例对照研究的特点,病例对照研究的优点,所需时间短,人力、财力、物力省,易组织实施、易出结果 适用于少见病的研究 一次病例对照研究可调查多种因素与疾病的关系。病因筛选,病例对照研究的缺点,样本代表性差 暴露资料准确性较差 不能计算RR和发病率,不能直接估计联系强度(只能计算OR),服用反应停与短肢畸形发生的关系,比值比 OR=1288/(382)=13.9,谢 谢!,