1、病例对照研究广东药学院 王德全 教授,病例对照研究 case control study,有比较才有鉴别 凭差别方知根源,病例对照研究是分析流行病学研究方法中最基本、最重要的的研究类型之一,是验证病因假说的重要工具,是一种由果及因的回顾性研究方式。,前 言,基本原理是以确诊的患有某种特定疾病的病人作为病例,以不患有该病但具有可比性的个体作为对照,通过询问、实验室检查或复查病史,搜集既往各种可能的危险因素暴露史、测量并比较病例组与对照组各因素的暴露比例,经统计学检验该因素与疾病之间是否存在统计学关联。,在评估了各种偏倚对研究结果的影响之后、再借助病因推断技术,推断出某个或某些暴露因素是疾病的危险
2、因素而达到探索和检验疾病病因假说的目的。,第一节 概述 第二节 病例对照研究的类型 第三节 实例 第四节 病例对照研究的实施 第五节 数据资料的整理与分析 第六节 偏倚及其控制 第七节 优缺点 第八节 新的研究类型 第九节 小结,基本概念 特点,第一节 概述,基本概念,选择患有某特定疾病的病人作为病例,以不患有该病但具有可比性的个体作为对照,调查他们发病前对某个(些)因素的暴露情况,比较两组中暴露率和暴露水平的差异,研究该疾病与这个(些)因素的关系,第一节 概述,暴露研究对象曾经接触过某些因素,或具备某些特征,或处于某种状态,这些因素或状态即为暴露因素,它可以是有害的,也可以是有益的,也叫研究
3、变量,特 点,疾病发生后进行 分成病例组与对照组暴露是由研究对象从现在对过去的回顾 由果推因 分析暴露与疾病的联系,第一节 概述,图1 病例对照研究原理示意图,调查方向:收集回顾性资料,比较 人数 暴露 疾病,病例,对照,+,+,a,c,b,d,第一节 概述,表1 病例对照研究资料整理表,OR:(a/c)/(b/d)=ad/bc,第二节病例对照研究的类型,(一)病例与对照不匹配 (二)病例与对照匹配,(一)病例与对照不匹配,又称成组比较法,按与病例组可比的原则,根据样本的大小,选择一定数量的对照,数量不需成严格的比例关系,但对照的数量等于或多于病例,(二)病例与对照匹配,匹配或称配比(matc
4、hing),即要求对照在某些因素或特征上与病例保持一致,目的是对两组进行比较时排除匹配因素的干扰 分类频数匹配个体匹配,匹配法(matching) 分类 频数匹配(又称成组匹配) 匹配因素所占的比例在对照组与病例组一致 个体匹配 给每一个病例选择一个或几个对照,配成对(pair)或配成伍,使对照在某些因素或特征(如年龄、性别等)方面与其相配的病例相同或基本相同,匹配法注意事项 慎重选择匹配因素 可疑病因决不能作为匹配因素 比例一般为1:1,也可以 1:2,甚至1:3或 1:4,最多不超过1:4 匹配的因素不宜过多 ,避免发生“匹配过度(overmatching)” 增加工作的难度,( 年轻女性
5、阴道腺癌与母亲妊娠期服用乙烯雌酚的关系)研究背景研究步骤研究结果,第三节 实例,乙烯雌酚,阴道腺癌,研究背景,美国波士顿Vincent纪念医院妇产科医生Herbst在发现,19661969年收治7例阴道腺癌患者,均为15岁22岁女青年。通常阴道癌占女性生殖系统癌的2%,阴道腺癌仅占阴道癌的5%10%,非常罕见,而这7例全是腺癌;过去年龄均大于25岁,而这7例全在15岁22岁之间,第三节 实例,Herbst对阴道腺癌危险因素进行探索 7例病人加上另一个医院的例阴道腺癌患者作为病例组 每个病人配4个对照,共32个对照 调查员用标准调查表对病例、对照与她们的母亲进行了调查,经统计学处理后的主要结果见
6、表1,研究步骤,第三节 实例,表2 阴道腺癌病例与对照的母亲主要暴露因素的比较,研究结果,第三节 实例,研究结果,在比较的因素中,只有三个因素有显著差别 母亲怀孕期间使用过己烯雌酚激素治疗 (P0.00001) 母亲以前流产史(P0.01) 此次怀孕阴道出血史(P0.05) 因有后两个因素存在才使用己烯雌酚治疗 做出结论:母亲在妊娠早期服用己烯雌酚使她们在子宫中的女儿以后发生阴道腺癌的危险性增加,一、提出假设 二、选择适宜的对照形式 三、病例与对照的来源与选择 四、样本含量的估计 五、资料的来源与收集,第四节 病例对照研究的实施,一 提出假设根据以往疾病分布研究或现况调查结果并结合文献,提出病
7、因假设,第四节 病例对照的实施,二 明确研究目的,选择适宜的对照形式原则 广泛探索病因,采用不匹配或频数匹配 罕见病采用个体匹配 1:R的匹配法,R值不宜超过4形式 成组比较法 匹配法,第四节 病例对照的实施,三 病例与对照的选择 基本原则 代表性 病例能代表总体的病例 对照能代表产生病例的总体人群或源人群 可比性 两组主要特征方面无明显差异,第四节 病例对照的实施,病例的选择,1.要求 诊断可靠,尽量使用金标准 选择确诊的新病例 2.来源 总体人群中的全部病例或者随机样本人群中的全部病例 医院住院或门诊的病例,第四节 病例对照的实施,对照的选择,1.要求 候选对象必须来自产生病例的总体 对照
8、一旦发生所研究的疾病便成为病例 组的研究对象 2.来源 研究的总体人群或抽样人群中具有代表性的 非病例 医院中患有其他疾病的病人 亲属、邻居、同事、同学等,第四节 病例对照的实施,四 样本含量的估计 (一)有关参数 (二)估计方法 (三)举例,第四节 病例对照的实施,(一)有关参数 病例组的暴露率(P1 )和对照组暴露(P0 ) 优势比(odds ratio, OR) 值 把握度1-,第四节 病例对照的实施,(二)方法 查表法 公式法: 近似公式:,第四节 病例对照的实施,(三)举例为研究西安市肺癌与吸烟的关系,欲进行一次病例对照研究。已知西安市普通人群中吸烟率 P0为30%,OR为5.0,为
9、0.05,把握度为0.90、值查表,Z为1.64, Z为1.28,第四节 病例对照的实施,代入公式得:病例组与对照组,各需28人 代入近似公式计算,所得结果与原公式接近,第四节 病例对照的实施,五 资料来源与收集 (一)资料来源 (二)调查的含义及实施时遵循的原则 (三)调查表,第四节 病例对照的实施,(一)资料来源 医院病案记录,疾病登记报告等摘录检测病人的标本或病人的环境获得 对病例或对照的询问调查中取得,第四节 病例对照的实施,(二)调查的含义及实施时遵循的原则 含义是信息传达、接受和反映的过程,是属于行为科学的范畴 ,被调查者要通过感受、回忆、思维、联想和反映等过程来回答问题 原则 调
10、查表的设计需要各专家参加讨论 调查员要经过严格的培训 调查员手册 监督与审查,第四节 病例对照的实施,(三)调查表定义也称“调查问卷”,通过把拟收集的数据项目用 恰当的措词构成一系列问题的答卷,是资料收集的最主要工具 内容 调查表的名称、编号 一般项目:姓名、性别、民族等 研究项目:研究变量,疾病史、吸烟史等 结尾部分:调查员签名、调查日期等,第五节 资料整理与分析,均衡性检验 计算OR分层分析与多因素分析推论因素与疾病关联,一 均衡性检验比较病例组与对照组在研究因素以外的其他主要特征方面有否可比性,两组非研究因素均衡,其暴露率的差异与发病有关,第五节 资料整理与分析,二 计算OR OR又称优
11、势比,比值比,交叉乘积比指病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值 公式OR:(a/c)/(b/d)=ad/bc,第五节 资料整理与分析,OR特点 与RR一样,优势比反映暴露者患某种疾病的危险性较无暴露者高的程度 如果能满足2个条件所研究疾病的发病率(死亡率)很低 病例对照研究中所选择的研究对象代表性好OR RR,第五节 资料整理与分析,(一)成组比较法分析 2 检验 传统的四格表的专用公式 antel-Haenszel (M-H)方法 OR计算与可信限的估计及其意义,第五节 资料整理与分析,OR 95%C.I.=,95%的可信范围是在2.183.78之间,例
12、:食管癌发病因素的研究(表3),第五节 资料整理与分析,1. 2 检验 四格表的专用公式,M-H法公式,第五节 资料整理与分析,其中E() 为a的期望值;V()为a的方差,两种方法计算结果一致,表明吸烟与食管癌有联系,但联系强度如何,要计算OR,第五节 资料整理与分析,2.OR计算与可信限的估计及其意义Miettinen法的OR可信限:结果表明吸烟者患食管癌的危险性是不吸烟者的2.87倍,95%的可信范围是在2.183.78之间,第五节 资料整理与分析,(二)1:1配对资料的分析 匹配资料是由病例与对照结合成对子,列成表4的格式,表内的数字a、b、c、d 是病例与对照配成对的对子数公式,第五节
13、 资料整理与分析,表4 1:1配对研究中疾病与暴露的关系,OR 95%C.I.=,例:食管癌发病因素的男性研究资料(表5)表5 93对男性食管癌与对照的吸烟史,第五节 资料整理与分析,95%的可信范围是在1.8410.08之间,表明男性吸烟者患食管癌的危险性是不吸烟者的4.3倍,95%的可信范围是在1.8410.08之间,第五节 资料整理与分析,三 混杂因素作用的估计与分层分析分层分析的方法识别混杂因素 进行齐性检验 计算合并OR与2值,第五节 资料整理与分析,例:在表3资料886例食管癌病人与对照中有586例饮酒2 =31.9, OR=2.29因此饮酒与食管癌有联系,而生活中饮酒与吸烟关系密
14、切,所以饮酒可能是混杂因素分层分析统计学估计其作用大小,第五节 资料整理与分析,1.按饮酒与否进行分层,表6 按饮酒与否分层分析食管癌与吸烟的关系,第五节 资料整理与分析,饮酒者中吸烟的OR (2.98)稍高于不分层时OR(2.87)不饮酒者中吸烟的OR(1.67)较低 表明饮酒是混杂因素,加强吸烟的作用,.进行齐性检验 消除饮酒与否的影响,就要计算这两组人群合并的与OR值,而在此之前必须先作齐性检验 齐性检验可参照有关书籍 两组人群OR值没有明显差别,用统计学方法消除混杂作用影响,求合并OR值,有显著差异,不宜再计算合并OR值 本例齐性检验的结果无显著差异,第五节 资料整理与分析,3.计算合
15、并OR与2值 合并合并,第五节 资料整理与分析,表7 食管癌与吸烟关系的病例对照整理表,第五节 资料整理与分析,合并,合并,提示 合并2与合并OR较未调整的2 (55.5)与OR(2.87)为低,但吸烟与食管癌之间仍有统计学意义 饮酒是吸烟与食管癌之间的混杂因素, 能加强吸烟的作用,第五节 资料整理与分析,第六节 偏倚及其控制,1. 选择偏倚 2.信息偏倚 3.混杂偏倚,1.选择偏倚由于选入的研究对象与未选入的研究对象某些特征上存在差异而引起的误差 2.信息偏倚在收集整理信息过程中由于测量暴露与结局的方法有缺陷造成的系统误差 3.混杂偏倚研究某个因素与某种疾病的关联时,由于某个既与疾病有制约关
16、系,又与所研究的暴露因素有联系的外来因素的影响,掩盖或夸大了所研究的暴露因素与疾病的联系,1.选择偏倚 种类 入院率偏倚 现患病例-新发病例偏倚 检出征侯偏倚 时间效应偏倚,入院率偏倚定义也叫Berkson偏倚,当利用医院病人作为病例和对照时,对照是医院的某一部分病人不是全体目标人群的一个随机样本,病例只是该医院或某些医院的特定病例不是全体病人的随机样本,所以难免产生偏倚,特别是因为各种疾病的入院率不同导致病例组与对照组某些特征上的系统差异控制 合理地选择病例与对照 从总体人群中选择所有或绝大多数符合诊断标准的病例 从各医院中选取病例,从多病种中选择对照,第六节 偏倚及其控制,表8 不同人群骨
17、和运动器官与呼吸道疾病之间关系的OR值,举例:在一般人群中和住院病人中研究骨和运动器官疾病与呼吸道疾病之间的关系,由于研究来源的不同,OR值不同,(Sacket BJ,1979),现患病例-新发病例偏倚 定义又称奈曼偏倚,如果调查对象选自现患病例,即存活病例,可能得到更多的信息,但是其中很多信息可能只与存活有关,而未必与该病的发病有关,从而高估了某些暴露因素的病因作用;另一种情况是,某病的幸存者改变了生活习惯,从而降低了某个危险因素的水平,或当他们被调查时夸大或缩小了病前生活习惯上的某些特征,导致某一因素与疾病的关联误差控制调查时明确规定纳入标准为新发病例,检出征侯偏倚 定义也称暴露偏倚,病人
18、常因某些与致病无关的症状而就医,从而提高了早期病例的检出率,致使过高地估计了暴露程度而产生的系统误差 举例1975年Ziel所做的妇女服用复方雌激素与子宫内膜癌关系的病例对照研究:服用复方雌激素的妇女因导致阴道出血而就医,故被发现有早期子宫内膜癌的机会增多,从而得出复方雌激素与子宫内膜癌有关联的错误结论 控制延长收集病例的时间,超过由早期向中、晚期发生的时间,时间效应偏倚 定义对于肿瘤、冠心病等慢性疾病,从开始暴露于危险因素到出现病变往往经历一个较长的时间过程,因此那些暴露后即将发生病变的人、已发生早期病变而不能检出的人、或在调查中已有病变但因缺乏早期检测手段而被错误地认为是非病例的人,都可能
19、被选入对照组,由此而产生了结论的误差 控制 尽量采用敏感的疾病早期检查技术 开展观察期充分长的纵向调查,2.信息偏倚种类 回忆偏倚 调查偏倚,回忆偏倚 定义病例对照研究主要是调查研究对象既往的暴露情况,由于被调查者记忆失真或不完整造成结论的系统误差 原因与调查时间和事件发生的时间间隔、事件的重要性、被调查者的构成以及询问技术有关 控制 选择不易为人们所忘记的重要指标做调查 重视问卷的提问方式和调查技术,调查偏倚 来源 调查对象 调查者 原因病例与对照的调查环境与条件不同调查技术、调查质量不高或差错以及仪器设备的问题 控制 采用客观指征 认真做好调查技术培训 采取复查等方法做好质量控制 检查条件
20、尽量一致 使用的检查仪器应精良,3.混杂偏倚 特点不易识别,不易确定,需认真细致地去解决 控制的方法 匹配法分层分析法 多因素分析,第六节 偏倚及其控制,第七节 优缺点,优点,样本量小,病例易获取,工作量不大,所需人力、物力较少,易于进行,出结果快 可同时对一种疾病的多种病因进行研究 适合于对病因复杂、发病率低、潜伏期长的疾病 可以对治疗措施的疗效与副作用做出初步评价,易受回忆偏倚的影响 选择合理的对照较困难 结果的可靠性不如队列研究 不能计算暴露与无暴露人群的发病率,缺 点,第八节 新的研究类型,巢式病例对照研究 病例-队列研究,1巢式(套式、嵌入式)病例对照研究(nested case c
21、ontrol study) 按队列研究的方式进行,收集每个队列成员的暴露信息及有关混杂因素,确定随访期内发生的病例作为病例组,对照来自同一队列,然后进行病例对照研究,资料来源: 叶冬青.巢式病例对照研究的设计及分析J疾病控制杂志,2001 ,5(1):68,实 例,2病例-队列研究(case-cohort study) 又称病例参比式研究(case-base reference study) 原理研究开始时在队列中随机选取一组样本作为对照,观察结束时,队列中出现被研究疾病的所有病例作为病例组 特点可以同时研究几种疾病,不同的疾病有不同的病例组,对照组是同一组随机样本,两者的比较 相同对队列中的
22、每个成员进行观察与分析 不同对照是随机选取,不与病例进行匹配 对照如发生被研究疾病,既为对照又为病例1个随机对照组可同时和几个病例组比较,两者的优点按队列研究设计进行,资料收集在发病前,故因果关系清楚,资料可靠,论证强度高 资料处理与分析按病例对照研究的方式,省时省力省钱 兼有病例对照研究与队列研究两者之优点,巢式病例对照研究的优点:统计效率高统计方法常用收集资料简便病例-队列研究的优点:对照随机选择,代表性好对照选择不受时间限制,选择快一组对照可同时与几种病例组比较,1.病例对照研究(case-control study, case reference study)是分析流行病学最基本、最重
23、要的研究类型之一回顾性从果查因的研究方法,是在疾病发生之后去追溯假定的病因因素2.病例对照研究的四大要素人群、对照、病例和暴露明确产生病例的人群,从中正确地挑选对照,并正确地收集暴露资料是病例对照研究的精髓,小结,3.对照不必代表所有未患研究疾病的病人,同样也不必代表所有总体人群病例不必代表患有该种疾病的全部病人,也不可能做到这一点4.选择病例原则符合病例的定义,就应当收入病例组,不受其暴露状态的影响,避免产生选择偏倚,5.新发病例比现患病例好 回忆暴露及暴露与疾病的时序关系时更明确 新发病例与现患病例暴露分布没有差别,也可用现患病例 研究先天畸形和某些非致死性慢性疾病,如肥胖、糖尿病等用现患病例 死亡病例省时省钱,很快可以提供研究线索,6.正确地选择对照是病例对照研究成败的关键病例的来源决定了对照的来源可比性比代表性更重要7. 资料质量的可比性与病例和对照成员之间的可比性一样重要注意两组收集资料时资料质量的可比性,以保证研究的真实性,8. 基本分析方法是比较两组暴露比例,计算暴露优势比,估计患病的优势比,在发病率低的情况下估计相对危险度9. 对照所患疾病不应与研究的暴露因素有关 对照疾病的发病率在暴露的各类别或各水平上都一样 病例是新诊断的病例,对照不应是慢性病患者,