1、病 因 研 究,流行学常用的病因学研究方法,描述性流行病学:现况调查:提出病因线索,分析性流行病学:病例对照研究:提出或初步验 证病因假设,定群研究:进一步验证病因假设,实验流行病学: 干预性研究:进一步验证病因假说,病因推论,1描述流行病学方法即一般的疾病普查或抽样调查,主要是获得疾病分布特征的特点。如不同的地区、不同人群的死亡水平和死因构成。研究中应注意:交待研究对象的来源、抽样方法、代表性如何,正确选择和计算各种表示频率的指标,对统计学结果的解释不宜任意外延。,2. 分析流行病学方法:包括病例对照研究(回顾性调查)、队列研究(前瞻性调查或纵向随访观察)。主要用于分析可疑病因(组)与疾病发
2、生的相关与否和联系强度的大小。,研究中应注意:研究对象的选择偏性,调查过程中的测量偏性和回忆偏性,结果分析中的混杂偏性。老年队列的特殊问题:超诊偏性、自然筛选(生存偏性)、起始状态复杂多病。,3. 实验流行病学方法:即针对可疑病因采取措施(或治疗)以观察对预防疾病(治疗疾病)是否有效的干预性研究。其设计原则类同临床试验:随机(分组)、(设)对照、盲法(观察疗效)。,病 例 对 照 研 究,例:阴道腺癌的病因研究 妇产科医生 Herbst 等发现:阴道腺癌在其医院近年突然增多,1966-1968年间共发生7例。,1.阴道腺癌是一种罕见病,经文献检索:,阴道癌仅占生殖系统癌 2% ,腺癌又仅占阴道
3、癌 5-10% , (仅为 1-2),1930-65年 M 州总医院和P州医院共 收治68例阴道癌中仅2例为阴道腺癌,2.既往临床所见病例多为50岁以后 该7例, 年龄15-22岁;年龄分布异常!,3.有明显的地区和时间聚集性 ( 1所医院 3年 ),从而提示: 那时在该地区有某种(些)因 素与阴道腺癌的发病有关!,可能有那些因素呢?,1.局部刺激物的致癌作用,7例否认用过任何阴道内刺激物;,1例病后结婚,其余均否认有性接触史;,8例发病前均未服过避孕药。,2.患者年龄小,癌症的潜伏期长,直接接触致癌因子?,或在胚胎期有某种因素起作用?,于是他考虑应调查患者母亲既往及 妊娠期的情况如:流产史、
4、孕期出血 及服药、X线检查等。,要想探索病因,临床医生应如何下手呢?,1. H氏等用这7例病人+1例另一医院同期病人, 2. 每个病人配以4人非阴道腺癌者为对照 对照为同一医院出生5天, 对该40例研究对象及母亲用统一的调查表 由家庭访问员进行问卷式调查,4.统计分析的结果发现:,母亲怀孕时阴道出血 母亲既往流产史 母亲怀孕期用雌激素,在阴道腺癌组的暴露水平明显高于对照组。 而前二者正是母亲孕期服用雌激素的主要 原因,即适应症。因此,作者认为:,母亲孕早期服已烯雌酚 其女儿青春期发生阴道腺癌的危险性,而且,这些病人出生时间与已烯雌酚广泛 用于怀孕期间保胎一致。,根据这一研究结果: FDA撤消了
5、怀孕妇女使用已烯雌酚的批准书。,后期的前瞻性及动物实验研究又提供新证据。,1. 高质量的病因研究由一位临床医生所 完成。,流行病学的思想和方法对临床工作者 的意义:抓住机遇、思想方法、 知识结构。,2. 8个病例配32个对照, 严格设计,不需要 高精尖仪器、人力、财力, 第一流的科研。,启示:,一、基 本 概 念,1、定义:,它是选择一组能代表所研究疾病特征的患者 作为病例组,同时选择一组未患该病但与 病例组有可比性的个体作为对照组;,用同样的方法调查两组对象过去有无暴露于 某种(些)可疑病因的历史及其暴露的程度;,通过分析比较两组对象的暴露史的差别 有无统计学显著性意义;,藉以推断暴露因素作
6、为病因的可能性。,2、特点:,是在疾病发生后进行的;,研究对象是按有病与否分成病例组 和对照组;,属回顾性研究;,由果推因,即发病与暴露的可能关联,只能了解两组的暴露率或暴露水平。,3、结果统计的基本格式: 表1 病例与对照暴露史的比较 病例组 对照组 - 有暴露 a b 无暴露 c d _ 计 a+c b+d,4、研究步骤 1).提出假设 2).制定研究计划 (1).选择病例与对照比较方法: 成组或配比 (2).病例与对照来源和选择方法 (3).病例与对照诊断方法 (4).样本大小估计,(5). 确定调查因素 (6). 调查表的设计 (7). 偏倚估计与控制措施 (8). 调查实施与期中分析
7、 (9). 资料整理与分析的方法 (10).费用概算 (11).人员分工与需要的协作单位,3).培训调查员与预调查 4).实施调查: 不能随意改动调查表 5).资料的整理与分析 6).提出研究报告,二、病例与对照的选择,(一)基本原则:,1.代表性好:病例要是以代表总体的病 例, 对照是以代表产生病例的总体,2.可比性好:两组在主要非研究因素 方面无明显差异,3.诊断明确:金标准或国际、国内统一 标准, 对照亦应肯定排除该病,4.所选对象都必须具有暴露于调查因 素或患该病的可能性,(二)来源: 1.医院人群,病例组:某个/几个医院某一时期内 病人最好连续收集新病例,对照组: 同期、同医院其他科
8、病人,优点:简单易行,合作良好,缺点:代表性不易保证, 选择、入院率 等偏倚,选择偏倚,患者: 在何医院就诊除与患病性质有 关外,还有经济收入,文化水平、 职业、依从性,医院: 对入院的病人也有选择(胸外、肿瘤等),研究者:诊断标准的选择,2.一般人群: 病例:某地区(单位)某时期全人群中 的全部病例或随机抽样样本 对照:与病例同一人群人中随机选择,优点:代表性较好 偏倚小,缺点:资料不易收集,费时费力(普查 基础、疾病报告、登记),3.两类人群联合应用: 以医院为基础的研究,可另设一个人群对照,当病例组分别与医院对照和人群对照的比较结果相接近,则可靠性,并具有了一般人群的代表性。,表 各危险
9、因素的冠心病比值比 危险因素 冠心病组 医院对照 OR 人群对照组 OR + - + - + - 高血压史 84 57 29 98 4.98 29 98 4.98 冠心病家族史 33 108 8 119 4.45 11 116 3.22 吸烟 85 22 59 34 2.23 58 35 2.33 饮酒 69 72 57 70 1.18 59 68 1.11 精神刺激史 47 94 17 110 3.24 22 105 2.39,(三)病例组与对照组间的配比,目的:控制某些外部特征的混杂效应,保证可比性。,混杂效应:除研究因素以外的其它因素 (与暴露或疾病有关)在两组间分布不均, 掩盖或夸大所
10、研究因素与疾病的联系。,方法:,1.组间配比:两组例数可不等,但有关混杂 因子在两组间的频数分布要相 似(X2 、t检验),2.个体间配比(配对):病例:对照按一定比 例(1:2:4),配对条件: 年龄、性别、职业(特殊:居 住地、文化程度等),配比过度: 1).对照选择因难、工作量 2).将有意义的因素配对:信息丢失、结果偏移,例: 吸烟高血压冠心病,(四)其他非研究因素的处理 研究因素也叫内部变量 研究以外的因素称外部变量 控制外部变量的方法有二:,1.选择研究对象时加以限制,完全限制:对病例与对照均加以限制 部分限制:配比法,以混杂因素作为配比条件,2.分析资料时加以调整:分层分析,多因
11、素 Logistic模型分析等,三、资料收集,2. 统一标准: 诊断、暴露状态划分, 项目调查的执行定义,1确定调查项目(拟定调查表) 一般项目: 外部特征人口学等 核对项目: 诊断、医院、日期、住院号 调查项目: 研究的因素:客观、定量 要求: 项目齐全 指标恰当 突出重点 便于统计,3.培训调查员:减少调查偏倚 要求: 客观、实事求是 任务: 询问填表、收集资料(病历、 人口登记)、收集血标本,4.核对质控: 调查结果抽样复查、录音核对 信息偏倚:调查时间、环境程序一 致或接近、理化(血清学) 指标检测:采取盲法,四、结 果 分 析,资料的检查、核对、补漏 。可靠性、准确性评价。 (一)均
12、衡性检验: 是检验病例组与对照组在研究因素以外的其他主要特征或混杂因子方面有否可比性(X2 、t),举例:Doll 与Hill有关吸烟与肺癌的病例对照研究 表 肺癌病人和配对对照病人的均衡性 - 比较项目 肺癌数 对照数 比较项目 肺癌 对照 男 女 男 女 男女总数 男女总量 年龄 访问地区 - 25 17 3 17 3 伦敦 1035 1035 35 116 15 116 15 布里斯托尔 73 73 45 493 38 493 38 剑桥 36 36 55 545 34 545 34 利兹 58 58 6574 186 18 186 18 纽卡斯尔 263 263 合计 1357 108
13、 1357 108 合计 1465 1465,- 社会阶层 居住地区 - 1 39 53 伦敦 791 900 2 165 172 其他地区 225 181 自治城市 3 750 720 其他都市区 275 213 4 172 198 农村 155 164 5 231 214 外国 19 7 合计 1357 1357 合计 1465 1465 - Doll和Hill, 1952年,(二)研究因素与疾病的联系及强度分析 资料形式:,分组资料 配对资料,2 值: 相关与否,OR及95%可信限: 联系强度,AR PAR: 归因于暴露的比例,剂量反应关系分析,统计学分析:,相对危险度(relative
14、 Risk, RR) 暴露人群(组)某病发病(或死亡)率 概念= - 非暴露人群(组)某病发病(或死亡)率 但病例对照研究中仅能得到暴露者和非暴露者的比数比例(odds Ratio, OR)。当病例组和对照组的代表性较好,人群发病率较低时 OR 可作为 RR 的估计值,其公式: a/c ad OR = - = - b/d bc,含义为:危险性的估计 意义:衡量暴露因素与疾病联系强度的指标 OR1 正相关 危险因素 (OR3) OR1 负相关 保护因素 OR=1 无联系 显著性检验: OR 95%可信限 表示暴露者患某种疾病的危险性较无暴露者高的程度。通过可信限估计, 可以更精确地说明危险性的可
15、信范围。,五、样本量的估计,(一)意义: (二)有关数值 1.暴露率(exposure rate) 2.相对危险度(relative risk, RR): OR 3.值 4.把握度(power): 1-,(三)、方法 (P 91) 1.查表法 例:为了研究西安市肺癌与吸烟的关系,欲进行一次病例对照研究。已知西安市普通人群中吸烟率P0为40%, OR为3.0, 定为0.05,把握度定为0.90, 问需要多少病例与对照? 结果:病例对照各71例 (71 x 152014)82-85 例 共计: 170例 2.公式法 3.预试验法 4.累积法,六、优 缺 点:,优点: 1.所需样本量小,病例容易找到
16、,因 此工作量小,所需人力物力少,易 进行,出结果快; 2.尤其适合一病多因的研究 3.适合于病因复杂、发病率低,潜伏 期长的疾病研究,4.其他: 如: (1).Nested case-control study 具有 前瞻研究的功效 (2).研究药物疗效的改良的病例对照 研究 (3).评价筛检试验效果的病例对照研究,缺点: 1.回忆偏倚 2.不能计算RR值,Passive smoking at work as risk factor for coronary heart disease in Chinese women who have never smoked. 英国医学杂志 BMJ 19
17、94; 308:380-4.,59 女性不吸烟的冠心病病例(19891992年间在西安3个附属医院确诊的心肌梗死和冠脉造影显示冠脉狭窄75%) 126 非CHD对照 (同期、同医院的内外科住院者,运动ECG排除)中国妇女的被动吸烟率:家庭 46、工作场所 34% 不吸烟女性患冠心病的风险升高: 家庭 110%工作场所 145%双重暴露 280% 剂量效应关系:被动吸烟量愈大 患病风险愈高、AS程度愈严重 人群归因危险度是 20%,七、病例对照研究中的几个技术问题,1资料收集过程中的偏倚 很易产生偏倚,主要是测量偏倚 1).回忆偏倚:不可避免,但可估计其 大小 2).倾向性: 双盲, 调查录音,
18、表: 两 次 询 问 吸 烟 量 (支/日) 比 较 第 二 次 询 问 第一次询问 0* 1 5 15 25 50 计 _ 0 8* 1 9 1 4 1 5 5 1 13 3 17 15 4 9 1 14 25 1 3 0 4 50 1 1 计 8 6 18 13 5 0 50 _ *吸烟量 *人数,2混杂因素作用的估计 分层分析的方法 举例:食道癌病因研究,表 饮酒者中病例与对照的吸烟史 - 吸烟 不吸烟 计 - 病例 265(a) 63(b) 328(n1) 对照 151(c) 107(d) 258(n2) - 计 416(m1) 170(m2) 586(N) - 265107 ORSD
19、+ = - = 2.98 63151,表 不饮酒者中病例与对照的吸烟史 - 吸烟 不吸烟 计 - 病例 44 63 107 对照 57 136 193 - 计 101 199 300 _ 44136 ORSD - = - = 1.67 6357,表 饮酒与不饮酒者OR值齐性检验时数据归纳表 _ ORi Yi Wi WiYi WiYi2 饮酒者 2.98 1.09 28.08 30.61 33.37 不饮酒者 1.67 0.51 15.75 8.03 2.09 _ 43.83 38.64 35.46 _ (WiYi)2 2 = WiYi2 = - Wi,表 按饮酒分层后合并的吸烟 2 和 OR
20、- ai E(ai) V(ai) 2 - 饮酒者 265 232.85 27.79 33.63 不饮酒者 44 36.02 15.42 3.63 _ 309 268.87 45.21 _ 合并 2 = 34.74 合并 ORM-H = 2.42,3配比研究中OR的计算方法 表 1:1配比研究中疾病与暴露的关系 _ 病 例 对照 有暴露 无暴露 _ 有暴露 a b 无暴露 c d _ 2 = (b-c -1)2 / b+c OR=c/b,表 1:2配比研究中疾病与暴露的关系 - 病 例 对 照 暴 露 史 暴露史 + + - - - _ 有 a b c 无 d e f _ c-E(c)+b-E(
21、b) -1/22 2 = - (df=1) V(c)+ V(b) E(c)=1/3(c+e) V(c)=2/9(c+e) E(b)=2/3(b+d) V(b)=2/9(b+d) b+2c OR= - 2d+e,4用于非病因研究的病例对照研究 表 1. 死亡原因与利多因预防用药的关系 利多卡因 存活者 死亡者 用 55(36%) 50(33%) 未用 96 101 计 151 151,表2 死亡原因与利多卡因预防用药的关系 - 存活 不 同 原 因 的 死 亡 病 例 利多卡因 对照 因室颤 因心衰或其他原因 - 用 47(35%) 5(14%) 24(35%) 未用 89 30 44 136
22、35 68 OR 3.17(1.20-8.17) 0.97(0.53-1.76) 2 5.41 0.1 _,表3 使用利多卡因与按心肌梗塞严重度分层 后的室颤死亡的关系 _ 危险性较小的心梗 危险性较大的心梗 利多卡因 存活者 死亡者 存活者 死亡者 _ 用 18(25%) 2(12%) 29(45%) 3(17%) 未用 53 15 36 15 计 71 17 65 18 _OR 2.55(0.5511.89) 4.03(1.1414.17) 2 1.44 4.65 _,队列(群组)研究,一、概述 队列研究(cohort study)也称定群研究或群组研究,是流行病学验证病因假设的常用方法之
23、一。,观察两组中某病 的发生或死亡,暴 露 组,未暴露组,定 期 随 访,统 计 分 析,比较暴露因素与疾病的发生是否有关,实例:Harold 风疹与先天性畸形的关系 研究对象:1956-1957 2年间 在英格兰和威尔士的孕妇 暴露组:妊娠期患过风疹的孕妇 578 人 非暴露组:妊娠期未患过风疹的孕妇中随机抽2%, 共 5717 人。 追踪观察她们所生婴儿,直至2岁结局 诊断:各组中患先天畸形的患儿,诊断各组中患先天畸形的患儿结果: 表 孕妇感染风疹对胎儿的影响 疾病 暴露组 未暴露组 发生率 (%) (%) RR 流产率 5.0 2.4 2.1 死亡率 4.5 2.4 1.9 先天畸形 6
24、.8 2.3 3.0,可从表中发现: 孕妇感染风疹后对流产率、死亡率,特别是先天畸形率都有影响。说明妊娠期风疹感染可导致婴儿先天畸形。,与病例对照研究方法比较: 确定研究对象是否暴露(因)发病(果) 又称“前瞻性研究”(prospective study)。 而病-对是先确定是否患病(果)暴露(因) 又称“回顾性调查” (retrospective study) 如将两类研究结合起来,即所谓“回顾前瞻性研究”.,历史性队列研究,回顾比较应用两种冠脉支架 1年期靶血管血运重建(TVR)情况,共1558例;观察至今。 暴露组为1年前使用紫杉醇药物释放冠脉支架,非暴露组为1年前使用雷帕霉素药物释放冠
25、脉支架; 比较两队列的TVR临床结果,差异无显著性(P=0.23) 但在糖尿病患者中, TVR发生率以紫杉醇支架的方法明显低于雷帕霉素支架的方法(2.8% vs 8.5,P=0.004)。 先决条件:研究对象需有完整的暴露记录、疾病或死亡结局记录。优点是省时省力,资料收集及分析可在较短时间内完成;缺点是暴露与结局跨度时间长,偏倚大。,过去 现在 将来 前瞻性队列研究:从现在追踪到将来 回顾性队列研究:从过去的暴露追踪到现 在的结果 双向性队列研究:从过去某一时点的暴露 史追踪到将来某一时点的结果,群组研究的特点:,1. 在疾病发生前进行,2. 研究对象根据暴露分组,3. 追踪观察的是两组间的发
26、病或死亡 率差异,4. 由因推果,5. 论证的强度优于病例对照研究,二. 研究人群的选择: 1研究对象选择的要求: 1).人口数量足、稳定、 愿意合作、流动性较小、 便于追踪观察今后疾病发 生 或死亡的情况,2). 能较准确地提供有关危险因素的暴露史 (文化程度、某种暴露的环所或可能) 或医疗机构健全、医疗条件好、医学 资料 较完整。 3). 暴露组要有较高的暴露率和暴露水平, 所研究疾病的发病或死亡率较高。 4). 非暴露组暴露程度较低 , 而且在其它 方面可比。,2.种类 1). 同一人群中选: .暴露:有唇腭裂病家族史的孕妇。 .非暴露(内对照) :无此家族史的孕妇。 观察2组胎儿出生后
27、唇腭裂及先天畸形 的发生率 最近国外很盛行的“围产期医学”的研究 内容和方法之一,有短、平、快的特点。,2). 特殊暴露人群: 职业或居住环境中的因素 非暴露组: .平行对照:其它职业或居住地的 非暴露人群 一般人群对照:用当地全人群的发 病率或死亡率作比较。,3). 其它: 多组对照 平行的多组对照:不同治疗方法 人群的多组对照:不同职业、年龄 暴露水平不同组间对照 最低水平作标准 血压水平 血脂水平:人群血清甘油三酯的数值分布三等份,低TG水平(0.9mmol/L)、中等TG水平(0.91.23mmol/L)和高TG水平(1.24mmol/L)组,以低TG水平组为非暴露组。,三. 资料收集
28、 1.暴露史资料: (1).首先要有判别暴露与否的客观标准 (吸烟、刷牙) (2)资料来源: .填写调查表:吸烟、饮酒、刷牙方式 .查阅现成资料: 病历、劳保登记 .医学检查或检验: 血脂 .环境中有害因素的测量: 大气、饮水,2.随访: 定期 尽大力减少失访 (10%)下结论要谨慎 若20,则研究的真实性值得怀疑,四. 资料分析 队列研究中的统计指标 1.发病率、死亡率的计算: (分母是人-时:人-月或人-年) 2.暴露人年的计算: 观察人数 观察年数,2.相对危险度(relative Risk, RR) 概念: RR = I0/I a/N0 c/N1 (真正含义),=,3. 特异危险度或归
29、因危险度 (attributable risk ,AR) 是指暴露组的发病(死亡)率I1与非暴露组的发病(死亡)率I0之差。 表示暴露者中完全由某暴露因素所致的发病率或死亡率。 AR = I1 - I0 或= I0(RR-1),例. Doll 和 Hill调查了英国35岁以上男性医生吸烟习惯与肺癌死亡率的关系: 不吸烟组暴露人年为15107, 死亡数1人, 年死亡率0.07%; 重度吸烟者(25g/日以上)的暴露人年为23415, 死亡数为34, 年死亡率1.66%。 RR=1.660.07=24 AR=1.66%-0.07%=1.59% 表明:吸烟者中,由于吸烟所致的肺癌 发病率为 1.59
30、%,4特异危险度百分比(AR%): 表示暴露者中由暴露所致的发病率或死亡率(I1 - I0)占暴露者发病率或死亡率(I1)的百分比。 (I1 I0) RR - 1 AR% = - 100% 或 = - 100% I1 RR,按上例数据计算 1.66-0.07 AR%= 100% = 95.8% 1.66 它表示吸烟组中有95.8%的肺癌是由吸烟所致。,5. 人群特异危险度百分比(PAR%): 表示人群中由于暴露所致的发病率或死亡率占人群发病率或死亡率的百分比 Pe (RR-1) PAR% = 100% Pe (RR-1)+1 Pe:人群暴露率,用上例数据,且当男性人群的吸烟率为60%: 0.6
31、(24 - 1) PAR % = -100% = 93.2% 0.6(24-1)+1 表示英国男性医生中肺癌的93.2%是由吸烟所致。 PAR%不仅考虑了暴露因素的RR,而且与某因素在人群中的暴露率(Pe) 有关。其公共卫生学意义是:完全控制该暴露因素后人群中某病发病(或死亡) 率可能下降的程度。,资料分析的基本框架,计算暴露组与非暴露组的疾病(或预后结局)发生率(或生存率、病死率、治愈率等)定量效应指标的变化情况(血压、血脂的下降) 采用适当的统计学方法比较及检验两组(或多组)间的差异(卡方检验、t检验和方差分析、Kaplan-Meier生存分析、多元数学模型分析等) 评价暴露因素与疾病(或
32、预后)结局的因果关系。,Triglyceride (甘油三酯)and CHD (冠心病) mortality in a 24-year follow-up study in Xian, China. Ann Epidemiol 2004;14:1-7,流行学常用的病因学研究方法,描述性流行病学:现况调查:提出病因线索,分析性流行病学:病例对照研究:提出或初步验 证病因假设,定群研究:进一步验证病因假设,实验流行病学: 干预性研究:进一步验证病因假说,病因推论,流行病学研究的时间概念,现在,过去,将来,病例对照研究,定群研究,回顾前瞻研究,干预性研究,1.联系的时序性:先因后果 2.联系强度: OR RR 成正比 剂量效应关系:经趋势检验证实 生态学相关:三间分布的一致性 干预的有效性,确定因果联系的条件(P 236),3.联系的可重复性: 不同情况下的研究得相同的结果 4.联系的合理性 5.研究设计的因果论证强度 “联系的特异性”:有助于因果联系的判 断,但不作为排除因果联系的依据,小结 1、病例对照研究设计的核心:病例的代表性和对照的可比性; 2、临床实用价值大:病因线索多,无专科限制,高水平论文的孕育点(与国外差距不大),许多临床大家的关注点; 3、可操作性强:一病多因或多病多因,资料易得,病人配合,时间可长可短,指标可多可少(可易可难)。,