1、1第五章 队列研究第一节 概述 队列研究 (cohort study)也称前瞻性研究 prospective study,随访研究 follow-up study,纵向研究 longitudinal study 等。暴露 结局(疾病)一、基本概念 队列研究的 重要概念 队列 cohort 暴露 exposure 危险因素 risk factor 保护因素 protective factor1、 队列的概念:拥有同一属性的某一组人。a) 2013 年南京市常住人口b) 2010 年到 2014 年南医大注册的所有学生c) 出生队列 birth cohort:出生于同一时期的人组成的特殊队列1)
2、队列可以是流动(有人员出入)的,也可以是固定的(相对固定,没有人员流动,成员不可以同时是非成员)2、 暴露的概念:研究对象接触过的某种待研究的物质,或具有某种待研究的特征或行为。(理解)物质:病原体、毒物。 。 。特征:年龄、性别、血压、血糖。 。 。行为:吸烟、饮酒、工作类型。 。 。二、基本原理 选定一组研究人群,根据过去或目前的暴露情况进行分组 有无暴露因素:暴露组和非暴露组 暴露因素的水平:低、中、高剂量组 随访观察各组的观察结局(发病或死亡) 比较各组发病率或死亡率的差异,从而判定暴露因素与发病有无因果关联及关联大小队列研究的特点:1、研究对象是还没出现研究结局,但 有可能出现研究结
3、局 的人群(susceptible population)需设立纳入及排除标准 剔除已生病个体或明确不会生病的个体 在进行传染病危险因素的研究时,需考虑个体被感染的几率2、属于观察性研究,根据暴露的自然存在状态分组,无人为控制,也不存在随机分组3、时间顺序:从“因”到“ 果” ,可确定因果关系(疾病发生之前已经确定了研究对象的暴露情况)4、 前瞻性研究,可计算发病率、死亡率等率的指标三、队列研究的用途 检验病因假设 是主要用途和目的2 评价预防效果 研究疾病的自然史 新药的上市后监测四、队列研究的类型1、 前瞻性队列 prospective cohort也称即时性或同步性 (concurren
4、t) 队列开始研究时确定对象、分组,经随访得到结局 优点:资料准确 缺点:样本大,花费大,时间长建立队列时要特别考虑能否负担得起,能否获得想要的结果!2、 回顾性队列 retrospective cohort也称历史性 (historical) 或非即时性 (non-concurrent) 队列研究开始时疾病结局已发生,研究对象是过去进入队列的,分组依据的是过去的暴露资料 优点:省人、物、时 缺点:依赖历史资料的完整与可靠,常缺乏混杂因素的资料3、 双向性队列 ambispective cohort历史队列后继续进行前瞻性队列 最适合于对人体健康同时具有短期和远期效应的暴露因素研究第二节 研究
5、设计与实施一、确定研究因素队列研究最主要的目的:进一步验证现况调查或病例对照研究中已发现的有特异影响、且在统计学上有联系的危险(或保护)因素。暴露因素分类:1)暴露水平:定量标准化,累积暴露2)暴露方式:短期/长期、直接/ 间接、持续/间隔二、确定研究结局结局变量 outcome variable也称结果变量,是随访中将出现的预期结果事件,也即研究者希望追踪的事件,是希望观察的自然终点,并非观察期的终止。 (结局是队列研究观察的终点,也就是研究对象已达结局变量就停止对其的观察;观察期是整个队列研究的时长,整个队列中研究对象不止一个人) 研究结局的确定应全面、具体、客观发病、死亡、指标变化。 。
6、 。 结局变量的测定应有明确统一的标准,并在研究全过程中严格遵守三、确定研究现场和研究人群(一)研究现场:可行性+ 可靠性+ 科学性 有足量研究对象 领导重视 群众配合 交通方便3 文化水平、医疗卫生条件好(二)研究人群:即队列的建立 人口相对稳定,方便进行随访 医疗卫生记录较完整、容易查询 无明显的环境污染 被研究的疾病发病率较高 被选择人群的合作程度好、领导支持1、 暴露人群的选择 一般人群:常见暴露因素研究 特殊人群:对罕见因素暴露的高危人群如 职业人群:联苯胺致膀胱癌 染料厂工人石棉致肺癌 石棉厂工人特殊暴露人群:放射线与白血病 原子弹爆炸受害者,放射治疗者等有组织的团体:一般人群的特
7、殊形式2、对照人群的选择 可比性 内对照 internal control:先选择一组研究人群,然后根据暴露情况进行分组选择对照容易,但易受暴露污染(可比性好) 外对照 external control:选择职业人群或特殊暴露人群为暴露组,则需在该人群外去寻找平行的对照组可避免暴露污染,但难度较大 总人口对照 total population control: 以全人口率为对照,也称一般人群对照资料较易获得,但不与暴露组平行,可比性差,暴露组也可能包括在内使用时需进行率的标化 多重对照 multiple controls: 同时采用上述多种对照可减少一种对照带来的偏倚,但工作量大四、确定样本量
8、决定因素:1、一般人群(非暴露组的)所研究疾病的发病或死亡率(P 0) ,P 0 越接近 0.5,样本越大2、暴露组与对照组人群发病率之差 d= P1- P0, 暴露组疾病的发病或死亡率(P 1) ,或相对危险度(RR)估算 P1,d 越大,样本越小3、显著性水平:第一类错误概率 4、把握度(1-): 为第二类错误概率注意事项: 一般对照组样本数暴露组的样本数 估计失访对数据分析的影响,一般按估计样本量增加 10%作为实际样本量五、资料的收集与随访1、 基线资料收集 baseline data暴露的资料,个体的其他信息来源:1)查阅各种常规记录 2)调查询问 3)医学检查 4)环境测量2、 随
9、访 follow up 随访的目的 确定分母的信息 4研究对象是否仍处于观察中 确定分子信息 确定研究人群结局事件的发生 相关资料的收集 有关暴露和混杂因素的资料 随访方法 以调查表为工具 常规记录或档案 定期调查,进行特殊安排的随访 环境调查与检测 观察终点(endpoint) 、随访期限和时间间隔明确开始时间与终止时间 失访(losses to follow-up)的问题 观察终点 endpoint研究对象出现了预期的结果,可不再随访 研究对象未出现预期结果,但无法继续随访,则认为失访 失访的情况在资料分析时作为结尾数据(censored data)六、质量控制 调查员的选择 调查员培训
10、制定调查员手册 监督每一次随访都是一次现况调查第三节 资料的整理与分析基本步骤 描述性分析,描述研究对象的组成、随访的经过、随访时间、结局的发生情况、失访情况等,并对两组的一般情况做均衡性检验 两组率的描述、比较,进行关联强度的计算 根据上述结果和研究中可能存在的偏倚,作出解释一队列发病率的计算1、累积发病率 cumulative incidence,CI 定义:某一固定人群在一定时期内某病新发生例数(D)与时期开始时总人数(N)之比 前提:研究人群数量比较多,人口比较稳定,资料整齐 公式: NCI 组 别 发 病 数 未 发 病 数 发 病 率 暴 露 组 a b )(ba 非 暴 露 组
11、cddc合 计 )(D /D 52、 发病密度 incidence density, ID 前提:队列为一动态人群,人口不稳定,观察人数变动较大(失访、迁移、死于它病、中途加入等)发病密度(ID)=观察期内的发病人数/观察人年数人时的概念观察人数乘以随访单位时间的积人时是将人数和时间结合起来考虑的一种度量单位,它是观察人群中全部个体暴露于研究因素的时间总和时间单位常用年,故又称人年数(person-years)意义:既说明该人群发生的新病例数,又说明该人群的大小和发生这些例数所经历的时间3、 标化比 standard mortality ratio,SMR标准死亡率就是全人口的死亡率SMR1,
12、说明暴露导致或促进了结局的发生SMR. 强 危 害 作 用(Grenbrg,1984) dcbaIARoe )1(Io%10)%(eoIARP暴露组的死亡率)(otIIPAR7It 为全人群某病发病(死亡)率 ; Io 为非暴露组的某病发病(死亡)率5、 人群归因危险度百分比 Population attributable risk percentage ,PARP 或 PAR概念:人群中因暴露于某因素所致的发病(死亡)占人群发病(死亡)的百分比,也即说明消除该因素后产生预防该病的效果占多大比重,具有公共卫生学意义,说明暴露的社会效应 公式:PAR 和 PAR%既与 RR 和 AR 相关,也与
13、人群中暴露者所占的比例相关RR 和 AR 很高,但 PAR 和 PAR%不高,说明某因素对全人群影响不大,但对高危人群影响很大,可对高危人群重点防制RR,AR, PAR 和 PAR%都很高,说明某因素对全人群的影响很大,宜全民防制Eg: AR%=(Ie-I0)/Ie=93.30%说明在感染 HBV 的男性中,93.30%的 HCC 死亡病例是由于感染了 HBV 造成的PAR=It-I0=1.38/10 万人年说明在全人群中,因为 HBV 感染造成的 HCC 死亡率为 1.38/10 万人年PAR%=(It-I0)/It=66.67%说明在全人群中,66.67%的 HCC 死亡病例是由于感染了
14、HBV 造成的 PAR=1.38/10 万人年,说明如果能够消除 HBV 感染,可以减少的 HCC 死亡率为1.38/10 万人年 PAR%=66.67%,说明如果能够消除 HBV 感染,全人群中 66.67%的 HCC 死亡病例可减少6、 剂量-反应关系的分析 率的趋势性检验 有剂量-效应关系,暴露作为病因的可能性越大第四节 队列研究的偏倚及控制1、选择偏倚 selection bias有人拒绝参加有些人档案丢失或记录不全早期病人在开始时未能发现研究对象由志愿者组成,其健康水平或习惯特征与总人群有差异队列研究特有的选择偏倚 失访偏倚 losses to follow-up队列研究不可避免的偏
15、倚,破坏了原有样本的代表性,一项研究的失访率最好不超过 10%原因:迁出、外出、不再合作、死亡影响:失访率、失访者特征、两组失访差异控制方法:尽可能提高研究对象的依从性 健康工人效应 health-worker effect在研究职业暴露因素时以一般人群为对照组时产生的偏倚,暴露组为健康工人,发病率或死亡率较低控制方法:不采用一般人群为对照,选择除暴露因素外其他因素一致的职业人群为对照;资料分析时对期望死亡数进行校正。%10toIPAR82、信息偏倚 information bias最常见的为错分偏倚 misclassification bias:暴露错分、疾病错分、联合错分原因:仪器不准、检
16、验技术不熟、定义不明影响:无差异错分、有差异错分控制方法:质量控制, “盲法”测量3、混杂偏倚 confounding bias由于混杂因子造成的偏倚控制方法:匹配、分层分析、多因素分析第五节 队列研究的优缺点优点 随访收集资料 ,一般不存在回忆偏倚 可直接计算发病率或死亡率,得到 RR, AR 等关联强度指标,充分分析暴露因素的效应 因在前果在后,检验病因假说的能力强 可评价一种暴露因素与多种疾病的关系 适于疾病自然史的研究,适于罕见暴露因素的研究缺点 不适合发病率低的疾病病因研究 随访时间长,失访偏倚对结果的影响较大 随访过程中变量的变化对结局影响大,研究设计要求高,资料收集和分析困难多 研究费时间、费人力、费物力,组织与后勤工作艰巨