收藏 分享(赏)

生存分析(2012年).ppt

上传人:精品资料 文档编号:11280714 上传时间:2020-03-09 格式:PPT 页数:67 大小:5.96MB
下载 相关 举报
生存分析(2012年).ppt_第1页
第1页 / 共67页
生存分析(2012年).ppt_第2页
第2页 / 共67页
生存分析(2012年).ppt_第3页
第3页 / 共67页
生存分析(2012年).ppt_第4页
第4页 / 共67页
生存分析(2012年).ppt_第5页
第5页 / 共67页
点击查看更多>>
资源描述

1、生存分析 Survival Analysis,主 讲:杨永利 单 位:公共卫生学院卫生统计学教研室,前边介绍的logistic回归只考虑终点事件的出现与否,但在恶性肿瘤、慢性病或其他情况的随访研究中,有时除考虑终点出现与否,还需考察观察对象达到终点所经历的时间长短。 生存分析是将终点事件的出现与否和达到终点所经历的时间结合起来进行综合分析的一种方法,源于古老的寿命表。,讲 授 内 容,第一节 生存分析基本概念 第二节 生存曲线的估计 第三节 生存曲线的比较 第四节 cox回归分析,生存时间 生存分析常用描述指标,第一节 生存分析基本概念,在临床医学中, 对病人疗效考查: 治疗结局? 生存时间?

2、,一、生 存 时 间,问题1 某肿瘤患者5年生存率观察人数 生存人数 A组: 20 0 B组: 20 0OR=?,一、生 存 时 间,问题2 如何计算平均数 1)手术到死亡时间3 7 15 20 25 26 30 平均生存时间 mean=18 2)3 9 15 20 25+ 27 30+中位生存时间 median=20 3)3 9+ 15 20 20+ 26 30+?,生 存 时 间,问题3 如何综合评价? 两组间的比较:A 3 6 8 10 22 26 30 30B 6 8 10 20 30 30 30 30,生 存 时 间,完全数据的均数: Mean(A)=12.5 Mean(B)=11.

3、0,以30天为界的分类结果:死亡 生存 A 6 2 B 4 4,生 存 时 间 的 概 念,终点事件 死亡 出现故障 治愈 复发,起始事件 生物生存 电脑开始使用正常 疾病产生 疾病治愈,生存时间(survival time)可以广泛地定义为从规定的观察起点到某一特定终点事件出现的时间长度。,生 存 时 间 三 要 素,观察起点 终点事件 时间的度量,随机对照临床试验的观察起点通常是随机化分组的时间。 观察性研究中,观察起点可以是发病时间、第一次确诊时间或接受正规治疗的时间。 终点事件可以是某种疾病发生、某种处理的反应、疾病的复发或死亡等。,随访研究(follow-up study)示意图,【

4、例题】,某医院泌尿外科医师选择1996-2000年间经手术治疗的膀胱肿瘤患者,对可能影响膀胱肿瘤术后生存的因素进行了调查,随访截止日期为2000年12月30日。,事件(event):研究者所规定的生存时间的终点。 完全数据:随访研究中,在规定的观察期内,对某些观察对象如观察到了终点事件发生,从起点到终点事件所经历的时间,称为生存时间的完全数据(complete data)。,删失数据(censored data):又称截尾。随访研究中,在规定的观察期内,对某些观察对象由于某种原因未能观察到终点事件的发生,并不知道确切的生存时间。 左删失:终点事件发生在某一时点之前。 期间删失:终点事件发生在某

5、两时点之间。 右删失:终点事件发生在最后一次随访观察时刻的右方。 删失必须调整,否则导致偏倚。,产生删失数据的原因有: (1)失访; (2)研究结束时终点事件尚未发生; (3)死于其它原因; (4)由于严重药物反应而终止观察或改变治疗措施。,随访研究( 表21-2),患者进入期间,生存时间资料的特点,1 有2个效应变量:(1)生存时间(天数),(2)结局(死亡与否、是否阳性等) 2 截尾数据:如表21-1中的1号、 3号和4号病人未观察到底,不知他们究竟能活多长时间。处理截尾数据时两种错误的做法: 错误1:丢弃截尾数据,只考虑确切数据。(损失了信息) 错误2:将截尾数据当作确切数据处理。(低估

6、了生存时间的平均水平)。,生存时间资料的特点,3. 分布类型复杂:生存时间常呈正偏态分布。 在处理正偏态分布数据时两种错误的做法: 错误1:采用平均生存时间而不是采用中位生存时间来表示生存时间的平均水平。 错误2:采用常规t检验或方差分析进行组间比较。(应采用log-rank检验比较几组生存时间 ),二、生存分析的统计描述指标,1. 死亡概率、生存概率 2. 生存率及标准误 3. 半数生存期(中位数) 及四分位数间距,1. 死亡概率、生存概率,1)死亡概率(probability of death):表示某时段开始存活的个体,在该时段内死亡的可能性。 计算,注意:如果年内有删失,则分母用校正人

7、口数:校正人口数= 年初人口数删失例数/2,2)生存概率:单位时段开始时存活的个体到该时段结束时仍然存活的可能性;p=某年活满一年人数/某年年初人口数注意:若年内有删失,分母用校正人口数。,2. 生存率及标准误,生存率(survival rate) :0时刻存活的个体在t时刻仍存活的可能性。生存概率是针对单位时间而言的,生存率是针对某个较长时段的,是生存概率的累计结果。,生存率 (survival rate)又称为 累积生存概率 ( cumulative probability of survival ),生存率的标准误,【例】手术治疗50例肺癌病人,术后1,2,3年的死亡数分别为10,10,

8、10例,无截尾数据。试求各年的生存概率和3年生存率。各年生存概率 p1 = ( 5010 )/50 p2 = ( 4010 )/ 40 p3 = ( 3010 )/303年生存率 S(3)=P(T3)=(5030)/50 =0.4,1)半数生存期,也称中位生存期(median survival time),即生存时间中位数,表示50%的个体可存活的时间。即生存率为时对应的生存时间(集中趋势指标)。中位生存期越长,表示疾病的预后越好。 2)生存期的四分位数间距反映离散程度大小,3. 半数生存期及四分位数间距,寿命表法(life table method) 乘积极限法( Kaplan-Meier

9、method ),第二节 生存曲线的估计,一、寿命表法(life table method),应用范围:样本含量较大时 【例21-1】 收集374名某恶性肿瘤患者的随访资料,取时间区间均为1年,整理结果见表21-3中(1)(5)栏,试估计各年生存率。,期初有效例数=期初病例数-期内删失数/2 死亡概率=期内死亡数/期初有效例数 生存概率=1-死亡概率,恶性肿瘤患者确诊后5年内生存率下降较块,5年后生存率下降较平缓,说明确诊后5年内该恶性肿瘤患者的死亡威胁较大。,寿命表法曲线为折线。 该法只估计时段右端点的生存率,省略了时段内的生存率估计。,二、乘积极限法( Kaplan-Meier metho

10、d ),Product limit method,应用于样本含量较小时。 基本思想:将生存时间由小到大依次排列,在每个死亡点上,计算期初人数、死亡人数、死亡概率、生存概率和生存率。,Kaplan-Meier法生存曲线为阶梯形曲线。,Group:1 代表 3cm,2代表3cm Time: 生存时间 Status:0代表删失,1代表完全数据(结局事件),第三节 生存曲线的比较 (Log rank 检验),【例21-3】 比较上例中膀胱肿瘤小于3.0cm患者和肿瘤大于或等于3.0cm患者的生存曲线,就总体而言,两个生存函数是否有差别?,【小结】 Log-rank检验属于非参数检验的方法; Log-r

11、ank检验可用于两组或多组生存曲线的比较; Log-rank检验属于单因素分析方法,其应用条件是除比较因素外,影响生存率的各混杂因素在不同的组间均衡。否则,可采用cox回归。,第四节 cox 回归,1)多重线性回归模型:反应变量为定量资料,且服从正态分布。 2)Logistic回归模型:反应变量为定性资料。 3)生存资料同时考虑生存结局和生存时间,生存时间往往不服从正态分布,且可能含有删失。 错误1:忽略生存时间,采用Logistic回归分析死亡率。 错误2:忽略结局,采用t检验、线性回归分析生存时间。,Cox模型是由英国伦敦大学的Cox于1972年提出的,它是一种半参数模型。 Cox 模型以

12、生存结局和生存时间为因变量,可同时分析众多因素对生存期的影响,分析带有删失数据的资料,且不要求资料服从特定的分布类型。,Cox模型主要用于研究多个因子对生存时间的影响; Cox模型表达式,Cox回归模型的模型假定:任两个个体风险之比不随时间的变化而变化。 Assumption of proportional hazard( PH假定),Cox 回归中PH假定的判定(1),Cox 回归中PH假定的判定(2),案例讨论,某研究者观察了确诊后采取同样方案进行化疗的26例急性混合型白血病患者,欲了解某种不良染色体是否会影响患者病情的缓解,于是将治疗后120天内症状是否缓解作为结果变量 y(缓解= 0,

13、未缓解= 1),有无不良染色体 chr有= l,无= 0)作为研究因素,数据收集后(详细数据见表20-9)进行一系列统计分析,请结合以下问题,对分析结果进行恰当的评价。,(1)按照有无不良染色体分组比较缓解率,考虑到例数较小,采用Fisher精确概率法,得到P值为0.667,此时的结论如何?,(2)考虑到有无不良染色体并非研究人员可以随机化分配的处理,所以比较组之间其它影响患者缓解的因素不一定均衡,因而需要考虑平衡其他可能的影响因素的作用。于是该研究者进一步查阅了相关文献,追加记录了患者的年龄age(岁)、骨髓原幼细胞数分组bl(大于等于50 1,小于 50 0)、CD34表达 cd(阳性=1

14、,阴性=0)、性别 sex(男= l,女=0)这几个变量,采用多因素 logistic模型来分析,经逐步法按 a=0.10准得到表 2010中的结果。此时的结论又如何?,(3)有临床医生指出,对于这种患者只要能使缓解时间提前临床上就可以认为有一定疗效,所以仅考虑是否缓解还不够,如果进一步利用缓解时间的长短来进行分析,信息会利用得更充分。费了很大辛苦,幸好查到了所有患者的缓解时间,于是采用logrank检验比较了有无不良染色体的两个组病人的生存曲线,得到2=1.28,P值为 0.2579,此时的结论如何?,(4)有统计学家提醒研究者,生存时间的比较仍然需要考虑组间的可比性,这种观察对比得到的数据

15、还需要做多因素的生存分析,结论会比单因素Iogrank检验可靠。于是进行多因素Cox回归分析,逐步回归结果列在表 2112。此时,因为 chr的 P值大于 0. 05,所以认为有无不良染色体并没有什么关系。,综合上述分析过程,你对此项研究的设计、资料收集及统计分析方法的选择有何评论?,案例解析,首先,结果变量的选取应充分考虑专业上的要求。对于白血病等一些难以完全治愈的较为凶险的疾患,延长患者的生存时间在临床上是有现实意义的,故而结果变量应选取结局(病情是否缓解)以及出现结局的时间(缓解时间)。这样,仅以病情是否缓解为结果变量的单因素Fisher精确概率结果以及多因素logistic模型结果就不

16、很恰当。,案例解析,其次,在使用生存分析方法时,应考虑到影响缓解时间的因素, 除了研究者所关心的是否存在不良染色体以外,还有其它影响因素无法通过实施随机化达到组间非研究因素的均衡性,那么单因素log-rank检验的结果就无法控制非研究因素的影响,所以应该使用多因素Cox回归分析方法并检查PH假设条件,得出正确研究结论。,总结,【总结】生存分析在医学中应用 生存率的估计:根据生存数据估计生存率及相关指标,常用的方法有寿命表法和Kaplan-Meier法。 生存曲线的比较:比较不同受试对象生存数据相应指标是否有差别,常用log-rank检验。 影响因素分析:研究生存时间长短因素或生存率的影响因素,常用cox比例风险模型。 预测:对个体不同因素的影响预测生存时间,常用cox比例风险模型。,Thank You !,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报