收藏 分享(赏)

19章 生存分析.ppt

上传人:dzzj200808 文档编号:3322047 上传时间:2018-10-13 格式:PPT 页数:49 大小:1.19MB
下载 相关 举报
19章  生存分析.ppt_第1页
第1页 / 共49页
19章  生存分析.ppt_第2页
第2页 / 共49页
19章  生存分析.ppt_第3页
第3页 / 共49页
19章  生存分析.ppt_第4页
第4页 / 共49页
19章  生存分析.ppt_第5页
第5页 / 共49页
点击查看更多>>
资源描述

1、1,第19章 生存分析,卫生统计学第7版,卫生统计教研室,2,主要内容第一节 生存资料的基本概念第二节 生存率的估计第三节 生存曲线的比较第四节 Cox 回归,3,第一节 生存分析的概念,生存分析(survival analysis):是将事件的结果和出现这一结果经历的时间结合起来分析的一种统计分析方法.,4,药物 A:治愈率 80%,治疗开始,治疗结束,药物B:治愈率 80%,生存分析有两个反应变量:事件发生 时间经历长度,tA,tB,如果 tA=tB,何者最优?如果 tAtB,何者最优?,治疗结束,治疗开始,一、生存时间,事件(失败): 死亡, 发病, 疾病复发, 康复, 时间的测量单位:

2、 年,月,周或天,等,5,1. 生存时间资料的结构,(1). 记录: 开始时间, 结束时间, 结局, 协变量,协变量:性别,年龄等; 时间记录: 手术日期,截止日期,生存时间=截止日期手术日期 结局: 死亡,存活,失访(观察截止,死于他病,迁居,),6,2、 生存时间(完全数据、截尾数据),生存时间(survival time):是指观察到的存活时间。 完全数据(complete data):指从起点至死亡所经历的时间,即死者的存活时间 截尾数据(censored data):由于失访、改变防治方案、研究工作结束时事件尚未发生等情况,使部分病人不能随访到底,称为截尾。从起点到截尾点所经历的时间

3、,称为截尾数据。,7,(1)完全时间:精确知道生存时间跨度。 t=11 (月), 37 (月) (2)截尾时间:仅知道部分生存时间,但不知道精确的生存时间跨度,t+=10+ (月), 25+ (月), 9+(月)。,开始,截尾,t+,X,事件发生,t,日历时间(年、月、日),7,8,9,10,11,12,13,0.0,1.0,2.0,3.0,4.0,5.0,6.0,7.0,No.,1,2,3,4,5,+,+,0,30,60,90,120,150,180,0.0,1.0,2.0,3.0,4.0,5.0,6.0,7.0,No.,5,4,1,2,3,33,96,158,+,+,整理后的生存时间(天)

4、,8,3、生存时间资料的特点: 两个反应变量:生存时间变量t,结局变量Y. (2) 有截尾数据。 (3) 分布:生存时间的分布往往为非正态分布。,9,二、死亡概率、生存概率,死亡概率(mortality probability):记为q,是指死于某时段内的可能性大小。生存概率(survival probability):记为p,表示某单位时段开始时存活的个体到该时段结束时仍存活的机会大小。,10,三、生存率,生存率(survival rate):S(ti)是指病人经历ti个单位时间之后仍存活的概率。,11,生存率估计的概率乘法原理:,假定病人在各个时段生存的事件独立,生存概率为P,则应用概率乘

5、法得生存率估计的公式为:,12,第二节 生存曲线估计 对于生存曲线的估计,我们介绍常用的2种方法:,1寿命表法(Life-Table Method,简称LT法) 有时,收集到的资料是按生存时间分组的频数分布资料,由于每一例观察对象的生存时间不是确切时间点的观察资料,故只能通过生存时间区间ti-1,ti内的死亡和截尾的观察例数来估计该区间上的死亡概率,然后用该区间及其之前各区间上的生存概率之积来估计S(ti)。当样本量较大或者无法准确得知研究结果出现的时间时,可以将各研究对象的生存时间按某个时间段(年、月等)进行分组计算其生存率。,13,2Kaplan-meier法,又称乘积极限法(Produc

6、t-Limit Method,简称PL法),由Kaplan-Meier在1958年提出,适用于样本量较小,难以将生存时间按组段划分,此时是利用tk时刻之前各时点上生存概率的乘积来估计在时刻tk的生存率,不需要对被估计的资料分布作任何假设。,14,例19-1 374名食管癌患者随访资料,取时间均为期1年,整理结果见19-3表,计算生存率?,15,表19-3 寿命表法估计生存率计算表,16,1、计算各组段期初观察例数 ni 公式:ni= ni- ci/2 2、计算各时间区间上的死亡概率qi和生存概率pi 公式: qi= di/ ni 3、计算生存率,寿命表法步骤:,17,图21-2 某恶性肿瘤生存

7、曲线(寿命表法),18,2、Kaplan-meier法,例19-2 14例膀胱肿瘤小于3.0cm患者和16例膀胱肿瘤大于或等于3.0cm患者的生存时间(月)如下,试估计两组生存率。3.0cm 14 19 26 28 29 32 36 40 42 44 45 53+ 54 59+ 3.0cm 6 7 9 10 11 12 13 20 23 25 27 30 34 37 43 50,19,(1)将所有生存时间按从小到大排列(ti),删失数 据在完全数据后面。 (2)将各期内死亡例数(di)和截尾例数(ci)分别 写在第(3),(4)列。 (3)列出各期初暴露病例数(ni),它是指在t时刻前 仍存活

8、的病例数。 (4)计算各期的死亡概率qi, qi=di/ni,截尾数不计入 同期的分母,结果见第(6)列。 (5)计算各期的生存概率pi, pi=1-qi结果见第(7)列。 (6)计算各ti时刻的生存率S(ti)。计算ti时刻生存率时可以用小于和等于ti时刻的各时点生存概率的乘积得到。,20,21,图21-3小于3.0cm和大于或等于3.0cm患者的生存曲线( Kaplan-meier),36,22,中位生存时间 (t50%): t50%-t(S(t)=0.5) 又称半数生存期,表示恰有50%的个体尚存活的时间。,t(S(t)= 0.5001) =36(月), t(S(t)= 0.4286)

9、=40(月), t50%-用线形内插法计算。,同理,用线形内插法可以计算任意生存概率下的生存时间。如t25%,t75%。,23,三、 生存概率的区间估计,(1) 生存率的标准误:,计算结果见表19-4中最后一列。 (2) 生存率 的100(1-)% CI,24,的95% CI :,(3)生存率经对数变换函数,的标准误:,生存率的95% CI:,25,第三节 生存曲线的比较- Log-rank test,log-rank检验是比较生存曲线的非参数方法之一, 其基本思想:当H0成立时,根据ti时点的死亡率,可计算出ti时点上各组的理论死亡数;将所有时点各组的理论死亡数累加,便得到各组的理论死亡总数

10、Tg;将Tg和各组的实际死亡总数Ag比较,就形成Log-rank检验的X2统计量。,26,例19-3 表19-5 肿瘤 3.0cm和肿瘤 3.0cm患者生存曲线比较的log-rank检验计算表,27,建立检验假设, 确定检验水准:H0 : S1=S2 H1: S1S2=0.05/2, (two sided) 2. 选择检验方法,计算统计量: 2-test, 计算2值。,28,表21-6 理论死亡数计算表(以第一个时间6月为例),29,3、结论,30,二、应用及其注意事项,1、本法也适用于寿命表资料及多组比较 2、实际死亡总数A与理论死亡总数T之比称为相对死亡比, R=A/T,则相对危险度(RR

11、)估计值为两组相对死亡比之比。 肿瘤 3.0cm和肿瘤 3.0cm患者相比:,3、log-rank检验用于整条生存曲线的比较,若比较两条生存曲线的某时间点处的生存率,可用以下公式:,例19-2两组 2年生存率比较,31,32,33,又称为Cox 比例风险模型( Proportional Hazard Model),非参数法:Kaplan-Meier法,log-rank test,等,参数法:概率模型, Weibull Model, Exponential Model,etc.,半参数法:Cox 回归,D.R.Cox 1972,第四节 Cox 回归,生存分析方法的分类,34,一 、Cox 回归模

12、型的结构,h(t,X): 具有一组自变量X的个体在时间t的风险; h0(t):处于标准状态(X=0)下的个体在时间t的风险,又称基准风险函数(baseline hazard function), (unspecified) Xj : 自变量,j=1,2,p; j: 偏回归系数,j=1,2,p;,1、模型结构,35,2、模型假定 任两个个体风险函数之比,即风险比 (risk ratio,RR或hazard ratio,RR)模型,模型中自变量的效应不随时间而改变,称为比例风险假定,简称PH假定。,36,j的意义是:Xj每改变一个单位所引起的相对风险的改变量为:exp(j)如果j为+, RR(j)

13、=exp(j)1, 使风险增加。 如果j为-, RR(j)=exp(j)1, 使风险减少。,3、参数解释,37,4、参数估计与假设检验,RR的95%可信区间:,标准化回归系数:,总体假设检验:似然比检验和Wald检验 回归系数的检验: Wald检验,38,筛选方法:(1) forward selection(2) Backward elimination(3) Stepwise selection,筛选标准:似然比统计量(Likelihood ratio)G = -2lnL (-2lnL) =2(lnL lnL),5、筛选因素的方法和标准,-2lnL 及-2lnL为分别包含不同自变量个数的似然

14、函数。模型中包含的自变量个数越多,自变量的效应越强,则lnL 值越小。差值G越大。G服从2 分布,自由度:=两个模型中的自变量个数之差。,39,例19-4 表19-7 30例膀胱肿瘤患者生存资料原始记录表,40,表21-8 30例膀胱肿瘤患者多变量Cox 回归分析结果,(逐步引入-剔除法),41,求个体t时刻的生存率:,42,三、关于Cox 比例风险模型的假定,HR=h(t)/h0(t):与时间无关,在任何时间上的风险比例保持恒定。,h(t)/h0(t),time t,满足比例风险的图形,time t,不满足比例风险的图形,h(t)/h0(t),43,44,45,46,47,1. 生存资料的特点 2. 生存概率的估计Kaplan-Meier method (Product-limit method) 3. 两组生存概率(生存曲线)的比较Log-rank test 4. 生存资料的多因素分析模型:Cox 回归模型,小结,48,49,练习作业,1. 什么是截尾数据?它是怎样发生的? 它对生存率的估计有何影响? 2. 什么是条件生存概率和累计生存概率? 3. 试说明Cox比例风险模型的结构,解释其偏回归系数的意义,说明该模型对资料的要求是什么?4. 方积乾主编卫生统计学 (page 432)思考与练习中第2,3题。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 大学课件

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报