1、生存分析,第10章 非参数检验,SPSS应用,华中科技大学公共卫生学院 流行病学与卫生统计学系 蒋红卫 ,内容,基本概念 基本步骤 基本操作 基本结果解释,生存分析(survival analysis)是将事件的结果(终点事件)和出现这一结果所经历的时间结合起来分析的一种统计分析方法。 生存分析不同于其它多因素分析的主要区别点就是生存分析考虑了每个观测出现某一结局的时间长短。,基本概念,生存分析的目的,描述生存过程,估计不同时间的总体生存率,计算中位生存期,绘制生存函数曲线。 Kaplan-Meier(K-M)法 寿命表法 比较:比较不同处理组的生存率,如比较不同疗法治疗脑瘤的生存率,以了解哪
2、种治疗方案较优。 log-rank检验 影响因素分析:研究某个或某些因素对生存率或生存时间的影响作用。如,了解影响脑瘤病人预后的主要因素,包括年龄、性别、肿瘤分期、治疗方案等。 cox比例风险回归模型 预测 cox回归预测模型,生存分析菜单,寿命表法,寿命表法用于(小样本和大样本资料) 估计某生存时间的生存率,以及中位生存时间 绘制各种曲线:如生存函数、风险函数曲线等 对某一研究因素不同水平的生存时间分布的比较 控制另一个因素后对研究因素不同水平的生存时间分布的比较 对多组生存时间分布进行两两比较(比较总体生存时间分布采用wilcoxon检验),例1:为了比较不同手术方法治疗肾上腺肿瘤的疗效,
3、43例病人随机分为两组其中有“+”者是删失数据,表示病人仍生存或失访,括号内为死亡人数。,例1,文件格式,定义5个变量 生存时间变量:Time,值标签“生存时间(月)” 生存状态变量 :status,取值“0=死亡,1=删失或存活” 频数变量(可无):f,值标签“人数” 分组变量:group,取值“0=甲组,1=乙组” 生存时间序号变量(可无):ID,SPSS基本操作,SPSS基本操作,生存时间,最大生存时间,组距,生存状态,定义终点事件,分组因素,分组定义,生存状态定义,生存状态定义,SPSS基本操作,给定选项,SPSS基本操作,生成寿命表,生存曲线作图等,各组比较的方式,不作比较,整体性比
4、较,两两比较,Kaplan-Meier法,Kaplan-Meier过程用于(尤其小样本资料) 估计各生存时间的生存率以及中位生存时间。 绘制各种曲线:如生存函数、风险函数曲线等。 比较某研究因素不同水平的生存时间有无差异。 控制某个分层因素后对研究因素不同水平的生存时间分布进行比较。 对多组生存时间分布进行两两比较(各总体分布比较采用Log-rank等非参数方法),同例1:为了比较不同手术方法治疗肾上腺肿瘤的疗效,43例病人随机分为两组其中有“+”者是删失数据,表示病人仍生存或失访,括号内为死亡人数。,例2,SPSS基本操作,SPSS基本操作,生存时间,生存状态,定义生存状态,分组因素,SPS
5、S基本操作,SPSS基本操作,比较方法,SPSS基本操作,比较方法,比较方式,几点说明,检验统计量Test Statistics: 都用于检验时间分布是否相同 对数秩Log-rank:各时间点的权重一样。 Breslow:按各时间点的观察例数赋权 Tarone-Ware:按各时间点观察例数的平方根赋权 Linear trend for factor levels:线性趋势检验 Pooled over strata:水平间整体性比较 For each stratum:每层进行各分组水平间的整体性比较 Pairwise over strata:分组各水平间的两两比较 Pairwise for ea
6、ch stratum:每层上各水平间的两两比较,SPSS基本操作,选项,SPSS基本操作,统计指标,作图,Cox回归,在医学中, 一方面要看治疗结局的好坏,另一方面还要看生存时间的长短。 生存时间的长短不仅与治疗措施有关, 还可能与病人的体质, 年龄, 病情的轻重等多种因素有关。如何找出其中哪些因素与生存时间有关、哪些无关呢? 由于失访、试验终止等原因造成某些时间的不完全,不能用多元线性回归分析。1972年英国统计学家Cox DR. 提出一种比例危险模型方法, 能处理多个因素对生存时间影响的问题。 其目的 多个因素对生存时间的影响作用分析和比较 生存(或死亡)风险预测,Cox回归,Cox回归属
7、半参数模型,模型基本形式:h(t,x)为具有协变量x的个体在时刻t的风险函数(风险率, 瞬时死亡率),h0(t)称基准风险率,即所有协变量均为0时,个体时刻t的风险函数,上式的右侧分两部分: h0(t)与时间有关的任意函数,其分布和形状无明确假定, 是非参数部分. 另一部分是参数部分,其参数可以通过样本估计.因为无须估计h0(t), 故Cox回归的模型拟和不是直接用生存时间作为因变量, 而是以风险函数与基础风险函数的比值为因变量。,Cox 比例风险模型,Cox回归-多因素分析,数据格式,设含有p个变量x1, x2,xp及时间T和结局C的 n个观察对象. 其数据结构为:,例3,例3:为探讨某恶性
8、肿瘤的预后,某研究者收集了63例患者的生存时间、生存结局及影响因素。影响因素包括病人年龄、性别、组织学类型、治疗方式、淋巴结转移、肿瘤浸润程度,生存时间以月计算。试用Cox回归模型进行分析。,63名某恶性肿瘤患者的生存时间(月)及影响因素,SPSS基本操作,SPSS基本操作,生存时间,生存状态,设定状态,协变量,SPSS基本操作,SPSS基本操作,哑变量,SPSS基本操作,与Logistic回归设置相同,哑变量形式,SPSS基本操作,作图,SPSS基本操作,作图类型,比较各变量的各类曲线,SPSS基本操作,选项,SPSS基本操作,回归系数可信区间,各参数估计间的相关性,Cox逐步回归,与Logistic逐步回归相似,变量筛选方法,选项,SPSS基本操作,筛选标准,Cox回归注意事项,严格设计 样本量应较大 注意检验Cox回归前提条件,如,比例风险假设等 某些情况下,Cox回归不能适用,如,手术的长期效应等,小结,SPSS中“Analyze”/“Survival”/”Life Tables”菜单主要用于寿命表法。 SPSS中“Analyze”/“Survival”/” Kaplan-meier”菜单主要用于KM法。 SPSS中“Analyze”/“Survival”/”Cox Regression”菜单主要用于COX回归分析。,45,谢谢大家!,