ImageVerifierCode 换一换
格式:PPT , 页数:72 ,大小:853.50KB ,
资源ID:369791      下载积分:10 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.docduoduo.com/d-369791.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(肿瘤登记资料的统计分析----生存分析.ppt)为本站会员(无敌)主动上传,道客多多仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知道客多多(发送邮件至docduoduo@163.com或直接QQ联系客服),我们立即给予删除!

肿瘤登记资料的统计分析----生存分析.ppt

1、肿瘤登记资料的统计分析 -生存分析,河南省肿瘤防治研究办公室孙喜斌电话 0371-65587346 13838063621Email ,生存率分析,内容: 基本概念 观察生存率 相对生存率 统计学检验,基本概念,生存分析是一类时间到事件变量数据的分析(analysis of time-to-event data)。医学研究中用生存分析这一术语(工业工程中则称作寿命时间分析或失效时间分析)。时间到事件变量三个基本限定:1)起点的时间是明确的。2)指标单位(时、天、月、年)要统一。3)事件发生的界定要明确。,时间-事件变量由于存在截尾数据及反应变量往往呈非正态分布,故应用标准的统计方法处理是不合适

2、的。生存率是一比例(不是率),但习惯上称作率。生存率是肿瘤登记数据的常用统计指标。临床疗效评价中常用的痊愈率、有效率、病死率等百分率指标,其统计效能较差。,例子1,人群110000人随访3年15人在1年内死亡9985人在随访结束时存活死亡率=5/10000(年),人群210000人随访3年15人在3年内死亡9985人在随访结束时存活死亡率=5/10000(年),例子2,人群110000人随访3年15人在1年内死亡9985人在随访结束时存活死亡率=5/10000(年),人群210000人随访3年15人在3年内死亡9985人在随访结束时存活其中有10人在结束时失访死亡率=5/10000(年),生存

3、(失效)时间的界定,癌症诊断到死亡的时间癌症临床实验中随机分组到死亡的时间随机分组到癌症复发的时间淋巴瘤治疗期间缓解到复发的时间HIV感染到死亡的时间电灯(可)使用的时间各学科中均涉及这类变量的处理。,生存分析应用,研究群体的率在观察期内不一致(动态)关心生存时间的长短截尾观察存在,生存时间的计算,时间=开始的日期到:1.研究(观察)结束的日期(研究对象仍存活)2.退出研究的日期3.死亡日期(如果对象在随访研究结束前死亡),终检(Censoring,截尾),截尾记录:被观察的个体在整个随访期间未有关注的事件(死亡、复发等)发生。截尾生存时间发生原因:1.观察期限已到2.失访,随访不完整3.不相

4、关的事件发生(如,在癌症研究中,观察对象在随访期间死于意外伤害)失访终检(有信息性),终末终检(非信息)终检要尽量避免,尤其是失访终检,生存分析所需信息,观察对象的确定(癌肿、性别、地区、时期)起始点的限定终点事件的限定(二项变量)观察终点的确定(截至日期)观察对象的生存时间,随访方法,死亡证书(生命统计系统)人口登记系统临床记录信访电话随访家访,观察生存率的计算方法,直接法寿命表法(Life-table method, actuarial method)极限乘积法(Kaplan-Meier method),直接法,随访期结束时存活病人的比例每个观察对象均要随访够限定的期限(如5年,除非死亡事

5、件发生)失访病例除外(不能处理截尾数据)不考虑存活时间长短信息丢失该方法基本不用,如果观察对象中没有终检病例,该法得到的生存率结果与寿命表法和K-M法的结果相同。中位生存时间:50%病人存活过的时间。,生存概率计算,假如34例病例在观察期间(5年)有10例死亡,24例存活,那么死亡概率为: q=10/34=0.29=29%生存概率: p=24/34=0.71=71%死亡概率+生存概率=1 q+p=1P=1-0.29=0.71=71%,寿命表法,考虑到每个观察对象的生存过程包含终检观察数据,失访的注释(保险统计的假定),失访可定为截至日期前终检:失访终检 失访终检是有信息的,越低越好。(保险统计

6、)假定:1、平均考虑,在一随访时段内,失访病例将存活一半的时 间。2、这一时段内,每一失访病例贡献1/2的生存时间。3、失访病例的后续生存经历与该时段内随访完整病例的相同。4、将1/2的失访病例看作完整数据。,寿命表(LT)法公式:i=1,2,.,m; 用 n(ti)、d(ti)、w(ti) 分别表示在时间或随访区间t的期初存活病例数、期内死亡数、期内终检数。,有效观察病例数,总的生存人数是计算死亡概率的分母。失访减少了分母的数量。有效观察数 ni=ni-wi/2,寿命表数据: 某市某区1972-79年期间男性肺癌新病例随访结果 (截止时刻1979年12月31 日)确诊日期起 期内死亡 其中死

7、于 其中死于其他 生存者随访未满随访期间 总例数 肺癌 因的例数 个期间的例数 (包括期内失访) d w (1) (2) (3) (4) (5)0月 291 290 1 343月 210 210 0 126月 138 138 0 279月 92 92 0 121年 206 203 3 212年 45 45 0 93年 8 8 0 114年 4 4 0 115年 21,寿命表格式: 某市某区1972-79年期间男性肺癌观察生存率的计算确诊日期起 期初观 期内死亡 有效观 死亡概率 生存概率 累积生存概率 随访期间 察例数 总例数 察人数 n d n q p SR(1) (2) (3) (4) (

8、5) (6) (7)0月 1152 291 1135 0.2564 0.7436 0.74363月 827 210 8210.2558 0.7442 0.55346月 605 138 591.50.2333 0.7667 0.42439月 440 91 434 0.2120 0.7880 0.33431年 336 206 325.50.6329 0.3671 0.12272年 109 45 104.50.4306 0.5694 0.06993年 55 8 49.5 0.1616 0.8384 0.05864年 36 4 30.5 0.1311 0.8689 0.05095年 21 0.7436

9、0.74420.76670.7880=0.3343,估计各个时段的生存概率: 期内死亡概率=死亡数/有效观察人数 0 期初人数1152(n1) 期内死亡人数291(d1) 期内终检人数34(w1) 期内有效观察人数 n1=1152-34/2=1135 该时段死亡概率 q1=291/1135=0.2564 该时段生存概率 p1=1-0.2564=0.7436下一时段的期初人数=上一期初人数-上一期内死亡人数-上期内终检人数 如:3 期初人数=1152-291-34=827以此类推。,计算步骤,计算累计生存概率(生存率)各个时段的生存概率相乘即得(各年的)生存率。生存率(Survival rate

10、)=pnpn-1pn-2.p2p1如上表中的9个月生存率= 0.74360.74420.76670.7880=0.3343步骤:1、计算各时段死亡概率2、计算各时段生存概率3、计算累计生存概率,SPSS软件输出的寿命表结果,累积生存率,极限乘积(K-M)法,KM法计算公式: i=1,2,.,m; 用 n(ti)、d(ti)、分别表示在时间t的期初存活病例数、期内死亡数。,Kaplan-meier 法计算(黑色素瘤)观察生存率,* 非黑色素瘤死亡,KM法说明,病例生存时间升序排列。区间的样本量渐进于0,分割区间数量倾向无穷大。区间的长度取决于生存时间度量精度(年、月、天、小时)。计算时仅考虑有事

11、件发生或终检发生的区间,忽略其他区间。终检数据只对分母有贡献(包括在分母内)。,Kaplan-Meier生存率曲线,寿命表法与KM法比较,基本相同寿命表法较适用于成组数据生存指标的刻度连续,选用KM法两种方法都是计算出“观察生存率”KM法的生存曲线是阶梯状的,每一阶梯代表发生了限定的事件;寿命表法的曲线是平滑的。,生存率的“竞争”死因调整,原因别生存(Cause-specific survival) (校正生存- corrected survival rate; 净生存-Net survival)相对生存(relative survival),原因别生存率,估计限定的癌症独立于其他死因的生存概

12、率(仅计算由于该种癌症死亡作为事件结局的生存率)。总体(观察)生存率 终点=死亡原因别(观察)生存率 终点=死于特定的原因计算方法同总体生存率一样,只是将死于其他(非特定)原因的病例作为终检观察数据处理(?)。这类指标在临床试验研究中运用较多(死亡原因易确定)。,人群为基础的肿瘤登记数据计算原因别生存率存在难度: 死亡原因(死亡证书): 未获得 不准确 编码错误用相对生存率表达原因别生存指标,相对生存率(relative survival rate),较多地应用于人群为基础肿瘤登记资料调整了竞争死因 不需要死因信息 运用人口统计寿命表,相对生存率定义,相对生存率=(观察生存率/期望生存率)10

13、0观察生存率为限定诊断时期内、限定性别、癌症种类及年龄的一组病人的观察生存率(可由寿命表法及KM法计算获得)。期望生存率是除了未患癌症外,其他因素(时期、年龄、地区等混杂因素)与癌症组病人相同的普通人群(暴露于全部死因风险)的生存率(该生存率从人口统计寿命表中计算获取),即该组癌症病人的期望生存率。,相对生存率计算,区间相对生存率: ri=pi/ei pi:区间观察生存率,ei :区间期望生存率累计相对生存率: 计算方法类似累计生存率的算法,各期间相对生存率的乘积,即得相应时间的相对生存率。,累计相对生存率,1ri=ri= (pi / ei )= pi / ei,简单计算说明,例如某地一组男性

14、患者的诊断时间集中在1982年或相邻年份内,从人口寿命表得知,相当于48-52岁患者(假定用50岁代表这组患者)的一般男性的五年生存概率为1-0.034089=0.965911,相当于53-57岁患者(假定用55岁代表这组患者)的一般男性的五年生存概率为1-0.064116=0.935884,余类推。将一般人口寿命表内查得的生存概率求其平均数,就得到该组患者的五年期望生存率。,简单算法,设Pi为相当于第i个(i=1,2,n)患者的一般人群的五年生存概率,则所求的该组患者五年期望生存率(P)为: 再设n个患者的五年观察生存率为P,则五年相对生存率为:,例如:某地一组19901994年诊断的356

15、5岁乳腺癌病人的5年观察生存率为0.57(57%),该地区相应时期3565岁一般人群女性的5年期望生存率为0.94。那么这组乳腺癌病人的5年相对生存率为: 相对生存率=(观察生存率/期望生存率)100 =0.57/0.94100=61%,期望生存率的计算(Edeer),各病人5年累计期望生存率=各年期望生存概率的乘积 =0.949000.94338-0.93257=0.739135例病人的5年累计期望生存率=各期望生存率合计/病人总数 =(0.7391+0.5834+0.7351+-+0.9729)/35=0.8159,期望生存率的计算(Edeer),各年的期望生存率=每一病人的各年期望生存概

16、率相加/相应的病人总数 1年期望生存率=(0.94900+0.92014+-+0.99527)/35=33.7398/35=0.96399 2年期望生存率=(0.97501+0.97943+-+0.99531)/27=25.95746/27=0.9613935例病人的5年累计期望生存率=各年期望生存率的乘积 = 0.96399 0.96139 0.95859 0.955430.95847=0.81355,各年的期望生存率 0.96399 0.96139 0.95859 0.95543 0.95847,Hakulinen 法,首先生成期望寿命表,Hakulinen 法,计算区间的期望生存概率(与

17、寿命表相同)计算总计的期望生存概率,Hakulinen 法,如果计算大于10年的相对生存率,这要用Hakulinen法计算期望生存率(可靠、稳定?)。计算时较复杂统计程序的应用,芬兰1985-1994年男性皮肤黑色素瘤5年观察生存率(p)、期望生存率(p*)及相对生存率(r),上海市区肺癌生存率(全人群): 1988-1991 观察生存率OSR 相对生存率RSR1年3年5年1年3年5年男性31.512.59.932.613.912.0女性29.712.19.830.513.111.3,生存率曲线,表 6-11 某市某时期男性膀胱癌生存资料的相对生存率 I n d w n P CP CR 2*S

18、ECR SR 2*SESR E1R 0- 754 224 0 754.0 0.70292 0.70292 0.72415 0.03429 0.72415 0.03429 0.72415 1- 530 106 0 530.0 0.80000 0.56233 0.59755 0.03840 0.59755 0.03840 0.597552- 424 85 0 424.0 0.79953 0.44960 0.49394 0.03981 0.49394 0.03981 0.49394 3- 339 59 0 339.0 0.82596 0.37135 0.42261 0.04005 0.42261 0

19、.04005 0.42261 4- 280 21 1 279.5 0.92487 0.34345 0.40563 0.04085 0.40563 0.04085 0.40562 5- 258 17 0 258.0 0.93411 0.32082 0.39360 0.04172 0.39360 0.04172 0.39357 6- 241 21 0 241.0 0.91286 0.29287 0.37384 0.04233 0.37384 0.04233 0.373797- 220 17 0 220.0 0.92273 0.27024 0.35964 0.04307 0.35964 0.0430

20、7 0.35957 8- 203 13 0 203.0 0.93596 0.25293 0.35152 0.04403 0.35152 0.04403 0.35143 9- 190 10 0 190.0 0.94737 0.23962 0.34826 0.04522 0.34826 0.04522 0.34814 10- 180 8 4 178.0 0.95506 0.22885 0.34843 0.04664 0.34843 0.04664 0.3482611- 168 7 48 144.0 0.95139 0.21772 0.34782 0.04837 0.34779 0.04836 0.

21、34761,P-观察生存率(期间), CP-观察生存率(累积)CR-相对生存率, SR-相对生存率, E1R-相对生存率,期望生存率,不同方法(E、及Hakulinen method)所得结果有所差别,应用时要标明。相对生存率的计算关键在可比一般人群(性别、年龄、时期、地区的一致)寿命表的选取及期望生存率的计算。我国期望生存率的计算?,相对生存率的解释,相对生存率是癌症病人去除其他死亡危险(死亡竞争风险)后),评价癌症所产生的超额死亡率的综合指标。相对生存率等于1表示观察生存与期望生存相等,没有造成超额死亡。时间t时的累计相对生存率可解释为假定只有该癌症为可能死亡原因时,病人至少存活到t时的比

22、例。尽管计算期望生存率时,所考虑的癌症死亡也包括在一般人群的死亡风险中,实际估计时其影响很小,可以忽略不计。相对生存率不是“粗率”,但也不是完全的年龄调整率。该指标只是对分母部分做了年龄调整,未对分子部分进行调整。,生存率的标准误和可信区间,标准误是评价(计算)生存率不准确性的指标。95%(99%)可信区间是取值范围,表示重复100次研究,所得指标有95(99)次所在的区间范围。直接法: P=限定年数的生存率; n=观察总数95% 可信区间= p1.96Se(p),如一组30例病人的观察生存率 57%则: Se(p)= =0.09 95%区间= 0.571.960.09 =0.390.75,寿

23、命表法标准误的计算:Pi* i年累计观察生存率;qi 区间死亡概率;ri 区间有效人数;di 区间死亡数置信区间估计: 95%CI pi*1.96 Se(pi*),相对生存率的标准误,Se(ri)=Se(pi*) 期望生存率 95%可信区间:相对生存率1.96Se(ri),统计学检验,生存率比较 生存期比较,生存率比较 U(Z)检验,两组一年生存率:45%,40%两组一年生存率的标准误:0.1250,0.1130P0.05 (U=1.96, P=0.05),生存曲线(分布)比较 :Logrank检验 (适用于寿命表和KM法),2 0.05O:观察期内实际死亡人数E:观察期内期望死亡人数,期望死

24、亡数,第一组期望死亡数=(区间内第一组死亡数+区间内第二组的死亡数)/ (区间内第一组存活数+区间内第二组的存活数)第一组有效观察数 第二组期望死亡数=(区间内第一组死亡数+区间内第二组的死亡数)/ (区间内第一组存活数+区间内第二组的存活数)第二组有效观察数存活数=组内有效人数- 组内死亡数,Log-rank 检验的局限,不提供生存曲线差异大小的指标生存曲线出现交叉检验不敏感不能调整混杂因素,其他比较方法,Wilcoxon 检验: 对各期间的观察人数加权。参数模型Cox 模型相对生存率模型,DCO病例处理,DCO病例 诊断日期不明, 生存时间=0 DCO 病例比例应尽量少如果大于10%,则应

25、分别报告包括DCO病例的生存率(降低了第一个观察期间的生存率)和排除DCO病例的生存率(高估了人群为基础数据的生存率)。,失访与生存率,5年生存率73.6%,失访与生存率,5年生存率57.3%,临床实验研究失访率控制在5%以下。人群数据的失访率控制在10%以下。,人群生存与临床生存数据比较,癌症生存的影响因素,癌症检测:临床早期检测(健康促进及医疗资源配置)、筛查癌症疾病: 自然史、临床程度、定义(登记可比性的内容)宿主: 年龄、性别、社会经济状态、疾病竞争风险、生活方式治疗: 机会、质量,现时生存(period survival),与传统的方法(cohort、complete)相比,提供“最新”(up-to-date)的生存指标。及时反映医疗诊治水平进展(不需等待n年)。应用于长期登记数据(质量要求高)。处理左终检数据。同时期不同方法的指标比较,可评价癌症防治效果(进一步论证?)。,现时生存(period survival)图解,思考题1、常用的生存率种类有:1.( )2.( )2、观察生存率的计算法有:3、简述相对生存率的计算步骤:,

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报