1、生存质量资料的统计分析方法 关键词 生存质量;资料;统计分析 中图分类号R195.1 文献标识码C 文章编号1673-7210(2008)02(b)-139-02 随着健康观念和医学模式的转变,以及人们生活水平的提高,生存质量的研究越来越受重视,并得到了广泛的应用。生存质量是指健康地生活,它不仅包含健康新概念,还包含住房质量、生活水平、邻里关系、工作满意度等生活中的各个方面,相应地产生了大量的生存质量资料。生存质量资料具有不同于一般资料的特点:生存质量是难以直接观察的主观构造,需通过多个项目的测定来综合评价;生存质量包括几个方面,每个方面有多个指标,因此是多变量(多终点)资料;生存质量测量往往
2、要在多个时点重复进行,属多时点纵向资料。 因此,普通的统计分析方法在很多方面不适于生存质量资料的分析。为此,国外一些学者提出了一些新的分析方法。本文对可用于生存质量资料分析的统计方法作一概括的介绍及评述,旨在促进我国生存质量研究的广泛开展。 1 同一时点(横向)生存质量资料的统计分析方法 当仅进行一次生存质量的测定,或虽在不同的时间进行了多次测定,对各个时点(横切面)的生存质量分别进行分析时即属这种情况。这是应用中常见的情形,目的是对某个时点不同组间(如放疗组与化疗组)的生存质量进行比较。 1.1单因素检验方法 据Schumacher等报道,有关生存质量的文献中,1/3都是采用计算频率和均数等
3、描述性统计方法,50%文献采用单因素的参数或非参数检验方法,如t检验、方差分析等进行组间比较,得到多个P值。显然,单因素检验方法仅能对单个指标分别比较,缺乏对生存质量的总体评价,并且当各个指标的改变方向不一致时,难以下结论。此外,计算多个P值明显增大了第一类错误。 1.2 Bonferroni校正法 该法是对单因素检验P值的校正,即用需检验的指标数乘以各自的P值作为最终判断的P值。当各指标间相关性较大时,较为保守。Worsley等对此进行了改进,实际只是就单因素分析中增大第一类错误的问题稍作调整。 1.3 HotellingT2检验或多变量方差分析 一种自然的想法就是将生存质量每一个指标当成一
4、个变量,从而采用HotellingT2检验或多变量方差分析。由于生存质量测定中条目(变量)太多,一般需要先降维,把多个变量综合为少数几个主要方面的指标后再作分析。常用两种综合方法。直接累加法:人为地将某些条目的得分累加,代表生存质量某一方面的综合得分,甚至将整个量表条目得分相加得到生存质量总分。该法常遭非议,原因是忽视了各条目的相对重要性,从而缺乏区别能力,某些条目上的较高得分会被较低的得分拉平。加权累加法:每个条目给一个权重系数Wi,它的确定,一是采用基于数据结构的方法,即通过因子分析找出几个主要的综合变量(主成分),各条目在主成分上的因子载荷即作为权重。另一种是采用决策分析中的一些方法,如
5、时间权衡法等。该法虽可解决一些综合比较的问题,但还不能从总体上判断不同组间生存质量的好坏,一般不适合临床试验资料的分析。 1.4 OBrien的非参数及参数综合检验法 OBrien提出了一种多终点非参数检验法,实际是将单变量的秩和检验推广到多变量情形。基本思想是将不同组不同指标混合起来共同编秩(用Rijk代表第i组第j个人第k个指标的秩),然后对同一个人在指标间进行累加得到秩和Sij。Sij是综合了各指标后得到的一个综合变量,再以Sij作方差分析或一般的秩和检验。此外,OBrien又根据广义最小二乘原理提出了一种参数综合检验方法,适合于多变量渐近正态分布资料。基本思想是将各变量的标准正态离差用
6、协方差阵()的逆矩阵进行加权处理,得到一个新的综合变量Sij*,再以Sij*作单变量方差分析(或t检验)即可。 Pocock对OBrien的参数法进行了推广,使得计量变量、分类变量、生存时间变量均能处理,并且给出了用t值(对于两组间的比较)代替标准正态离差的公式。 2 多时点(纵向)生存质量资料的统计分析方法 当在不同时间进行多次生存质量测定,旨在对同一组人群不同时点的生存质量进行比较时,或者既要比较不同组间,又要比较不同时点的生存质量变化时,属此情况。显然,对同一人群不同时点的比较问题,只要把不同时间点视为不同的处理组,将个体间的变异视为随机误差,则转化为第一部分中讨论的问题。若个体间的变异
7、作为区组因素,则可考虑区组设计的方差分析或秩和检验。至于第二个目的,可试用有重复测量数据的双因素方差分析或方差分量模型,既可得到不同时间点上、不同处理组间生存质量的比较结果,又可得到二者间有无交互作用的结论。资料不符合方差分析的条件时也可考虑双因素秩和检验。若要对生存质量的多个方面进行整体比较,可试用多变量的双因素方差分析、轮廓分析等。此外,在临床研究中,推断的重点往往在于不同处理组间,生存质量在时间上的变化趋势有无不同,即两条或多条生存质量变化曲线的比较。此时可考虑时间序列分析及生存分析中的一些方法。 3 生存质量与生存时间的联合分析方法 众所周知,在慢性病与肿瘤的疗效评价及预后因素分析中,
8、生存分析起着重要作用。但是传统的生存分析方法仅考虑了生存的数量,而未考虑生存质量。因此,把生存质量和生存数量结合起来进行综合的评价,就成为一个需迫切解决的问题,也成为生存分析的一个发展方向。笔者曾对此作过详细的介绍与讨论。 4 生存质量及生存时间的影响因素分析方法 4.1 生存质量的影响因素分析 当仅分析对生存质量总分的影响因素时,可将总分视为因变量,影响因素作自变量,从而采用多重回归分析方法。也有作者采用对数线性模型方法。若要同时分析生存质量各个方面得分的影响因素,笔者认为可采用多元多重回归分析或典则相关分析。 4.2生存质量与生存时间的影响因素分析 生存分析中的半参数模型被广泛地用于与生存
9、时间有关的预后因素分析。因此,只要经过改进与扩展,使之适应有生存质量的数据即可。Coleetal等提出的质量调整Cox回归模型即是如此。它按生存质量的高低分为多个状态,以每个状态为终点进行Cox回归分析,因而可同时考虑多个协变量的影响。此外,Coleetal等从竞争风险出发提出了一种质量调整生存分析的参数方法,不但可综合评价生存质量与生存数量,而且还可对其影响因素进行分析。 以上这些统计分析方法,各有自己的适用性及优缺点,应用中应注意区别和选择。 按目的来介绍方法仅是为了方便。实际上不同的目的往往是互相联系在一起的,一份生存质量资料的分析常常要用到多种统计方法;另一方面,不少方法也能同时达到几个目的。如Cole的质量调整Cox回归模型既可用于生存质量与生存时间的综合评价,又可用于不同组间的比较,而且能作影响因素分析。 (收稿日期:2007-10-31)第 5 页 共 5 页