1、 倾向评分分层和回归分析摘要:【关键词】倾向评分分层回归分析在流行病学中,分层分析和回归分析是资料分析阶段控制混杂偏倚的手段。将倾向评分法与传统的分层和回归,则可更地控制混杂偏倚,可以克服传统方法的局限性。 一、原理和方法 传统的分层【关键词】 倾向评分分层 回归分析在流行病学中,分层分析和回归分析是资料分析阶段控制混杂偏倚的手段。将倾向评分法与传统的分层和回归,则可更地控制混杂偏倚,可以克服传统方法的局限性。一、原理和方法传统的分层分析是的混杂因素的不同将分为若干层,处在同一层的混杂因素趋于,可以直接效应。分别计算各层统计量(如 t 值、2 值)和效应尺度(如 R、均数差值),然后再用某种方
2、法(antel haenszel 法、条件 Lgisti 回归、eta 法等) 合并各层效应尺度和统计量。混杂因素的,分层数将成指数倍数。假如所有混杂变量为 2 分类变量,则平衡 k 个混杂变量的分层数为 2 的 k 次方。k ,很在某些层中组或非组的,从而无法估计层的效应。倾向评分分层分析(prpensity sre stratifiatin)或称为亚分类分析(sublassifiatin)原理与传统的分层分析方法相同,只是分层变量每个混杂变量,而是倾向评分值1。Rsenbau 和 Rubin2,倾向评分地分层后,各层因素的效应是效应的无偏估计。分层后两组在各层的倾向评分均值非常接近,则各混
3、杂因素在每一层的分布将趋于,此时可以各层中的分配是近似随机的。方法是:协变量和分组计算倾向评分值。将倾向评分值排序,然后倾向评分值的百分位数将划分若干个亚组或层(510 层)。者两组人群的倾向评分或某一组人群的倾向评分来每一层的临界值。最常用的方法是两组倾向评分等分为若干层。在每一层内对两组的协变量和倾向评分分布均衡性分析。对连续性协变量做方差分析或 t 检验,对分类协变量作 2 检验。均衡性较差,则要重新分层或修改模型重新计算倾向评分值,如或某个协变量或交互项,然后用与传统分层分析相同的方法计算和合并各层统计量和效应尺度。倾向评分回归(prpensity sre regressin adju
4、stent)是将倾向评分协变量引入最后的模型中,分析因素与结局变量之间的因果及强度3。倾向评分综合了各协变量在两组中的分布信息,是分布差异的协变量的信息,将倾向评分纳入到的模型中就可以各协变量的效应。通常有几种策略。最简单的方法是只将倾向评分和因素自变量纳入模型效应分析。倾向评分变量可以是倾向评分值,也可以是分层赋值,将评分等分为 5 层,则赋值为 1、2、3、4、5 。 ,者在中还可以把的变量与倾向评分一同加入的模型,可以地排除变量的。还有方法是者在倾向评分分层的基础上倾向评分回归,消除层内的残余混杂3。二、应用实例产程中管理包括适时阴道检查、早期诊断异常分娩、早期人工破膜以刺激宫缩、缩宫素
5、的使用等内容。产程中管理有助于降低剖宫产率。产程中管理试验(ative anageent f labr trial,AT)是一项随机对照4。该主要目的是观察产程中管理与剖宫产率的关系。人员的数据,想硬膜外分娩镇痛初产妇剖宫产的率3,5。本中硬膜外分娩镇痛随机分配的,者倾向评分分层分析来控制混杂因素。人群共包括 1 778 名初产妇女,1 003 名(56.4 %)了硬膜外分娩镇痛(组) ,775 名(43.6 %)(对照组)。者了 14 个需要平衡的混杂变量,各变量在两组中的分布,见表 1。表 1 分层前后和未硬膜外分娩镇痛的妇女注:*P 0.05;*P 0.01;*P 0.001。#分层前为
6、双侧 t 值的平方 ;分层后为双因素方差分析倾向评分分层后组主效应的 F值作者将变量自变量,将硬膜外分娩镇痛因变量 Lgisti 回归,计算出倾向评分。将人群两组倾向评分等分为 5 层后,用双因素方差分析 (倾向评分分层和分娩镇痛两因素 )评价各变量在两组中的均衡性。从表 1 结果可以看到,分层后各变量的分布趋于。者还分析了上述两因素之间的一级交互项。倾向评分分层与因素之间在入院时宫口扩张程度的交互项差异(F=3.16,P=0.013)。各层两组之间在入院时宫口扩张程度的均值,前 4 层中两组均值非常相近,而最后 1 层两组均值相差,平衡不佳 (见表 2,图 1)。从图 1 还可以直观地,两组
7、均值大小关系在前后各层之间交叉。差异可以解释者观察到的倾向评分分层与因素之间的交互作用。地平衡混杂偏倚,者把分娩镇痛(因素) 、倾向评分值混杂变量 (如本例的入院时宫口扩张程度)自变量,把结局变量剖宫产 (是/ 否) 因变量多因素条件 Lgisti 回归,分析因素的效应。最后,平衡各混杂因素作用后,硬膜外分娩镇痛仍然剖宫产率升高(R=3.7; 95 %I: 2.4 5.7)5。表 2 分层前后两对比组中入院时宫口扩张程度图 1 分层前后两组中入院时宫口扩张程度 三、倾向评分分层和回归分析中需要注意的问题1.倾向评分分层分析中需要注意的问题:在倾向评分分层分析时,者应该对两组的倾向评分值的范围分
8、析和。组和对照组的倾向评分值有足够的重叠范围,否则无法的平衡。如组的倾向评分值范围为 0.050.8,对照组的倾向评分值范围为 0.30.95,则的评价范围大约在 0.30.8 之间。对比组中远离倾向评分重叠范围的极端个体,识别和剔除将能够边缘层的可比性。传统的多因素分析方法难以识别极端个体,受到模型的误判。如 Glynn 等6在新泽西州的,体质较弱并有多种疾病的老年人较少使用降脂药物。者计算倾向评分识别出这类极端个体,剔除了对照的极端个体后分析,降脂药物对老年人群有的益处。 分层方法可以多种多样,而固定不变的。者可以样本情况决定分层和各层临界值,主要原则是分层后能最大限度地各层倾向评分值的性
9、。理论上讲,分层越多,层间距越小,则层内残余偏倚越小,可比性越强。分层过少,则层内可比性差,按层后也地消除组间差异。 ,分层过多,就会层内样本量,从而效应估计的稳定性,使推论性下降。也某一层中的太少而无法效应估计。hran7,将观察性中的某个混杂变量分为 5 层,就可以去除其 90%的偏倚。Rsenbau 和 Rubin1倾向评分分层同样的平衡。情况下,分层在 510 层合适。当然,的样本足够大,能够对比组在各层中的样本量,分层可以地平衡组间差异。倾向评分分层降低了非随机分组所带来的组间偏倚,了组间可比性,从而对效应更精确的估计。倾向评分分层将混杂变量综合为变量,只变量分层,解决了传统分层方法
10、中当需要平衡的混杂因素较多,分层太大而不可行的问题。与倾向评分配比相比,其纳入了或绝大多数的,其分析结果外推人群的代表性。当然,倾向评分分层分析方法也有同倾向评分配比类似的局限性,例如该方法只能观察到的变量,而像随机化那样平衡所有变量的分布,包括观察到的和未观察到的变量。 ,倾向评分估计在样本量足够大的条件下。在某些情况下,样本量较小的或混杂变量组间差异过大的(倾向评分重叠范围小 ),即使使用倾向评分分层,也无法消除该变量的组间不均衡性。2.倾向评分回归分析需要注意的问题:Rsenbau 和 Rubin8,多变量和多变量判别分析所用的协方差矩阵相同,一组协变量 X 对因素效应的多变量的点估计值
11、与基于这组协变量 X的线性判别式函数的单变量的结果是相同的。也说,用 Lgisti 回归计算了倾向评分值,效应也用 Lgisti 回归模型估计,计算倾向评分的协变量不变,则直接用各协变量后的效应点值应该与用倾向评分后的效应点值相同。既然如此,为还要使用分两步走的倾向评分而直接用多因素模型效应估计呢?主要的优势是者可以的模型( 如纳入较多的变量或多级交互项)来计算倾向评分,然后在最后的效应模型中使用少量的变量与倾向评分。倾向评分计算中不涉及结局变量,不用担心参数过多的问题及共线性的问题。在医学生物学中,自变量间的性或共线性问题,是产生有偏估计的。倾向评分综合了混杂因素的作用,将众多的因素综合为变
12、量,使估计因果的模型简单化,也可以最大限度地共线性作用所的偏差。模型中只包括少量的自变量,对模型的诊断比纳入较多变量要容易和7。此外,当观察的结局率较低,而混杂因素又较多的时候,往往很难找到合适的模型来估计的效应。用倾向评分法对混杂因素平衡后,再观察因素与结局变量的关系,则观察的效应会更为。在某些情况下,使用倾向评分回归要慎重。Rubin8,组和对照组的协方差差别,此时判别函数倾向评分的单调函数,则倾向评分预期的偏倚。种情况下,者倾向评分配比或分层分析更为合适。【参考文献】 1Rsenbau PR, Rubin DB. Reduing bias in bservatinal studies u
13、sing sublassifiatin n the prpensity sreJ. J A Stat Ass,1984,79: 516 524. 2Rsenbau PR, Rubin DB. The entral rle f the prpensity sre in bservatinal studies fr ausal effetsJ. Bietrika, 1983, 70, 41 55. 3DAgstin RB. Prpensity sre ethds fr bias redutin in the parisn f a treatent t a nn randized ntrl grup
14、J. Stat ed, 1998, 17: 2265 2281. 4Friglett FD, Lieberan E, Lang J., et al. A linial trial f ative anageent f labrJ. N Engl J ed, 1995, 333: 745 750.Lieberan E, Lang J, hen A, et al. Assiatin f epidural analgesia ith aesareans in nulliparus enJ. bstet Gynel, 1996, 88: 993 1000. 6Glynn RJ, Shneeeiss S
15、, ang PS, et al. Seletive presribing led t verestiatin f the benefits f lipid lering drugsJ. J lin Epideil, 2006, 59: 819 828. 7hran G. The effetiveness f adjustent by sublassifiatin in reving bias in bservatinal studiesJ. Bietris, 1968, 24: 205 213. 8Rubin D B. Using ultivariate athed sapling and regressin adjustent t ntrl bias in bservatinal studiesJ. J A Stat Ass, 1979,74: 318 324.