收藏 分享(赏)

倾向评分配比在SPSS软件上的实现.pdf

上传人:精品资料 文档编号:10101329 上传时间:2019-10-10 格式:PDF 页数:5 大小:2.20MB
下载 相关 举报
倾向评分配比在SPSS软件上的实现.pdf_第1页
第1页 / 共5页
倾向评分配比在SPSS软件上的实现.pdf_第2页
第2页 / 共5页
倾向评分配比在SPSS软件上的实现.pdf_第3页
第3页 / 共5页
倾向评分配比在SPSS软件上的实现.pdf_第4页
第4页 / 共5页
倾向评分配比在SPSS软件上的实现.pdf_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

1、J South Med Univ,2015,35(11):15971601 工597技术方法倾向评分配比在SPSS软件上的实现黄福强,杜春霖,孙梦辉,宁冰,罗颖,安胜利南方医科大学公共卫生与热带医学学院生物统计学系,广东广州510515摘要:目的研究倾向评分配比法在sPss软件上的实现,并对分析结果进行解释。方法通过安装与sPss对应版本能够连接的R软件和插件,以及实现倾向评分配比需要的程序包,在sPss界面添加Ps Matching模块,然后结合实例演示如何使用模块。结果成功实现了评分配比,并对匹配效果给出直观和定量的统计描述与评价。结论在sPss软件中,可以较为方便地实现倾向评分配比。关键

2、词:倾向评分;配比;标准化差异;sPssPropensity score matching in SPSSHUANG F“q细n璺DU Ch“,lfi”,SUN Me,lgh“NING Bf,l哥LUO yf”多AN S7lP”gffD印口rf聊e九f矿BdDs缸如ffcS,s曲oDf可P“川fc H明f巩so“fl盯n Med妇f u玎fL把,sifG“口九如扎g PrD口fHc捌j句L口的mfDry可Tr叩记讲Dfs朗seR巧印rc7z,G“口呼,lD“5如钮5,C7lf,z口Ab咖ct:obiec吐w Tb阳ali豫propensity sco阳matchinz in PS Matdli

3、ng module of阱,sS and interpret the analysis resllltsMetlIods The R sof|ware and plug-in that could lir_Il(with me corresponding versions of s】ss and propensi哆score matchingpadka霉re were instaUedA PS matching moduk was added in the SIsS interfaoe,and its u鸵was demonst豫ted wim test dataR鹤IIlb S00re es

4、血na墩m and耻a瑚t neighbof matd妇g was a出ieved埘出the fIS matching module,and岫fesulb ofqualitadve挑d qu锄dta廿ve statisdcal descrip石on and evalua矗on were presemed in the fo】m of a gr印h ma心ngCondu8ionProp叽sity score matdling can be accomplished convenienny u血g SPsS softv旧reKey words:properLsity sr嘭nearest mi膏h

5、bor mat小in露s州ardized differencq SPss倾向评分(propensity score matching,PSM)配比是一种可用于在非随机对照研究中涉及较多混杂因素情况下做因果推断的方法“3,在医学、心理学、社会学等领域的应用日趋流行,但目前多需要编程实现,从而限制了该方法的普遍使用。目前非统计专业人员最常使用的软件SPSS中尚无现成的PS配比模块,但是可通过安装有关插件获得点击式分析模块,包含最常用的logistic回归和最邻近匹配实现倾向评分配比和其他多种选项,如卡钳值、共同支持域、重复匹配、1:n匹配等,且可输出详细的评价匹配效果的均衡性统计量和图表4,本文拟

6、通过实例展示如何在SPSs软件上实现倾向评分匹配。1倾向评分配比原理倾向评分是指在一组混杂因素条件下,个观察对象接受某种处理的可能性,其大小可以通过将处理因素作为应变量,其他混杂因素作为自变量建立Logistic回归模型来估计b1。倾向评分配比就是利用倾向评分值收稿日期:201508,ll基金项目:广东省大学生创新创业训练项目(201512121102)作者简介:黄福强,Email:ll 87020398qqcom通信作者:安胜利,副教授,博士,Email:ASL0418126com从对照组中为处理组中的每个个体寻找一个或多个背景特征相同或相似的个体作为对照,最终两组的混杂因素也趋于均衡可比陆

7、1。目前利用倾向评分进行配比的方法较多,PS最邻近匹配是最常用的一种方法:首先根据协变量计算倾向评分值,Ps值在01之间,表示研究对象被分配到处理组(或者对照组)的概率n1。然后,将两组观察对象按照倾向评分值大小排序,从处理组中依次选出1个研究对象,从对照组中寻找倾向评分值与处理组中最相近的一个对象作为配比个体。如果对照组中同时有2个或2个以上倾向评分值相同的个体,则按随机的原则进行选择。配比成功的对象从源人群中移去,然后进入下一个处理对象的配比过程,直到处理组中全部对象完成匹配哺。为确保匹配效果,可设定卡钳值;当处理组和对照组样本量较大时,可为一个处理组对象匹配多个对照组对象;匹配效果可通过

8、比较处理组和对照组匹配前后的标准化差异或方差比,当标准化差异接近0或方差比接近1时,提示匹效果良好,PSM还可提供单个变量和整体在组间的均衡性检验。2 SPSS上的PS Matching模块21在SPSS上安装PS MatchiIlg模块(1)用户可以在htIp:wwwibmco州developeno万方数据工598。 J south Med Uni、2015,35(11):15971601 http:wwwjsmucomrksspssdevcen仃a1找到SPSS R插件进行安装,并在htIp:sourcefo玛ene饰rojectspsmspss倚les厂F载psmatching 3spe

9、。需注意不同的sPSS版本需要安装对应的SPSS R插件:SPSS 180及之前的版本无法安装,SPSS 190对应R 210,SPSS 200对应R 2120或者R2121,sPSS 210对应R 2142。安装成功后,PSMatching模块成为SPSS菜单的一部分,用户即可通过点击式操作实现倾向评分估计和匹配。(2)打开sPSS,按如下顺序点击Utilities一Extension bbuIldle一Instan Extension bulldle然后找到己下载好的spe文件进行安装,重启SPSS。22操作方法打开sPSS,点击Analvze中的PSMatching,弹出如图1的主对话框

10、。炒幽。生!I蟹1Dv“。二。: l。|,n l呻震然:篇i。n艟哪r帆杆eR吣由E鲔m帅H口Or帕mL叫t幢曩曲sn h女由n口神州“nHH幢HN的r嗍西sc州LH惰。由曲Cn唧氧p州tm -sfl枷Cn鲥咖s和rGN粕硼图1 Ps Matching模块的主操作界面Fig1 Main Dialog interface of t11e PS matching module(1)Estimation Alg嘶thm倾向评分算法,有Logistic回归和GAMlogit两种选择;MatchingAlgorithIn:匹配算法,有Nearest Neighbor Matching(最邻近匹配),Fu

11、u matching(完全匹配)“0和Optilllalmatching(最优匹配)3种方法酬;Discard units Outsideof Cor衄on Support:删除在共同支持域以外的观察单位,程序默认none;Smooth Cov撕ate:在广义相加模型中用到的选项。(2)ID V撕able选人序号;Bina珂仃eanllent indicator(O=con仃011砘atIllem):选人二分类处理因素,并规定0为对照组,1为处理组,且变量类型须定义为尺度变量;Cov撕ates:选人用于计算评分的协变量;Addi-tional Cov撕ates:选人和处理因素无关的协变量(注:

12、一种较好的变量选择办法是将结局变量与混杂因素构建二分类lo西stic回归模型,进行逐步回归,进入模型的变量放人Cov撕ates框内,剔除掉的变量选人AdditionalCovariates框内);Exact Matching on(onlv for NearcstNeighbor):根据选人的变量对个体进行精确匹配,仅适用于最邻近匹配方法。(3)点击Plots and output,出现如图2对话框。Plots下对应的五个选项依次为匹配前后的:评分直方图、个体匹配图、标准化差异直方图、各协变量标准化差异散点图、各协变量匹配前后变化线图;Resolmion(PPI):结果窗的显示比例;Outpu

13、t Datasets:输出匹配后的数据集,其中Matched cases和Paired cases分别以长型和宽型格式输出匹配后的数据集;Balance Statistics:均衡陛纡芒悒,默认给出基本纡阱量,Detailed中可选是否按层分析,仅适用于最邻近匹配方法。图2图形和结果界面Fig2 Dialog of Plots and oLlput(4)点击Options,出现如图3对话框。Matchingorder:选择匹配的顺序,默认从最大评分值开始匹配;Allow II印lacement:选择是否进行重复匹配;Subclassification:选择是否按照评分接近程度分为若干亚分类;M

14、atch one to many:选择匹配比例;Caliper:设定卡钳值,默认值为02。图3选项界面Fig 3 Dialog of叩fions万方数据http:,wwwj-smucom J south Med uni坼2015,35(11):1597-1601 工5993实例分析31数据背景为了探讨吸烟对冠心病发生的影响,对26例冠心病人和28例对照者进行病例对照研究,各因素的说明见表11 2|。表l冠心病8个可能的危险因素与赋值Tab1 Possible risk factors and assigmnent of coronary heartdisease32操作步骤以“吸烟”为处理因素

15、,除冠D病以外的其余变量为协变量构建估计PS的模型,如图4。勾选plots中的五个图,勾选Output Datasets中的paired cases(widefomat),点击Detailed;options中设定卡钳值Caliper为02,其余默认;然后在主对话框点击OK。 varIi啦smmhM啊ss哪涮u皓_赫_Dl吐,警笛耸_鲴 帅 1b日新temmmc柳,(0。cO呻H 1m柳em)硼F77一o!趔塑翟墨二一一 一1,血压史砬I, ,血宙3j,膏血t史阑,张晴葫双圳fI,#舫n1MafCa“女s fEJdUd啪呻f0HIbrN嘣enNemb0图4构造倾向评分匹配模型Fi94 Cons

16、truction of Propensi哆score matching m【)dE33输出结果331基本的匹配情况本例中处理组个体数大于对照组(表2)。表2样本匹配结果Tab2 Sample Size of PS Matching332整体均衡生检验输出结果“Overall balance test”中的尸三0999,显示cov撕ates框以及additional coc一撕ates框中选人的变量在两组整体间均衡I生较好。33_3匹配后的均衡性度量输出结果“Relativemultiv撕ate imbalaIlce L1”中的L1 measure43统计量理论上介于0和l之间。和匹配前相比,匹

17、配后的结果越小提示匹配效果越好,本例,匹配后的L1统计量为0769小于匹配前0878,提示匹配优良。334显示匹配后不均衡的变量输出结果“Relativemultiv撕ate imbalance L1”中,若川025提示变量存在不均衡性“5|,并按川大小从上至下排序给出,若在SPSS的PS自定义对话框选项中勾选including interaction,表格中还会给出这些变量间的交互项及二次项在处理组和对照组中的均数、对照组标准差、标准化均差等值。本例中,没有变量025,从而认为所有的变量在组间都均衡。335各个变量匹配前后的信息给出处理组、对照组匹配前后各变量的均值、对照组各变量的标准差、匹

18、配前后标准化均数差的变化,见表3。336评分分配图从图中可以大致推断匹配f青况的好坏。在倾向评分1:n的情况下,图5中每个点的大小表示权重“6|。本例,虽然处理组尚有较多未能匹配,但是获得匹配个体的倾向评分比较接近。因而匹配效果较好。337标准化差异变化线图该图将匹配前后的绝对标准化差异描点,并连线来反映差异是增加还是减小,线段变粗表示差异增大,从图6可知,大部分个体标准化差异减小,只有个变量略有增加。338 PS分布直方图默认J隋况下被核密度函数“6惟十覆盖,可用来比较配比前后评分分布的相似度,并提供共同支撑域面积的估计,若匹配后处理组和对照分布近似,提示匹配良好。由图7可见,匹配较好。33

19、9 SD分布直方图被核密度函数覆盖,可用于比较匹配前后变量、交互项、二次项标准化差异变化大小,若匹配后的标准化差异集中在O附近,提示不再存在系统差异。由图8可知,匹配后,本例不再存在系统差异,匹配较好。3310单变量SD散点图给出各协变量匹配前后的标准化差异,若匹配后变量对应点落在00士O25之间,则提示变量达到均衡。由图9,可知匹配良好。万方数据1600 J South Med Univ 2015,35(11):15971601 http:wwwjsmucom表3完整均衡性统计量1ab-3 Detaned blance staHs6csC0v撕ates Me弛s Tre酏ed Me蛐s Co

20、ntrol SD CoD肛ol StdMe锄D战Before ARcr Before Aner Before AfIer Before AfIerPmpcns时 0807 062l 0608 O608 0183 O183 1102 0072xl 25 12 2ooO 2000 2000 0577 O577 O632 O000x2 0488 023l O,154 0154 0376 0376 O660 O152x3 O488 O615 O538 0538 O519 O519 O100 O152x5 O439 O308 O231 O23l O439 O439 O414 O153x6 O244 O0

21、77 0077 O077 0277 O277 O384 0000x7 1512 1462 1462 I462 O776 O776 O07l 0000x8 0659 0538 O538 O538 O519 O519 0250 OooODismbution of Pmpensity ScoresO4 O5 O6 07 08 09 10Pmpens时Score图5评分分布图Fig5 Dotplot of indi、ridual young adults in eimermatChed or unmatched groupsGraph was producedusing routines from t

22、he MatChIt Package54蚤3。寮矗2olO00 02 O4 06 08 10Propensity scoreheI l contro_, T兀 诽O0 02 04 06 O8 1OPmpens时score4备3磊8 2。lOAll data Matched data图6标准化差异变化线图Fig6 Lineplot of standardized differences beforeand after matchingGraPh was Produced usingroutines of me MatchIt package一m :厕 O0 02 04 06 O8 10Prope

23、nsity scoredI :On仃0一一 可 弋 堋OO O2 O4 O6 08 1OPmpensity score图7 PS分布直方图Fig7 Distribution of ProPensit)r scores of smoking(treated)and no smoking(contr01)before and after matchjngwim overlaid kemel densit)r estimateGraph was produced using modified routines of me MatchIt PackageO8642OOOOOO口器暑LI一暗Ip口QNI

24、p口口go芎Ioo654320扫Is【Ioo65432O扫IsIIo凸万方数据http:wwwj-smucom12二I釜o8一雷占 04_Joo-JJ South Med Uni、2015,35(11):1597-1601Standardized dm色rences before matching, 、, ; 声5 1O O 5 00 O 5 l O 15Std diff爸renceStanda rdized di行erences after matching一15 10 一O5 O 0 O5 1O 1 5Std dif话rence图8 SD分布直方图Fig8 Histograms with

25、oVerlaid kemel density estimatesof standardized differences before and after matching1,O O5 O 05 1O图9单变量SD散点图Fig9 DotPlot of standardized mean differencesfor all coVa riates before and after matching观测变量的矫正是数据分析中重要的一部分,因为混杂因素会对处理效应的估计造成影响。倾向评分配工6D工比提供了一种有效的解决混杂偏倚的办法,即通过匹配,使处理组和对照组间的不均衡性达到最小化甚至完全消除。目

26、前倾向评分的应用越来越流行,但并未在医学、心理学和社会学以及其他一些领域达到广泛应用,其中个重要的原因就是缺少研究者都能普遍使用的软件,而SPSs以其点击式的操作和直观的结果一直为大多数研究人员所青睐,本文介绍了倾向评分模块在SPSS中的实现,并提供了详细的操作方法和结果解释。虽然该模块尚无法实现一些倾向评分的高级计算方法,但可满足大多数科研工作者的要求。也许在不久的将来,sPss新版本将会把PSM模块直接纳人软件中,并提供较为全面的计算方法。参考文献:1王永吉,蔡宏伟,夏结来,等倾向指数第一讲倾向指数的基本概念和研究步骤J中华流行病学杂表20lo,3(31):32王永吉,蔡宏伟,夏结来等倾向

27、指数第二讲倾向指数常用研究方法J中华流行病学杂志,2010,5(3I):53吴美京,吴骋,王睿,等倾向性评分法中评分值的估计方法及比较J中国卫生统讥2013,6(30):34皿oemmes FPropens时score眦cch啦in SPssEB,oLhtlp:arxivo吲ab“120163855杨梅肖靓沈裁等倾向评分法及其处理共线性黼白勺期娜院J中国卫生统计,2013,30(6):82486李智戈任爱国倾向评分配比法J中国生育健康杂志2010,21(2):12l-37李智文,李宏田,张乐,等用sPss宏程序实现观察对象的倾向评分配比J中国卫生统计2011,27(1):8990,92【8J

28、AustiIla PCA comparison of 12 algorithms for matching on也epropensity score【JjStatist Med,2014,331057-699St哪In EAMatching melh0(1s for cau鼢l infercnce:A rcview锄d a100k fo九ardJS诅t Sci,2010,25(1):12110H锄舳,砌opfcr S0Op岫al钏matching缸d related designsVia neto、rk玎owsLJJJ Comp Gr印h Stat,2006,15:6092711王永吉,蔡宏伟

29、,夏结来等倾向指数第三讲应用中的关键问题J 中华流徇揪志20lo,7(31):712孙振球徐勇勇医学统计学M第3舰北京:人民卫生出版社2004【13J Iacus MS,l(ing G,PonD GCEM:coa体cd exact ma科Iingsof啊are【JJJ Stat Softw,2009,30:l-271 14J Iacus SM,K啦G,Po玎o Gc螂al infc咖ce winlout balancechccking:coars姐cd exact m蛐gJPolitAl,2011,20:124【15JH锄sen BB,Bowers JCovariate bal舳ce in simple,stratified andclustered c锄p啪tive咖d斛JS协t Sci,2008,23:21936【16J Ho DE,Imai K,King G,et a1Matchmg硒nonpar锄etricpreprocessing for reducing model dependence in paramemc causalinfhenceJPolit Anal,2007,15:199236(编辑:吴锦雅)一l_T11_1111_笛”5OllsLIoo万方数据

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报