1、心理科学进展2014,Vo122,No5,73 1-745 Advances in Psychological Science D0I:103724SPJ1042201400731 主编特邀(EditorInChief Invited) 编者按: 中介效应分析在许多领域都有广泛应用,因为它可以分析变量之间影响的过程和机制,相对于回 归分析,可以得到比较深入的结果。虽然中介分析不能肯定地说“证实”了什么,但可以帮助我们支持某 种理论而排除其竞争的理论。温忠麟教授及其合作者有关中介分析方法的研究,引领和推动了中介分析 在国内的应用,他们2004年发表在心理学报上的论文,在Google学术搜索上可以
2、查到被上千篇论 文引用。最近10年,中介效应分析方法和模型都有了许多发展,本文作者做了相当全面的综述,并尝试 澄清一些有争议的问题。这些看似不大的争议,在统计上还是很重要的,会影响检验流程。作者还就如 何分析因果关系,提出了理论分析的若干思路。本文对中介效应分析的逻辑和统计方法有相当透彻的理 解,在中介分析的立论、建模、检验和解释方面有很高的参考价值。本刊希望通过温忠麟和叶宝娟的这 篇文章,提高应用工作者涉及中介分析的论文质量。 (本文责任编辑:侯杰泰) 中介效应分析:方法和模型发展 温忠麟 , 叶宝娟 ( 华南师范大学心理应用研究中心| 理学院,广州51063l1 ( 香港考试及评核局,香港
3、) ( 江西师范大学心理学院,南昌330022) 摘要在心理学和其他社科研究领域,大量实证文章建立中介效应模型,以分析自变量对因变量的影响过 程和作用机制。检验中介效应最流行的方法是Baron和Kenny的逐步法,但近年来不断受到批评和质疑,有 人甚至呼吁停止使用其中的依次检验,改用目前普遍认为比较好的Bootstrap法直接检验系数乘积。本文对相 关的议题做了辨析,并讨论了中介分析中建立因果关系的方法。综合新近的研究成果 总结出一个中介效应分 析流程,并分别给出显变量和潜变量Mplus程序。最后介绍了中介效应模型的发展 关键词 中介效应;间接效应;逐步法;Bootstrap法;因果 分类号
4、B841 近年来,在心理学和其他社科研究领域,大 量实证文章建立中介效应(mediation effect)模型 进行分析。例如,Rucker,Preacher,Tormala和Petty (201 1)统计发现,2005至2009年发表在Journal of 收稿日期:20140206 +国家自然科学基金(31271l16)、教育部人文社会科学 重点研究基地项目(1 1JJD190005)、中国博士后科学基 金项目(2013M540535)、教育部人文社会科学研究青 年基金项目(13YJC190029)和江西省博士后科研择优 资助项目(2013KY08)资助。 通讯作者:温忠麟,Email:
5、wenzlscnueducn 731 Personality and Social Psychology(JPSP)和 Personality and Social Psychology Bulletin(PSPB) 上的文章,分别有59和65使用了中介检验。 国内心理学期刊上有关中介效应文章所占的比 例,也可以用引人注目来形容。中介效应模型可 以分析自变量对因变量影响的过程和作用机制, 相比单纯分析自变量对因变量影响的同类研究, 中介分析不仅方法上有进步,而且往往能得到 更多更深入的结果,这可以解释为什么中介分 析受到重视。 检验中介效应最流行的方法是Baron和 732 理科学进展 第22
6、卷 Kenny f1 986)的逐步法(causal steps approach)。但 是,近年来逐步法受到几乎是一边倒的批评和质 疑(例如,Edwards&Lambert,2007;Hayes,2009; Spencer,Zanna,&Fong,2005;Zhao,Lynch,& Chen,2OLO)。有人甚至呼吁停止使用依次(piecemea1) 检验(逐步法中的一个步骤),改用目前普遍认为比 较好的Bootstrap法直接检验系数乘积的显著性(如 Zhao et a1,2OLO)。本文在介绍各种中介分析方法后, 对这些批评逐一做了辨析,特别谈到中介分析如何 从理论上建立因果关系:综合新
7、近的中介效应方法 研究成果,总结出一个中介效应分析流程;还介绍 了中介效应模型的新近发展。 1 中介效应模型及检验方法介绍 考虑自变量 对因变量y的影响,如果 通 过影响变量 而对】,产生影响,则称M为中介变 量。例如,“家庭社会经济地位”影响“家庭功能”, 进而影响“青少年疏离感”。为了行文简便,避免在 回归方程中出现与方法讨论无关的截距项,假设 所有变量都已经中心化(即将数据减去样本均值, 中心化数据的均值为0)或者标准化(均值为0,标 准差为1),可用下列回归方程来描述变量之间的 关系(图I是相应的路径图): Y=cX+el (1) M=aX+e2 (2) Y=cX+bM+e3 (3)
8、其中方程(1)的系数c为自变量 对因变量y的总 效应;方程(2)的系数a为自变量 对中介变量M 的效应;方程(3)的系数b是在控制了自变量 的 影响后,中介变量 对因变量】,的效应;系数c 是在控制了中介变量 的影响后,自变量 对因 变量】,的直接效应;else3是回归残差。对于这样 的简单中介模型,中介效应等于间接效应 (indirect effect),即等于系数乘积口6,它与总效应 和直接效应有下面关系(MacKinnon,Warsi,& Dwyer,1995): C=c +ab (4) 检验中介效应最常用的方法是逐步检验回 归系数(Baron&Kermy,1986;Judd&Kenny
9、,1981; 温忠麟,张雷,侯杰泰,刘红云,2004),即通常说 的逐步法:(i)检验方程(1)的系数c(即检验4o:c= O);(ii)依次检验方程(2)的系数a(即检验凰:a=0) 和方程(3)的系数b(即检验风:b=0),有文献称 之为联合显著性检验ftest of joint significance, Hayes,2009)。如果(i)系数c显著,(ii)系数a和b 都显著,则中介效应显著。完全中介过程还要加 上:(iii)方程(3)的系数c 不显著。 上述Baron和Kenny(1986)的逐步法,第一 步检验的是 对y的总效应;第二步实际上是检 验系数乘积的显著性(即检验凰:ab
10、=0),通过依 次检验系数a和6来间接进行;第三步检验用来 区分完全中介还是部分中介。这三步其实是可以 分开进行的。区分每一步的目的对理解和讨论逐 步法很重要。特别地,我们将检验系数乘积(即检 验凰:ab=O)的依次检验与逐步法区分开来,前 者是后者的一个步骤。文献提到逐步法时,有的 是指全部步骤,有的却是指依次检验,不小心的 读者容易引起混淆。 系数乘积的检验(ep检验 :ab=0)是中介效 应检验的核心,下面先集中讨论其检验方法。依 臣二 二 y: 图1(a) 图1(b) 图1 中介模型示意图 M=aX+e Y=c +bM+e 第5期 温忠麟等:中介效应分析:方法和模型发展 733 次检验
11、是对系数乘积的间接检验,想法很直观, 如果检验结果是a0且b0,就可以推出 ab0。这个推理在代数上没有问题,但在统计 检验上如何呢?模拟研究发现,用依次检验来检 验no:ab=0,第一类错误率较低,低于设定的显 著性水平(如005)(MacKinnon,Lockwood, Hoffman,West,&Sheets,2002;温忠麟等,2004)。 这就是说,如果依次检验结果a和b都显著,已经 足够支持所要的结果,即a6显著。但依次检验的 检验力(power)也较低,即系数乘积实际上显著而 依次检验比较容易得出不显著的结论(Fritz& MacKinnon,2007;MacKinnon et
12、a1,2002)。 检验系数乘积更多的是直接针对假设4o:ab =0提出的检验方法。Sobel f1982)法就是比较有 名的一种。检验统计量为z= 6,其中h和b 分别是口和b的估计, 曲=a ;+ 2是 的 标准误,S 和S 分别是 和b的标准误。模拟研究 发现,Sobel法的检验力高于依次检验(MacKinnon et a1,2002;温忠麟等,2004)。但这个检验统计量 的推导需要假设 服从正态分布,就算其中每一 个系数都是正态分布,其乘积通常也不是正态的, 因而上面标准误s 的计算只是近似的,可能很 不准确。这样,Sobel检验的局限性是很明显的(方 杰,张敏强,2012;Haye
13、s,2009;MacKinnon,2008; MacKinnon,Lockwood,&Williams,2004)。 试图用来替代Sobel法直接检验40:ab=0 的方法至少有三类(方杰,张敏强,2012),包括乘 积分布法、Bootstrap法和马尔科夫链蒙特卡罗 fMCMC)法。乘积分布法默认动分布是两个正态 变量的乘积分布,根据乘积分布构建临界值进行 检验和区间估计(Fritz&MacKinnon,2007; MacKinnon et a1,2004;Tofighi&MacKinnon, 20111。 Bootstrap法是一种从样本中重复取样的方 法,前提条件是样本能够代表总体(当然
14、这也是通 常取样进行统计推论的要求)。Bootstrap法有多种 取样方案,其中一种简单的方案是从给定的样本 中有放回地重复取样以产生出许多样本,即将原 始样本当作Bootstrap总体,从这个Bootstrap总体 中重复取样以得到类似于原始样本的Bootstrap样 本(Wen,Marsh,&Hau,201O)。例如,将一个容量 为500的样本当作Bootstrap总体,从中有放回地 重复取样,可以得到一个Bootstrap样本(容量还 是500)。类似的可以得到很多Bootstrap样本(比 如1000个),对这1000个Bootstrap样本,可以得 到1000个系数乘积的估计值,其全
15、体记为a6。 将它们按数值从小到大排序,其中第25百分位 点和第975百分位点就构成 的一个置信度为 95的置信区间,据此就可以进行检验了:如果置 信区间不包含0,则系数乘积显著(方杰,张敏强, 2012;Preacher&Hayes,2008;Preacher,Rucker,& Hayes,2007;温忠麟,刘红云,侯杰泰,2012),这 样的检验方法称为非参数百分位Bootstrap法,检 验力高于Sobel检验(Fritz&Mackinnon,2007; MacKinnon et a1,2004)。检验力更高的是使用偏 差校正后的置信区间,即所谓的偏差校正的非参 数百分位Bootstra
16、p法(Edwards&Lambert,2007; 方杰,张敏强,2012;Fritz&MacKinnon,2007; MacKinnon,2008;Preacher&Hayes,2008;Taylor, MacKinnon,&Tein,2008;温忠麟等,2012)。在 Bootstrap法前面冠以“非参数”,是因为所论的 Bootstrap法不涉及总体分布及其参数(因而不要 求正态假设),利用样本所推导的经验分布代替总 体分布,属于非参数方法。 在中介效应分析中,马尔科夫链蒙特卡罗 (MCMC)法是一种贝叶斯统计方法(Ntzoufras, 2009;Yuan&MacKinnon,2009)。
17、具体一点说, MCMC法是在贝叶斯理论框架下,将马尔科夫链 过程引人到蒙特卡罗模拟中,实现抽样分布随模 拟的进行而改变的动态模拟(方杰,张敏强, 2012)。MCMC法需要较多的统计知识和复杂的算 法,还会涉及引起争论的先验分布(prior distribution)问题,这里不拟多说。 研究发现,上述三类方法中,用偏差校正的 非参数百分位Bootstrap法或者有先验信息的 MCMC法计算系数乘积的置信区间比Sobel法得 到的置信区间更精确,有更高的检验力(方杰,张 敏强,2012;Hayes&Scharkow,2013;MacKinnon, 2008;Preacher&Hayes,200
18、4;Yuan&MacKinnon, 2009)。常用的统计软件Mplus fMuthdn&Muth6n, 20l2)已经有简单的指令,调用Bootstrap法和 MCMC法计算系数乘积的置信区间,实现系数乘 积的Bootstrap法检验和MCMC法检验。不熟悉 Bootstrap法和MCMC法的读者,可以将其和最小 二乘法、极大似然法那样看待,利用统计软件提 734 理科学进展 第22卷 供的功能实现计算。但多数方法学文章都只推荐 Bootstrap法(例如Biesanz,Falk,&Savalei,2010; Cheung&Lau,2008;Fritz,Taylor,&MacKinnon,
19、2012;Hayes&Scharkow,2013;MacKinnon et a1, 2004;Pituch&Stapleton,2008;PituchStapleton &Kang,2006;Taylor et a1,2008),而且MCMC法 的先验分布通常也无法得到,所以到目前为止, Bootstrap法是公认的可以取代Sobel法而直接检 验系数乘积的方法。不过,偏差校正的非参数百 分位Bootstrap法在某些条件下的第一类错误率会 超过设定的显著性水平(如005)(方杰,张敏强, 2012;Fritz&MacKinnon,2007;MacKinnon et a1 2004),而非参数
20、百分位Bootstrap法没有这个问 题(Fritz et a1,2012)。 因为ab=CC ,所以检验间接效应也可以 通过检验Ho:cC =0来进行(Clogg,Petkova,& Shihadeh,1 992;Freedman&Schatzkin,1 992),称 为系数差异检验法,以区别上面讨论的系数乘积 检验法。但因为系数差异检验法的第一类错误率 明显高于系数乘积检验法(可能远高于005),所 以它们很早就输给了系数乘积检验法(MacKinnon et a1,2002;温忠麟等,2004),后面不提。 总结一下,检验间接效应可以分成两类,一 类是检验Ho:ab=0,另一类是检验 :c
21、c =0。检验凰:ab:0又可以分成间接检验和直接 检验两类。依次检验是间接检验Ho:ab=0而 Sobel检验、Bootstrap法、MCMC法等是直接检 验Ho:ab=0。直接检验tlo:ab=0比较好的方法 是偏差校正的非参数百分位Bootstrap法,应当取 代Sobel检验。研究者如果在乎检验的第一类错 误率,使用非参数百分位Bootstrap法比较妥当 (Fritz et a1,2012;Hayes&Scharkow,2013)。但很 多文献想当然就认为依次检验也应当让位给 Bootstrap法,至少从检验的角度来说是没有道理 的,下一节会详细讨论。 2对Baron和Kenny逐步
22、法的质疑和 辨析 Baron和Kenny(1986)的逐步法的每一步,都 有人提出批评和质疑,最彻底否定的要数Zhao等人 (2010)的文章。下面看看这些批评要点,逐一辨析。 21依次检验还有用吗? 就间接效应的检验而言,依次检验方程(2) 的系数a和方程(3)的系数b,是最多人使用的方 法。尽管早有方法文章已经建议使用Bootstrap法 直接检验系数乘积,但很多应用工作者还是照用 依次检验。依次检验受到欢迎的原因是方法简单, 容易理解和解释。方法学者不推荐也可以理解, 因为依次检验的检验力在各种方法中是最低的 (Fritz&MacKinnon,2007;Hay,2009;MacKinno
23、n et a1,2002)。就是说,依次检验比较不容易检验到 中介效应显著。但如果研究者用依次检验已经得 到显著的结果,检验力低的问题对其而言就不是 问题!此时,依次检验的结果甚至好过Bootstrap 法的结果,奇怪的是似乎很少人理解到的这一点, 下面给出理由。 设想甲乙两人用同一组数据检验系数乘积 (即检验风:ab=0),甲做依次检验结果显著,乙 用Bootstrap法检验结果也显著,甲的结果更好: (1)看着甲的结果,我们几乎可以肯定乙的检验结 果也是显著,因为Bootstrap法的检验力高于 Sobel检验(Fritz&MacKinnon,2007;MacKinnon et a1,20
24、04),后者又高于依次检验(MacKinnon et a1,2002);而看着乙的结果却不能判断甲的检验 结果是否显著f因为依次检验比较不容易得到显 著的结果)。(2)看着甲的结果,我们知道 显著影 响 而且 显著影响y,推论是间接效应显著; 看着乙的结果,我们只知道间接效应是显著的, 但不知道 是否显著影响 也不知道 是否 显著影响】,。(3)当检验结果是显著的时候,可能 的错误只是第一类的。检验力比较高的方法,通 常也有比较高的第一类错误率。前面说过,当设 定显著性水平005时,依次检验的第一类错误 率低于005(MacKinnon et a1,2002;温忠麟等, 2004),而Boot
25、strap法的第一类错误率可能会 超过005 fFritz&MacKinnon,2007:MacKinnon et a1,2004)。一般而言,甲的错误率不会比乙的 错误率高。综合上面三点可以说,如果检验结果 都显著,依次检验的结果强于Bootstrap法检验 结果。 但要注意,上面说的是已经得到“显著”结果 的情况(就像大多数投稿中的结果那样),才是依 次检验的结果强于Bootstrap法检验结果。但并不 意味着要推荐依次检验、不推荐Bootstrap法,因 为两者的检验力高低不同。我们推荐的检验方法 和步骤详见第3节。 第5期 温忠麟等:中介效应分析:方法和模型发展 735 22要先检验总
26、效应吗? 逐步法中第一步是检验方程(1)的系数c,有 些人认为没有必要(例如,MacKinnon,Krull,& Lockwood,2000;Zhao et a1,2010)。他们的论据是, 间接效应 6)的符号可能和直接效应(c )的符号相 反,使得总效应(c)不显著,但中介效应还是存在; 也可能存在两条中介路径,其间接效应大小相近 但符号相反,使得总效应不显著。就是说,即使总 效应不显著,间接效应还是可能存在。 这里其实涉及两个问题,一是要不要检验系 数C?二是中介效应要不要以系数c显著为前提 条件?第一个问题的答案是肯定的,因为研究者 肯定会关心X是否显著影响y。对于特定的两个 变量 和
27、y如果根据理论、经验或者与他们关 系密切的第三个变量 都无法设想 和】,之间 有关系的话,还会去研究 如何影响】,吗?文章 将如何立论?所以说,研究者肯定会关心X和】, 之间关系。 对于第二个问题,则涉及到“中介效应”概念 的定义问题。以系数C显著为前提条件是一种定 义,不用这个前提条件是另一种定义,从外延来 看,后者包含了前者。按概念的外延与内涵的反 变关系,后者的内涵缩小了。这是要引起重视的, 而不是仅仅支持或者反对这个系数c显著为前提 就完事。如果不加区分的使用两种不同定义的概 念,就会造成混乱。这方面应当向数学家学习,他 们将“数”的概念不断扩张的同时,也用不同的名 称进行区分,如整数
28、、有理数、实数和复数。 按Baron和Kenny(1986)定义,中介效应是 以系数c显著为前提,即 显著影响y为前提。 在这个定义下,分析中介效应可以解释 如何影 响 ,中介过程提供了 对y的作用机制” (MacKinnon&Fairchild,2009;温忠麟,侯杰泰, 张雷,2005)。涉及中介的应用文章往往会声称要 研究 对】,的作用(或影响)机制”。如果系数C不 显著,就说明 对y的影响不显著,如果还问 如何影响 或者 对y的作用机制是什么”,不 合常理。此时,合理的问题应当是 为何不影响 ,建模的逻辑已经与前面说的中介模型的逻辑 不同了。所以比较好的做法是将这种情形与通常 中介效应
29、区分开来,不少文献称之为“遮掩效应” (suppressing effects)(Kenny,2003;MacKinnon, 2008;MacKinnon et a1,2000,2002;Shrout& Bolger,2002)。如果间接效应和直接效应符号相反, 总效应就出现了被遮掩的情况,其绝对值比预料 的要低。 温忠麟等人(2012)的书上,将系数c不显著 的情形归入“广义中介分析”,既说明这种情形与 通常的中介分析有区别,也可以看出与中介分析 有联系。如果根据前后文可以自明,也可以删去 “广义”两字。说到底,如果是按传统的目的研究中 介效应,是要以系数c显著为前提,否则就是另 一个故事了
30、。比方说,如果一个人买了房子,你可 以问“他是通过中介买的,还是自己直接买的?” 但如果一个人没有房子,此时的问题应当是“他 为啥没有房子?”,可能根本就没有买过,也可能 买了又卖掉了(类似于符号相反的抵消)。从问题的 提出,到结果的解释,两种情形可能是很不同的 故事。 这样说来,我们不用去争论中介效应要不要 以系数C显著为前提,而是应当根据实际情况进 行立论,合理地提出相应的问题,建立模型进行 分析,并作出相应的解释。虽然系数c不显著还 是可以继续分析,但应当明白,系数c显著与否, 是不同的事情,用不同的名称区分开来是明智的 做法。与此相关的两个同义词,中介效应和间接 效应,也是有区分的。中
31、介效应一定是间接效应, 因而有的场合两者是一回事;但间接效应不一定 是中介效应(Mathieu&Taylor,2006;温忠麟等, 2004)。 23 区分完全中介和部分中介是否合适? 逐步法中最后一步,通过检验方程(3)的系 数c 来区分区分完全中介还是部分中介。如果系 数Ct不显著,属于完全中介(James&Brett,1984)。 Baron和Kenny(1986)认为完全中介是中介效应 存在的最强有力的证明。区分完全中介和部分中 介,是对中介效应模型的效应量的一种文字描述 (Preacher&Kelley,2011),可以帮助解释结果。 但完全中介和部分中介概念是有问题的。第 一,在总
32、效应小(但显著)的时候,间接效应可能 不到总效应的七成,直接效应已经不显著了,结 果是完全中介,与常理相悖。一般地说,当总效应 小且样本也小的时候,容易得到完全中介的结果 (Preacher&Hayes,2008),但其实完全中介的情 况是很少的(Baron&Kenny,1986;Iacobucci, 2008)。第二,当说 是 和y关系的完全中介时, 736 理科学进展 第22卷 排除了将来探索其他中介的可能性(Pituch, Whittaker,&Stapleton,2005)。Preacher和Hayes (2008)呼吁放弃完全中介的概念,将所有中介都 看作是部分中介。Zhao等人(2
33、0 1 0)建议直接报告 间接效应和直接效应的显著性,是可取的做法。 24逐步法能验证因果关系吗? 逐步法的英文“causal steps approach”按字面 翻译是“因果逐步法”,使得部分研究者误以为逐 步法可以证明因果关系,也有部分研究者质疑逐 步法其实得到的是相关关系,不是因果关系 (StoneRomero&Rosopa,2008)o 没错,逐步法建立模型的过程中,假设了变 量之间的影响关系,即 影响 影响 而且, 逐步法确实也不能验证因果关系。但这是所有统 计方法都存在的问题,即统计无法验证因果关 系。其实,连简单的回归分析,也有同样的问题。 变量之间因果关系的提出和假设,应当是
34、模 型建立之前要做的事情。中介模型中的每一个箭 头表示的因果关系,包括 , , “ y“,都要有理据,或者有某种学科理论支持, 或者有文献做铺垫,或者有经验常识作为佐证。 总之,因果链中的每一个关系,都要在提出假设 和建模之前得到支持,否则假设的模型就没有根 基。如果只有 和“ ,也可以推论 ,_+ ,做出假设。如果两个变量 和y的因果 关系比较明确,或者人们对因果关系比较有信心, 可以说 影响 ,否则可以说得委婉一点: 对y有预测作用”。 那么应当如何分析变量之间的因果关系 呢?这里不拟涉及哲学上的因果论,先看看社科 中比较经典的推论因果关系的3个准lJ(Cook& Campbell,197
35、9):(1)因和果共同变化;(2)因在果之 前发生;(3)排除因果联系外的其他解释。根据这 些准则,社科研究可以采用下面方法分析因果关 系:一是理论分析进行因果推理,二是实验设计 验证因果关系,三是追踪研究观察因果关系。 先说理论分析,这是通过问卷测量收集数据 进行中介分析必须要做的。对于两个相关的变量 和y(相关变量满足了因果关系的第一个准则), 通过下面理论分析可以增加对 的信心: (1)看 和y的变量属性, 是比】,更加本质 的(或者是长久的、稳定的)属性。一般来说,本质 属性影响状态属性,长期属性影响临时属性,稳 定属性影响不稳定属性。例如,学生的智力和学 业成绩,前者更加本质,应当是
36、智力影响成绩。又 如,成年人的身高比体重稳定,因而身高影响体 重。至于性别,从生物学知道是由染色体决定的, 相对于社科中的其他变量,性别更加本质和长久 稳定,所以社科中凡是与性别相关的变量,都可 以说受到性别的影响,即性别是这些变量的“因”。 (2)颠倒 和y的因果顺序,难以解释。就是 说“y 还不如 _+ 那样好解释。例如,性犯 罪数量与气温正相关,哪个是因?如果说性犯罪 数量影响气温,解释不通;而“气温升高使得性犯 罪数量增加”比较容易解释,一种解释是:气温高 一衣着暴露一诱发性犯罪;另一种解释是:气温 高一荷尔蒙分泌旺盛一引发性犯罪。又如,有人 调查发现,参加过补习的学生,平均成绩还不如
37、 从未参加过补习的学生,得到结论是补习不能提 高成绩。这里显然忽视了一个事实:成绩不好是 参加补习的一个原因,而不是结果。 (3)尽量排除共同原因引起的虚假效应(有关 虚假效应,参见侯杰泰,温忠麟,成子娟, 2004)。例如,婚龄与年医药费支出正相关,谁 是原因呢?都不是,年龄(代表时间)才是这两 个变量的共同原因。重要期刊要求作者检验方 法效应,也是一样道理,就是排除方法对各变 量的共同影响。 上面前两个分析都在支持因果关系的第二 个准则。即因在果之前发生。最后一个分析是支 持第三个准则,即排除其他解释。 再说实验设计,通常认为是验证因果关系最 有效的一种做法。上面说到的补习能否提高成绩 的
38、例子,如果进行实验设计,将同年级成绩相当 的学生分成实验组(参加补习,当然教师水平还不 能太差)和控制组(不参加补习),并且两组除了是 否补习不同外,其他会影响成绩的因素都控制到 基本相同,得到的结果能说明补习是否提高成 绩。实验设计的关键在于控制无关因素,即控制 与实验目的无关但可能会影响因变量的因素,然 后看看自变量的变化是否会引起因变量的变化, 读者可以参考研究方法中有关实验设计的论著 (如莫雷,温忠麟,陈彩琦,2007)。 既然实验可以验证因果关系,那么设计 、“ 和 P三个实验f是否需要第 三个实验,参考22节的讨论),就应当可以验证 第5期 温忠麟等:中介效应分析:方法和模型发展
39、737 中介效应的因果关系。如果第一个实验能验证 是导致 的原因,第二个实验能验证 是导致】, 的原因,那么间接路径的因果链就得到了验证 (Spencer et a1,2005)。当然,相同的变量,在每个 实验中都应当有相同的定义和测量。 如果要验证完全中介,则要通过所谓的过程 调节设计(moderationof-process design),先设计 一个实验验证 ;然后设计另一个实验,如 果控制了 无论 如何变化,】,都不会变化了 (Spencer et a1,2005)。前面说过,完全中介的情形 罕见,不拟赘述。 最后说说追踪研究。实验设计通常是在时间 很短的一次实验中观测涉及的变量,因
40、而需要假 设自变量的变化会对因变量产生即时的影响。但 在心理和其他社科领域,有些变量之间虽然有因 果关系,也可能需要一段时间才能观测到变化, 即所谓的滞后效应。例如,引进有效的教学手段, 难以立即改变学生的成绩。又如,学业成绩的改 变可能即时影响自信,但自信的改变却要一段时 间后才能影响学业成绩。这时,基于横断的实验 数据不能够对因果作出推断,应当采用追踪研究 获取纵向数据(Cole&Maxwell,2003)。 追踪研究是问隔一段时间对研究对象重复 测量(两次或多次)自变量、中介变量和因变量,获 得历时性的数据,用追踪数据分析技术(刘红云, 张雷,2005),检验自变量是否会影响后续观测的
41、中介变量,中介变量是否会影响后续观测的因变 量。Mackinnon,Fairchild和Fritz(2007)总结了至 少3种可以检验追踪数据的中介效应的方法,包 括自回归模型(autoregressive modeling),潜增长 模型(1atent growth modeling),和潜差异分数模型 (1atent difference score modeling)。 上述三类方法,都有一定的局限性。理论分 析只是一种因果推理,推理只要符合逻辑就是有 效推理,但不能保证推理一定正确。前面已经提 到过横断的实验数据的不足,追踪研究也有局限, 包括重复测量会引起的练习效应、疲劳效应等(温
42、忠麟,2009)。 总之,中介效应分析是否仅仅是相关分析, 关键要看内容。相关是不能证明因果的,回归或 者中介分析中的因果关系依靠统计以外的理论来 支撑(包括理论分析、实验、追踪调查等)。不能一 看到中介分析就认定仅仅是相关分析。如果有理 论分析,加上统计验证,我们就提高了对因果的 信心。所有方法都只能在一定程度上证实因果关 系,其中实验设计是最为可靠的方法。但所有方 法都不能说最终证实了因果关系,只能证伪,因 果关系的确立最终还是要经过实践的检验。最后 说明一下,这里所说的因果,包括直接因果和间 接因果。还有,我们是在统计意义上谈论因果关 系,只是集体规律,对个体可能无效。 3新的中介效应检
43、验流程 对于系数乘积的检验,温忠麟等人(2004)早 就意识到,如果检验结果都显著,依次检验结果 强于Sobel检验结果,所以在他们提出的检验流 程中,先进行依次检验,不显著才需要做Sobel检 验。现在,Sobel法由Bootstrap法取代,根据前面 的讨论,对中介效应的检验流程进行相应的修改 (见图2),步骤如下。 第一步,检验方程(1)的系数c,如果显著, 按中介效应立论,否则按遮掩效应立论。但无论 是否显著,都进行后续检验。 第二步,依次检验方程(2)的系数a和方程(3) 的系数b,如果两个都显著,则间接效应显著,转 到第四步;如果至少有一个不显著,进行第三步。 第三步,用Boots
44、trap法直接检验H0:ab=0。 如果显著,则间接效应显著,进行第四步;否则 间接效应不显著,停止分析。 第四步,检验方程(3)的系数c ,如果不显著, 即直接效应不显著,说明只有中介效应。如果显 著,即直接效应显著,进行第五步。 第五步,比较a6和c 的符号,如果同号,属 于部分中介效应,报告中介效应占总效应的比例 abc。如果异号,属于遮掩效应,报告间接效应与 直接效应的比例的绝对值labc I。 对这个流程,有几点说明: (1)当间接效应显著时,如果第一步检验后 按遮掩效应立论,最后结果按遮掩效应解释。如 果第一步检验后按中介效应立论,要根据 6和C 的符号进行解释,如果符号相反,按遮
45、掩效应解 释。就是说,开始按中介效应立论,不排除最后要 按遮掩效应解释,但这样的情况少见。 (2)关于中介效应的效应量,起码应当报告 abc或者abc I,并酌情报告其他效应量。Preacher 和Kelley(2011)给出了上10种效应量计算方法, 738 理科学进展 第22卷 其中 MacKinnon(2008, 也见 Fairchild, MacKinnon,Taborga,&Taylor,2009)定义的类似 于回归中的R 那样有方差解释率意义的效应量值 得注意,但这些效应量没有单调性r即中介效应 口6上升时,效应量可能反而下降),不好理解。至 于Preacher和Kelley(2O
46、l1)提出并推荐的中介效 应量指标 ,不仅缺乏统计意义,而且没有单调 性(Wen,under review),不用为好。 (3)这个流程主要是从参数检验的角度考虑 的。从参数估计角度看,一般认为,单单给出点估 计是不够的,应当给出区间估计。系数乘积a6的 置信区间计算应当用Bootstrap法代替Sobel法。 这样,为了做区间估计,Bootstrap法成为一个必 须的方法,而且依次检验也可以通过Bootstrap法 进行,即用Bootstrap法求出系数a和b的置信区 间进行检验(但单个的系数不像系数乘积那样肯 定会违背正态分布,所以使用Bootstrap法依次检 显著 按中介 报告 的 置
47、信区间 验a和b与通常的依次检验结果基本上不会有出 入)。有经验的研究者还可以通过区间估计看出方 程(31是否存在多重共线性问题。如果Bootstrap 法的置信区间过大,说明参数估计摇摆不定,可 能存在多重共线性问题。尽管如此,还是应当先 做依次检验,因为如果显著的话,结果强于直接 检验系数乘积。用附录1那样的简单Mplus程序, 可以一次性得到所要的全部结果,包括通常的依 次检验结果和Bootstrap法置信区间。 (4)如果直接效应显著,不排除存在其他中 介变量的可能,Zhao等人(201O)建议在讨论部分 说明这种可能性。 4基于结构方程的中介分析 如果测验的信度很高(如09以上),使
48、用显 变量和使用潜变量分析变量之间关系得到的结果 会很接近。但如果测验信度不是很高(如只是通常 一一 唧法检蛳 显著 1 , J 不显著 间接效应显著 I 检验系数c 间接效应不显 不显著 显著 直接效J 监不显著 直 R寿啐 贪效应 可能 I 曲与c 同号 I r 按中介效应 彩分 分 _应 解释结果 I 报告abc d6与c 异号 著 图2中介效应检验流程 按遮掩效应 解释结果 第5期 温忠麟等:中介效应分析:方法和模型发展 739 可接受的07左右),使用显变量分析变量之间关 系往往会低估效应(侯杰泰等,2004)。中介效应因 为涉及两个路径系数的乘积,受到的影响可能更 大。Ledger
49、wood和Shrout(2011)的模拟研究发现, 如果使用指标的均值作为显变量,中介效应的 估计值低估实际中介效应的比例与合成信度(叶 宝娟,温忠麟,2011)的乘积有关。例如,如果信 度都是O9,则中介效应的估计值是实际中介效 应的80( 09xO9)左右。但使用潜变量的弱点 是中介效应估计的标准误较大,降低了检验力。 就是说,使用潜变量的检验力通常低于使用显 变量的检验力。为此,Ledgerwood和Shrout建议, 如果测验信度不够高,使用两步分析策略:第一 步用显变量建模检验中介效应,第二步用潜变 量建模估计中介效应。不过,如果用潜变量检验 中介效应已经显著,就没有必要报告显变量分 析结果了。 为了方便,我们前面讨论的模型所涉及的变 量都是显变量,但有关的概念、模型路径图、分 析思路、检验方法和流程同样适用于潜变量。对 于潜变量的中介分析,只需将路径图中的长方形 框(表示显变量)换做椭圆形图框(表示潜变量)(温 忠麟等,2012)。使用结构方程,不仅可以同时处理 显变量和潜变量,还可