1、第十章路径分析学习目标 1. 了解路径分析和回归分析的区别,了解路径分析的假设条件; 2. 理解路径分析所涉及的基本概念; 3. 理解路径系数的求解原理,并能使用软件求出路径系数; 4. 能够检验中间变量的中间作用; 5. 能够使用Wright规则对路径图中的相关系数进行分解; 6. 理解对模型进行调试的意义,并能对模型进行检验; 7. 能够运用合适的软件,采用路径分析解决实际问题。 20世纪初,“Pearsn原理”在生物遗传学(在过去几乎就是我们现在所称的统计学)中占统治地位。Pearsn原理的一个基本内容就是相关关系是现实生活中最基本的关系,而因果关系仅是完全相关的(理论)极限。这种理论认
2、为没必要寻找变量之间的因果关系,只需计算相关系数。然而相关分析逐渐暴露出自身的很多局限:一是仅反映变量之间的线性关系;二是反映变量之间的关系是对称的,而很多变量之间的关系是非对称的;三是只有在正态假设下,正态细想才是有效的。在遗传学中,很多现象具有明显的因果关系,如父代与子代的基因关系,父代在前,子代在后,二者的关系只能是单向的,而非对称的。对这种变量结构进行思考,遗传学家休厄尔赖特(Sewall Wright)于19181921提出路径分析(path analysis),用来分析变量间的因果关系。现代的路径分析由于生物遗传学家、心理测验学家、计量经济学家以及社会学家的推进,引入隐变量(lat
3、en variable,又称unmeasured variable,不可观测变量),并允许变量间具有测量误差,并用极大似然估计代替了最小二乘法,成为路径系数主流的估计方法。路径分析现在成为多元分析的一种重要方法,广泛应用于遗传学、社会学、心理学、经济问题和市场调研领域。然而习惯上把基于最小二乘的传统的路径分析称作路径分析,而把基于极大似然的路径分析称作结构方程式模型(structural equation modeling , SEM)。本章主要介绍传统的路径分析,不进行特别说明,本章所提到的路径分析均指基于最小二乘的路径分析,结构方程模型放在下章介绍。关于基本概念如路径图、直接作用、间接作用
4、的理解对于掌握路径分析非常重要,这些概念共同构成了路径分析的基本理论。10.1 基本概念和理论10.1.1 路径图路径分析的主要工具是路径图,它采用一条带箭头的线(单箭头表示变量间的因果关系,双箭头表示变量间的相关关系)表示变量间预先设定的关系,箭头表明变量间的关系是线性的,很明显,箭头表示着一种因果关系发生的方向。在路径图中,观测变量一般写在矩形框内,不可观测变量一般写在椭圆框内,对于简单的路径模型,可以直接用字母表示变量,绘出路径图。C1BC2A图10111P21P1e12P12r2e2eP21P22P图101是一个简单的路径图,A表示父亲智商,B表示母亲智商,C1,C2是两个成年子女的智
5、商,e1, e2是与A, B不相关的另外原因变量。一般来说,父母亲的智商之间不存在关系;父母亲的智商对子女的智商存在因果关系,用单箭头表示;子女间存在相关关系,用双箭头表示。箭头上的字母表示路径系数,路径系数反映原因变量对结果变量的相对影响大小。在路径分析中,一般采用经过标准化后的变量,没有特别说明,均指经过标准化后的变量。可以把图101写成方程式的形式:12111 21 121222122212 2 11212121 2eeCpApBprACprBCpCpApBprACprBCp=+ + +=+ + +(10.1)式(10.1)实际上是普通的多元回归方程,多元回归分析是因果关系模型的一种,但
6、它是一种比较简单的因果关系模型,各个自变量对因变量的作用并列存在,它仅包含一个环节的因果结构。路径分析的优势在于它可以容纳多环节的因果结构,通过路径图把这些因果关系很清楚的表示出来,据此进行更深层次的分析,如比较各种因素之间的相对重要程度,计算变量和变量之间的直接和间接影响,这在后面会涉及。图102是有关一种消费性电子产品(如手机)路径分析的例子(这里省略了路径系数),四个变量中,耐用性、使用的简洁性、通话的效果和价格两两相关,决定感知价值,同时通过感知价值决定客户忠诚度。相对于图101,它具有两层因果关系。接下来主要是以图102为例,说明路径图中的一些基本概念。耐用性使用的简单性通话效果价格
7、感知价值客户忠诚度e5e6图102路径图上的变量分为两大类:一是外生变量(exogenous variable, 又称独立变量,源变量),它不受模型中其他变量的影响,如图102的耐用性、使用的简单性、通话效果和价格;与此相反,另一类是内生变量(endogenous variable, 又称因变量或下游变量),在路径图上至少有一个箭头指向它,它被模型中的其他一些变量所决定,如图102的感知价值由耐用性、使用的简单性、通话效果和价格四个变量和随机误差e5决定,忠诚度取决与四个外生变量、感知价值和随机误差e6。此外,我们可以将路径图中不影响其他变量的内生变量成为最终结果变量(ultimate res
8、ponse variable),最终结果变量不一定只有一个。图102中忠诚度是最终结果变量。10.1.2 内生变量和外生变量其他变量(A)对内生变量(B)的影响有两种情况:若A直接通过单向箭头对B具有因果影响,称A对B有直接作用(direct effect);若A对B 的作用是间接地通过其他变量(C)起作用称A对B有间接作用(indirect effect),称C为中间变量(mediator variable)。变量间的间接作用常常由多种路径最终总合而成。图102中,四个外生变量耐用性、使用的简单性、通话效果和价格既对忠诚度有直接作用,同时又通过感知价值对忠诚度具有间接作用。10.1.3 直接
9、作用和间接作用如果模型中包含中间变量,首先从理论角度考虑,这个中间作用是否有理论依据,其次实际工作者会提出这样的问题:“模型中中间变量的中间影响显著吗?”这些问题涉及对中间变量的间接作用进行检验。巴伦和肯尼(R. M. Barron, D.Kenny,1986)提出了检验中间变量间接作用是否统计显著的一种做法。第一步:用中间变量(感知价值)对外生变量耐用性,使用的简单性、通话效果和价格四个变量进行回归;第二步:用内生变量(感知价值)对外生变量耐用性、使用的简单性、通话效果和价格四个变量进行回归;第三步:用忠诚度对第一步中的四个变量以及中间变量感知价值进行回归。阿加沃尔和蒂斯(S. Agarwa
10、l, R. K. Teas, 1997)的工作表明“如果(a)在第一步的估计中解释变量统计显著;(b)在第二步的估计中解释变量统计显著;(c)在第三步的估计中变量统计显著,则说明中间变量的间接作用显著”。假设对图102进行简介作用检验,得到表101,见文献4。10.1.4 间接作用的检验第一步感知价值第二步忠诚度第三步忠诚度说明耐用性使用的简单性通话效果价格感知价值0.260.080.150.390.650.070.140.080.620.060.12Ns0.12部分间接作用部分间接作用部分间接作用完全间接作用因变量自变量表101间接影响的检验结果注:所有的间接作用参数均为统计显著的。对每一外
11、生变量,存在三种可能的中间结果:没有间接作用(no mediation)、部分间接作用(partial mediation)和完全间接作用(full mediation)。如果第一步中外生变量的回归系数不是统计显著或者第三步中(中间变量)感知价值的回归系数不显著,说明该外生变量不存在间接作用;如果某一外生变量(如耐用性、使用的简单性、和通话效果)再第一步和第三步中的回归系数都是统计显著的,说明该外生变量存在部分间接作用;如果某外生变量(价格)的回归系数在第一不显著,而在第三部不显著,说明该外生变量存在完全的间接作用。广义的路径模型有两种基本类型:递归模型和非递归模型。两种模型在分析时有所不同,
12、递归模型可以直接通过最小二乘求解,而非递归模型得求解比较复杂。尽管本章主要介绍基于最小二乘得路经分析(即递归路径模型),但同时也要求读者能够预先正确判断一个模型的所属类型,才能保证应用路径分析不会出错。因果关系结构中,全部为单向链条关系,无反馈作用得模型称为递归模型(recursive model)。无反馈作用意味着,各内生变量与其原因变量的误差项之间或各两个内生变量的误差之间必须相互独立。与递归模型相对的另一类模型称为非递归模型(nonrecursive model)。一般来说,非递归模型相对来说容易判断,如果一个模型不包括非递归模型的特征,便是递归模型。10.1.5 递归路径模型和非递归路
13、径模型如果一个路径模型包括以下四种情况,便是非递归模型。(1)模型中任何两个变量之间存在直接反馈作用,在路径图上表示为双向因果关系。如图10-3(a)所示。(2)某变量存在自身反馈作用,即该变量存在自相关,如图103(b)所示。(3)变量之间虽然没有直接反馈作用,但是存在间接反馈作用,及顺着某一变量及随后变量得路径方向循序前进,经过若干变量后,又能返回这一起始变量,如图103(c)所示。(4)内生变量的误差项与其它有关项相关,如结果变量得误差项与其原因项相关(图103(d),或者不同变量之间的误差项之间存在相关(图103(e)。A Bp12p21图103(a)图103(b)A B ABCA B
14、 A B CC图103(c)图103(d)图103(e)e2 e2e223p12p13p33p12p23p31p12p2,2ep12p23p12r32eer3,3ep2,2ep使用最小二乘的估计方法要求路径模型具有一些假设要求和限制,现在总结如下:(1)首先要求模型中各变量的函数关系为线性、可加,否则不能采用回归方法估计路径系数。如果变量之间存在交互作用,把交互项看作一个单独的变量,此时它与其他变量的函数关系同样满足线性、可加。(2)模型中各变量均为等间距测度。尽管路径分析中通常会使用二分数据(dichotomies data)或者顺序数据(ordinal data),然而不能使用超过一个值的
15、虚拟变量,因为这会违反递归性要求。10.1.6 (递归)路径模型的假设条件(3)每一内生变量的误差项不得与其前置变量相关,同时也不得与其他内生变量机器误差项相关。这是对模型递归性的要求。另外,模型不考虑外生变量的相关性,即不对外生变量的相关性进行分析。(4)模型中得因果关系必须为单向,不得包括各种形式的反馈作用。这同样是对模型递归性的要求。(5)各变量均为可观测变量,并且各变量的测量不能存在误差。这两个弱点在SEM技术中得到了克服,已经发展了一套成熟的处理隐变量和测量误差的技术。(6)变量间的多重共线性程度不能太高,否则路径系数估计值的误差将会很大。(7)需要足够的样本量。克兰(Kline,1
16、998)建议样本量得个数应该是需要估计的参数个数得10倍(20倍更理想)。上述假设条件用数学符号很容易说明,但有些抽象。任何一个(递归)路径模型都可以用结构方程组表示,假设和分别为模型中的内生和外生可观测变量向量:是的参系数矩阵,可以证明,若为路径递归模型,则总可以写成上三角矩阵,是的参系数矩阵,e为内生变量所对应的误差项,满足期望为零,两两不相关。则该路径模型的结构方程组为:12(, , )m =12( , ,., )n =mmBmmB mn,Be =+其中, 0Ee= ()E ee diag ee=(10.2)在上述假设下,采用最小二乘法可以很容易求得各个参数值,见文献【3】,并且可以单独
17、对其中一个方程求解。作为本节的结束,我们需要提醒读者:一个好的路径图并不意味着一定包含有尽可能多的箭头。相反,统计学上最感兴趣的情形是:应该寻找尽可能少的箭头去联结尽可能少的变量,而这时的路径图又能对所代表的样本拟合得好,即所谓模型简约性(parsimony),在后面有关拟合度的检验中我们对这段话会有更深的体会。路经分析技术是从分解相关系数发展出来的,因此分解相关系数在路径分析中带有一般性意义,并且是路经分析中很重要的一部分。通过对原因变量和结果变量的相关系数的分解,我们可以很清楚的看出造成相关关系的各种原因。有时也涉及对回归系数的分解,这里不进行介绍,有兴趣的读者可以参阅文献【7】。10.2
18、 分解相关系数CBADEF图10413r12r23r14p24p25p35p45p46p56p5,5ep6,6ep4,4ep4e5e6e下面举例说明相关系数的分解过程。图104为一假想的六个变量的路径图:A, B, C为三个两两相关的外生变量,A,B和残差项e4共同决定D;B,C,D和残差项e5决定E;最后,D,E和残差项e6影响最终结果变量F,工具有三层因果关系。对应于路径图,我们写出结构方程组:66,564655,45352544,2414654epEpDpFepDpCpBpEepBpApDeee+=+=+= (10.3)(10.4)(10.5)外生变量的相关关系在图中体现,内生变量的误差
19、项独立,内生变量的误差项与前置变量之间独立。在式(10.3)中,如果路径系数,已知,则D的方差为:14p24p)()var(244,24144epBpApEDe+=1224,2414122242144=+=eppprpp可以从上式计算出的大小。很容易看出,对其他的表达式存在同样的结果,残差项的路径系数由其他路径系数决定,并且该内生变量与其误差项的相关系数即为误差项的路径系数;另外,残差项的路径系数可由多元回归得决定系数算出,它们之间的关系为:21 Rpe=下面考虑相关系数的分解,首先分解A,D之间的相关系数,由于各变量均经过标准化处理,所以A,D的相关系数等于A,D乘积的期望值。即(变量D用式
20、(10.3)代替)可以看出,A与D的相关系数可以分解为两部分:p14 是A对D的直接作用,的存在是由于A与B之间的相关性引入了对D有直接影响的B的作用。然而,从因果分析角度,并未得到分解,它既不是直接作用,也不是间接作用,仅是由于原因变量之间的相关而引入的一项,我们一般称该项为未析部分(unanalyzed part)。ADr14ADErrAD=24121444,2414(4prpepBpApAEe+=+=(A的方差为1,A,B的协方差为r12,A与e4独立)2412pr2412pr由于A,B对D作用的对称性,所以很容易写出另外也很容易写出C,D相关系数的分解式:下面考虑分解B,E之间的相关系
21、数,变量E用式(10.4)代替:把r24 代入上式,整理后得14212414122424prpprprrBD+=+=243214312423141334prprprprrrCD+=+=)(55,453525255epDpCpBpBEBEErreBE+=2445233525rprpp +=451421452435232525pprppprprrBE+=此时,B,E之间的相关系数分为四部分,第一部分p25是B对E的直接作用;第二部分r23p35是未析部分,理由和分解A,D相关系数一样;第三部分p24p45是B通过中间变量D对E的间接作用;第四部分是未析部分和间接作用综合的结果。由于B和A的相关使得
22、B对E的作用一部份通过相关变量A,通过中间变量D,最终对E产生影响。接下来考虑分解D,E之间的相关系数,采用(10.4)代替E,得到如下的关系式:)(55,453525455epDpCpBpDEDEErreDE+=453525pprprCDBD+=把和代入,得到:142124prprBD+=24321431prprrCD+=35243235143125142125244545pprpprpprppprrDE+=这里,第一项p45为D对E的直接作用,第二项p24p25是我们前面尚未涉及得分解内容,对应路径图,既找不到间接作用的路径链条,也找不到涉及相关的路径图,这一部分产生的原因是相关系数所涉及
23、两个变量D,E的同时变化,而使D,E的样本数据表现出相关关系,这种相关关系成为伪相关(spurious correlation)。很多情况下存在伪相关问题,特别对于时间序列,菲利普斯(phillips, 1986)在理论上证明了不相关的单位根(unit root)变量之间会存在伪相关现象,现在伪相关已经成为时间序列的一个研究专题。第三项r21p14p25,第四项r31p14p35和第五项r32p24p35的意义相同,均因D,E的原因变量A,B和B,C之间的相关而致,既包括未析部分,又包括伪相关部分。通过上面对相关系数的分解,我们可以总结出,相关系数的分解可能产生四种类型的组成部分:(1)直接作
24、用;(2)间接作用;(3)由于原因变量相关而产生的未析部分;(4)由于共同原因的存在而产生的伪相关部分。路径系数分解的结果一般可以通过报表的形式把各种作用表现出来。然而,如果按照上面的步骤,相关系数的分解是非常繁琐的。赖特(Wright)提供了从路径图直接分解的规则。赖特认为,对于一个递归性的路径模型,任何两个变量的相关系数都可以表示成连接着两点之间的所有复合路径之和;而这个复合路径是按照下面三个规则选取的(Wright规则):(1)这个复合路径没有闭合环路;(2)这个复合路径中得箭头取向是不可有“先向前,再向后”,也就是说,该路径链上不止两个箭头时,要“先向后”尽可能多的次数,“再向前”尽可能少的次数;(3)对于有多个箭头对链,只可以取最远距离的一个箭头,即一条路径中不可以包含两个双箭头。结合Wright规则,在图105(a)中,若计算D和E的相关系数,路径DCE是合理的,而路径DCABCE则不可以(规则(1);在图105(b)中,若计算B和C的相关系数,路径BAC是合理的,而路径BDC则不可以(规则(2);在图105(c)中,若计算D和F的相关系数,路径DACF是合理的,而路径DABCF则不可以(规则(3))。ABCDEABCDA B CDE F图105(b)图105(a)图105(c)