收藏 分享(赏)

结构方程模型(上海理工大学-电子商务研究中心---王林--博士).pptx

上传人:无敌 文档编号:639055 上传时间:2018-04-16 格式:PPTX 页数:69 大小:930.58KB
下载 相关 举报
结构方程模型(上海理工大学-电子商务研究中心---王林--博士).pptx_第1页
第1页 / 共69页
结构方程模型(上海理工大学-电子商务研究中心---王林--博士).pptx_第2页
第2页 / 共69页
结构方程模型(上海理工大学-电子商务研究中心---王林--博士).pptx_第3页
第3页 / 共69页
结构方程模型(上海理工大学-电子商务研究中心---王林--博士).pptx_第4页
第4页 / 共69页
结构方程模型(上海理工大学-电子商务研究中心---王林--博士).pptx_第5页
第5页 / 共69页
点击查看更多>>
资源描述

1、结构方程模型快速入门,上海理工大学电子商务研究院王林 博士 ,必备资料,吴明隆.结构方程模型AMOS的操作与应用M.重庆:重庆大学出版社,2009. SPSS15.0完整版安装包内嵌AMOS7.0软件. 1陈红,祁慧,汪鸥,龙如银.中国煤矿重大事故中故意违章行为影响因素结构方程模型研究J.系统工程理论与实践,2007,08:127-136. 2周钱,李一,孟超,陆化普.基于结构方程模型的交通需求分析J.清华大学学报(自然科学版),2008,05:879-882. 3倪鹏飞,白晶,杨旭.城市创新系统的关键因素及其影响机制基于全球436个城市数据的结构化方程模型J.中国工业经济,2011,02:1

2、6-25. 4贺爱忠,李韬武,盖延涛. 城市居民低碳利益关注和低碳责任意识对低碳消费的影响基于多群组结构方程模型的东、中、西部差异分析J.中国软科学,2011,08:185-192. 5李奇睿,王继军,郭满才.基于结构方程模型的安塞县商品型生态农业系统耦合关系J.农业工程学报,2012,16:240-247. 6劳可夫.基于多群组结构方程模型的绿色价值结构研究J.中国人口.资源与环境,2012,07:78-84. 7孙祥龙,陆建. 基于结构方程的拥挤收费公众可接受性模型J.哈尔滨工业大学学报,2012,12:140-144. 8杨晓冬,武永祥. 基于结构方程模型的城市住宅效用价值评价研究J.中

3、国软科学,2013,05:158-166. 9李涛,张璋. 科技创新能力与国家位势关系研究基于结构方程模型的量化分析J.中国软科学,2014,02:90-99. 10方福前,吕文慧.中国城镇居民福利水平影响因素分析基于阿马蒂亚森的能力方法和结构方程模型J.管理世界,2009,04:17-26.,CFA 与 EFA区别,EFA: Exploratory Factor Analysis(探索性因子分析)用来找出多元观测变量的本质结构、并进行处理降维的技术。因而,EFA能够将将具有错综复杂关系的变量综合为少数几个核心因子。CFA: Confirmatory Factor Analysis(验证性因子

4、分析)测试一个因子与相对应的测度项之间的关系是否符合研究者所设计的理论关系。,结构方程模型的原理,一、结构方程模型概述,1 结构方程模型应用线性方程表示观测变量与潜变量之间,以及潜在变量之间关系的一种多元统计方法,其实质是一种广义的一般线性模型。 2 发展历程20世纪70年代,一些学者(Joreskog,1973;Wiley,1973)将因子分析、路径分析等统计方法整合,提出结构方程初步概念。Joreskog与其合作者进一步发展矩阵模型的分析技术来处理共变结构的分析问题,提出测量模型与结构模型的概念,促成SEM的发展。Ullman(1996)定义结构方程为“一种验证一个或多个自变量与一个或多个

5、因变量之间一组相关关系的多元分析程式,其中自变量和因变量既可以是连续的,也可以是离散的”,突出其验证多个自变量与多个因变量之间关系的特点。,3 SEM与几种多元方法的比较SEM与传统多元统计方法(多元统计)传统多元统计方法:检验自变量和因变量的单一关系(多元方差分析可以处理多个,但是关系也是单一的)SEM:综合多种方法,验证性分析,允许测量误差的存在SEM与典型相关分析(多个自变量与多个因变量之间关系)典型相关分析:两组随机变量(定性或定量)之间线性密切程度;高维列联表各边际变量的线性关系;探索性分析SEM:估计多元和相互关联的因变量之间的线性关系;处理不可观测的假设概念;说明测量误差SEM与

6、联立方程模型(联立方程组、变量之间双向影响)联立方程模型:方程数量取决于内生变量的数量;只能处理有观察值的变量,假定不存在测量误差SEM:处理测量误差;分析潜在变量之间结构关系, SEM与人工神经网络(针对不可观测或潜在变量建模)人工神经网络:执行数据分析时,模型的隐含层接点仍然没有被明确标识出来;数据从输入层通过隐含变量流向输出层(输出向输入回流的网络拓扑结构)SEM:数据分析之前,已经标识潜在变量并构建起假设路径;观测变量都与中心潜在变量相关,潜在变量之间也可能发生关系。 SEM与偏最小二乘法(PLS)(集成多种分析方法,对因变量进行测量)PLS:对观测变量协方差矩阵的对角元素拟合较好,适

7、用于对数据点的分析,预测准确度较高SEM:对观测变量协方差矩阵的非对角元素的拟合较好,适合于对协方差结构的分析,参数估计更准确,4 SEM的技术特性具有理论先验性同时处理因素的测量关系和因素之间的结构关系以协方差矩阵的运用为核心适用于大样本分析(样本数200)包含不同的统计技术重视多重统计指标的运用5 样本规模大小资料符合常态、无遗漏值及例外值(Bentler & Chou, 1987)下,样本比例最小为估计参数的5倍、10倍则更为适当。当原始资料违反常态性假设时,样本比例应提升为估计参数的15倍。以ML法评估,Loehlin (1992)建议样本数至少为100 , 200较为适当。当样本数为

8、400500时,此法会变得过于敏感,而使得模式不适合。,二、结构方程模型的基本原理,(一)模型构成1 变量观测变量:能够观测到的变量(路径图中以长方形表示)潜在变量:难以直接观测到的抽象概念,由测量变量推估出来的变量(路径图中以椭圆形表示)内生变量:模型总会受到任何一个其他变量影响的变量(因变量;路径图会受到任何一个其他变量以单箭头指涉的变量外生变量:模型中不受任何其他变量影响但影响其他变量的变量(自变量;路径图中会指向任何一个其他变量,但不受任何变量以单箭头指涉的变量)中介变量:当内生变量同时做因变量和自变量时,表示该变量不仅被其他变量影响,还可能对其他变量产生影响。内生潜在变量:潜变量作为

9、内生变量外生观测变量:外生潜在变量的观测变量外生潜在变量:潜变量作为外生变量外生观测变量:外生潜在变量的观测变量中介潜变量:潜变量作为中介变量中介观测变量:中介潜在变量的观测变量,2 参数( “未知”和“估计” )潜在变量自身:总体的平均数或方差变量之间关系:因素载荷,路径系数,协方差参数类型:自由参数:参数大小必须通过统计程序加以估计固定参数:模型拟合过程中无须估计(1) 为潜在变量设定的测量尺度 将潜在变量下的各观测变量的残差项方差设置为1 将潜在变量下的观测变量的因子负荷固定为1(2)为提高模型识别度人为设定限定参数:多样本间比较(半自由参数),3 路径图(1)含义:路径分析的最有用的一

10、个工具,用图形形式表示变量之间的各种线性关系,包括直接的和间接的关系。(2)常用记号:矩形框表示观测变量圆或椭圆表示潜在变量小的圆或椭圆,或无任何框,表示方程或测量的误差单向箭头指向指标或观测变量,表示测量误差单向箭头指向因子或潜在变量,表示内生变量未能被外生潜在变量解释的部分,是方程的误差单向箭头连接的两个变量表示假定有因果关系,箭头由原因(外生)变量指向结果(内生)变量两个变量之间连线的两端都有箭头,表示它们之间互为因果弧形双箭头表示假定两个变量之间没有结构关系,但有相关关系变量之间没有任何连接线,表示假定它们之间没有 直接联系,(3)路径系数含义:路径分析模型的回归系数,用来衡量变量之间

11、影响程度或变量的效应大小(标准化系数、非标准化系数)类型:反映外生变量影响内生变量的路径系数反映内生变量影响内生变量的路径系数路径系数的下标:第一部分所指向的结果变量第二部分表示原因变量(4)效应分解直接效应:原因变量(外生或内生变量)对结果变量(内生变量)的直接影响,大小等于原因变量到结果变量的路径系数间接效应:原因变量通过一个或多个中介变量对结果变量所产生的影响,大小为所有从原因变量出发,通过所有中介变量结束于结果变量的路径系数乘积总效应:原因变量对结果变量的效应总和 总效应=直接效应+间接效应,3 矩阵方程式(1)和(2)是测量模型方程,(3)是结构模型方程 是外生观测变量向量, 为外生

12、潜在变量向量, 外生观测变量在外生潜在变量上的因子负荷矩阵, 外生观测变量的残差项向量; 为内生观测变量向量, 为内生潜在变量向量, 为内生观测向量在内生潜在变量上的因子负荷矩阵,为内生观测向量的残差项向量; 和 都是路径系数, 表示内生潜在变量之间的关系, 表示外生潜在变量对内生潜在变量的 影响, 为结构方程的误差项,测量模型:反映潜在变量和观测变量之间的关系,方程式:,结构模型:反映潜在变量之间因果关系,方程式:,结构方程模型的八种矩阵概念,(二)模型识别1 模型整体识别性(1)t法则数据资料点数DP=(p+q)*(p+q+1)/2 (p+q)表示观测变量个数待估参数数目(自由参数)t =

13、参数总数固定参数t DP,模型识别不足t = DP,模型充分识别(2)虚无B矩阵模型中没有任何内生变量去影响其他内生变量,无结构关系假设,没有任何结构参数( )的估计,B矩阵为0,模型自动识别。(3)递归法则B矩阵呈现三角形状态(对称矩阵,所有变量间的结构参数均加以估计),而 呈现对角线状态(仅估计干扰项的方差,干扰项的相关不列入估计),此时为递归模型且为饱和模型,模型自动识别,2 测量模型的识别性只有一个潜在变量,至少要有三个测量变量,其因素载荷必须不等于0,测量残差之间没有任何相关假设超过一个以上的潜在变量,每一个潜在变量只要有至少三个测量变量来估计,每一个测量变量只用以估计单一一个潜在变

14、量,残差之间没有共变假设潜在变量只以两个测量变量来估计,残差无相关,每一个测量变量只用以估计单一一个潜在变量且没有任何一个潜在变量的共变或方差为03 结构模型的识别性虚无B矩阵法则递归法则每一个方程式至少要有(q-1)个变量不属于非递归模型用以计算标准误的讯息矩阵必须可以被完全估计,并可以求出倒置信息矩阵,(三)参数估计1 假设条件测量模型误差项 , 的均值为零结构模型的残差项 的均值为零误差项 , 与因子 , 之间不相关,误差项 与 不相关残差项 与 , , 之间不相关2 共变推导 (1)协方差协方差:利用两个变量间观测值与其均值离差的期望观测两个变量间的关系强弱。(2)运算定理,(3)导出

15、矩阵,两个具有相关的潜在变量的CFA图,(3)导出矩阵观测变量方程式:,同一潜在变量的两个观测变量的协方差:,不同潜在变量的两个观测变量的协方差:,观测变量的方差:,逐一计算六个观测变量的方差与配对协方差,参数的方差与协方差导出矩阵( ),S矩阵:样本观测值的方差与协方差矩阵(6*6)残差矩阵=S 估计协方差矩阵与观测协方差矩阵的差异极小化,(4)参数估计策略加权最小平方策略(WLS)拟合函数:表示估计协方差矩阵与观察协方差矩阵的差异最大概似法(ML)基本假设:观察数据都是从总体中抽取得到的数据,且所抽取的样本必须是所有可能样本中被选择的几率最大者无加权最小平方法(ULS)一般化最小平方法(G

16、LS)渐进分布自由法(ADF)(5)迭代运算停止条件达到计算机预计的叠代次数,如25次模式收敛完成,亦即达到计算机预设标准,(四)模型拟合评价1 参数检验(1)参数的显著性检验t=参数估计值/标准误t的绝对值大于2,则参数即可达到.05的显著水平样本数低于30时,样本数越小, t值要越大才能超越显著水平的门槛(2)参数的合理性检验参数估计值是否有合理的实际意义:参数的符号是否符合理论假设参数的取值范围是否合理参数是否可以得到合理解释,2 模型整体评价,(五)模型修正1 参考标准模型所得结果是适当的所得模型的实际意义、模型变量间的实际意义和所得参数与实际假设的关系是合理的参考多个不同的整体拟合指

17、数2 修正原则省俭原则两个模型拟合度差别不大的情况下,应取两个模型中较简单的模型拟合度差别很大,应采取拟合更好的模型,暂不考虑模型的简洁性最后采用的模型应是用较少参数但符合实际意义,且能较好拟合数据的模型等同模式等同模式:用不同的方法表示各个潜在变量之间的关系,能得出基本相同的结果,参数个数相同,拟合程度相同的模式。实际意义多次验证,3 模型修正方向模型扩展方面(放松一些路径系数,提高拟合度)修正指数MI反映的是一个固定或限制参数被恢复自由时,卡方值可能减少的最小的量。如果MI变化很小,则修正没有意义;通常认为MI4,模型修正才有意义。(显著水平为0.05时,临界值为3.84)模型简约方面(删

18、除或限制一些路径系数,使模型变简洁)临界比率CR通过自由度调整卡方值,以供选择参数不是过多,又能满足一定拟合度的模型,寻找CR比率最小者单个参数调整设为0两个变量之间路径系数关系进行调整,设为相等4 模型修正内容(1)测量模型修正添加或删除因子载荷添加或删除因子之间的协方差添加或删除测量误差的协方差(2)结构模型修正增加或减少潜在变量数目添加或删减路径系数添加或删除残差项的协方差,1 验证性因子分析(CFA),一阶验证性因子分析,二阶(高阶)验证性因子分析,绩效,期望,满意度,忠诚度,2 路径分析,递归模型,D1,D2,非递归模型,自我效能感,社会期待,成就动机,学业表现,D1,D2,0.29

19、,0.63,0.21,0.02,0.13,0.16,路径分析参数估计图,自我效能对于学业表现的模型衍生相关:(轨迹法则)1 直接效应:自我效能 学业表现=0.292 间接效应:自我效能 成就动机 学业表现=0.133 相关间接效应:自我效能 社会期待 学业表现=0.13*0.16=0.02自我效能 社会期待 成就动机 学业表现=0.13*0.02*0.21=0.000546衍生相关为0.29+0.13+0.02+0.00=0.44,Y1,X2,X1,Y2,D1,D2,时间延宕非递归模型,工具型变量模型,3 统合模型分析,x1,x2,x3,F1满意度,F2忠诚度,y1,y2,y3,e,e4,Lx

20、1,b,D,e5,e6,e,e,测量残差,外生观察变量,因素负荷量,外生潜在变量,结构参数,内生潜在变量,因素负荷量,内生观察变量,结构模式,测量(CFA)模式,测量残差,Lx2,Lx3,Ly1,Ly2,Ly3,测量(CFA)模式,结构方程模型的AMOS实现,SPSS与Amos,一般的研究论文的数据分析部分少不了对样本的描述、对变量进行探索性因子分析(EFA),然后再利用多变量分析技术或SEM进行数据分析,最后提出研究结论(验证假说),提出建议。基于这样的了解,我们来看看SPSS与Amos所发挥的功能:,利用AMOS做统计检验,利用amos,所得到的值是显著性(p值),我们要用显著性和我们所设

21、的显著水平值做比较,如果显著性大于值,未达到显著水平,则接受虚无假说;如果显著性小于值,达到显著水平,则拒绝虚无假说(即发现有统计上的显著性)。在统计检验时,本书所设定的显著性水平皆是0.05(=0.05),Amos操作环境,启动Amos Graphics ,映入眼帘的是Amos的操作环境。左边是工具箱,中间是显示区,右边是绘图区。,二、建立模型建立路径图,1 制作潜在变量:,在工具箱中选“ ”,然后在绘图区从左上到右下拉出一个椭圆。,2 制作指标变量,指标变量包括观察变量和误差变量。在工具箱中选“ ”,然后在绘图区中的椭圆“ ”上点一下。就会出现指标变量,每多点一下,就出现一个指标变量。要改

22、变指标变量的方向,可以按“ ”。,3 建立潜在变量之间的关系,“ ”表示影响,因果关系。“ ”表示相关性。,4 读取数据文件,注意:在读取数据之前,要对数据的完整性(如遗漏值的处理、观察变量的信度等)进行处理。)在工具箱中选选择数据文件“ ”,在出现的“Data Files”窗口中,点击“File Name”,在 出现的“开启”窗口中,选择要读取的文件。数据的读入方式有两种:以观察变量的原始数据或者以观察变量相关系数矩阵读入。,5 交代变量名称,观察变量:在工具箱中选“ ”,就会出现“Variables in Dataset”窗口。此时,先点住变量名称,然后拖动到适当的观察变量上后松手,这个变

23、量名称就独到观察变量上了。潜在变量名称:在对象上双击就会出现“object properties”窗口,在“variable name”上键入文字即可。误差变量名称,可以按【plugins】、【name Unobserved Variables】。,6 完整模型:如图,显示重要参数:在工具箱中选“ ”,然后在绘图区点一下,出现下图,然后在Figure Caption 窗口中输入Chi Square=cmindf=dfp=p,点击ok,就会出现一下情况:,在工具箱中点击Calculate estimates的图示“ ”,产生估计值,在点击显示区的view the output path diag

24、ram 图示“ ”。结果如图显示:,三、分组,如果数据文件有必要分组,自读取数据文件之后,要分别交代Group Variable、Group Value,四、分析输出报表,1.违反估计2.正态性检验与异常值处理3.拟合度,1.违反估计,违反估计是指模型内统计所输出的估计系数,超出了可接受的范围。违反估计的项目有:负的误差方差的存在标准化系数超过或太接近1(通常以0.95为门槛),2.正态性检验与异常值处理,Asessment of normality表中的c.r.掉膘偏度系数或者峰度系数除以标准误的临界值,最后一行为Mardis多变量峰度系数c.r.。当c.r.大于2时,则暗示有些单变量可能具

25、有异常值。Observations farthest from the centroid表中通常看p2值,当p2值很小时(例如小于0.05)即表示该观察值为异常值。,3.拟合度,AMOS是以卡方统计量来进行检验的,一般以卡方值p大于0.05判断模型是否具有良好的拟合度。但是卡方统计量容易受到样本大小的影响,因此还要参考其他拟合指标。如下图:,四、模型修正,在regression weights表中,可看到Modification Indices(M.I.)值,找出误差变量之间最大的项目,是卡方值减少,p值增加,是我们修正模型的主要目标。,五、探索最佳模型,点【analyze】,在出现的“spe

26、cification search”工具列中,点击最左边的虚线“make arrow optional”的图标,然后在个变量之间的箭头上分别加以点选,使他们呈现出虚线。,五、探索最佳模型,在“specification search”工具列中,点“option”图示,在出现的“options”,其current results选“zero-based(min=0) ”,dian next search,在”retain only the best model”左边方格中,将数值设为10。,五、探索最佳模型,在“specification search”工具列中点“perform specifi

27、cation search”图标,就会产生“拟合指标汇总表”根据BCC与BIC来决定最佳模型。在specification search窗口中,先点r图示,再在模型所代表的数字上点两下,就会出现该模型的路径系数。,六、递归与非递归模型,PA-VO的路径分析有两种应用模型:递归与非递归。递归与非递归模型可以从两个角度来判别:1.变量之间有无回溯关系2.残差之间是否具有残差相关。,七、直接效果与间接效果,直接效果是某一变量对另一变量的直接影响。间接效果是某一变量通过某一中介变量对另一变量的直接影响。总效果等于直接效果加上间接效果。通常:如果直接效果大于间接效果,表示中介变量不发挥作用,可以忽略;如

28、果直接效果小于间接效果,表示中介变量具有影响力,要重视中介变量,5、针对结构方程的相关问题,5.1应用中存在的问题1)任何一种统计研究方法都有其严格的前提条件, 只有这些前提条件满足了, 才能够运用这个方法, 采用这个方法得到的结果才有意义。,2)结构方程模型采用的是验证性因素分析(CFA),这种因素分析方法与探索性因素分析(EFA),所基于的原理是不同的, 但多数应用这两种方法的学者不理解或者忽视它们之间的差别。应用探索性因素分析给出的值, 在很多情况对于考察潜变量是不合法的。探索性因素分析是根据样本数据所呈现的数据形态决定因子个数和因子指向, 我们经常用探索性因素分析来划分一些因子, 这样

29、的分析需要多时间、多地点、多样本的重复稳定结论的的支持, 才能作为验证性手段SEM的输入数据。一些学者, 本身做的是探索性的工作, 但又直接用同一个样本数据进行验证性因素分析以支持自己的结论,这是不科学的。,3)潜变量应当是反映型还是组合型的问题。对于我们常用的AMOS等软件包来讲, 每个潜变量都应当是反映型的。从变量特性来讲, 反映型是指潜变量决定观测变量(可度量变量), 即我们测量的是潜在概念的外在反映。组合型指的是由可度量变量以某种方式共同组成潜变量, 组合型潜变量由可见变量共同决定。许多学用者, 忽视这种差别而一味采用反映型潜变量, 这种做法可能导致逻辑混乱。例如, 决定个人的财产的指标有现金价值、股票价值、房产价值、汽车价值等四项指标, 对于这些相对独立的指标与个人财产之间的关系, 如果在西方社会样本中, 有可能是作为反映型变量考虑的, 但在中国样本中, 就应当考虑采用组合型潜变量, 在中国, 这四种财产价值往往不是同时增减的, 也即四项指标之间的关联性并不强。组合型潜变量使用PLS (Partia l Least Square)软件包,另一种非常实用的数据分析方法, 这种方法属于结构方程模型的特例。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 学术论文 > 管理论文

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报