结构方程模型讲义.ppt-道客多多

资源描述

1、结构方程模型,罗东霞,验证性因子分析 (CFA),验证性因子分析可以通过结构方程模型（Structure Equation Modeling, SEM）来实现它是以研究者最初构建的模型为基础，通过对数据的迭代计算来验证模型对数据的支持程度。（从一个初始估计出发寻找一系列近似解来解决问题）研究者可以根据理论和数据调整模型。如果模型拟合程度较高，则表明结构效度良好。验证性因子分析通过因子载荷来判断聚合效度，通过信赖区间检定法（Confidence Interval Test）和变异数抽取估值法（Variance Extracted Estimate）来验证区分效度。信赖区间检验法就是考察两

2、个因子之间的相关系数加减标准误的两倍是否包含1，如果不包含1，则表明数据有较高的区别效度（Anderson & Gerbing, 1988）。,GFI, t-, 2,EFA和CFA的区别,迭代,数值分析中通过从一个初始估计出发寻找一系列近似解来解决问题的过程，为实现这一过程所使用的方法统称为迭代法。与迭代法相对应的是直接法（一次解法），即一次性解决问题。当遇到复杂问题时，特别是在未知量很多，无法找到直接解法，此时就通过迭代法来解决。迭代是解决问题的一种基本方法，适合做重复性操作，可以对一定步骤进行重复执行，在每次执行这些步骤时，都从变量的原值推出它的一个新值。,变异数抽取检定法,Vari

3、ance extracted test 如果因子的变异数抽取估计值（Variance Extracted Estimates）该因子与其他因子的共同变异抽取值（相关系数的平方），则表明数据具有较高的辨别有效性（Fornell&Larcker,1981）。变异数抽取估计值：计算各因子非测量误差的变异数占变异数的比值。 R2（判定系数coefficient of determination）：已解释变异占总变异的百分比,判定系数R2 (Coefficient of Determination),为何要学SEM SEM: Structural Equation Modeling 结构方程建模：是

4、基于变量的协方差矩阵（或相关系数矩阵）来分析变量之间关系的一种统计方法，亦称为协方差结构分析我们只学习线性结构方程模型LISREL, lInear Structural RELationship,协方差和相关系数,协方差的大小依赖于随机变量X和Y的单位。相关系数的取值范围-1，1,科学的最高目标,1）把握因（cause）果（effect）关系 2）把握因果关系的最有力手段 3）科学也探索用相关方法考察因果关系 4）统计分析技术按因果探索而发展。 5）SEM是探索因果关系的一种相关研究方法,为何要用SEM,1）回归的预测应用不要SEM 2）回归的解释应用需要SEM 3）潜在变量的问题需要SE

5、M,潜在变量,很多心理研究中涉及的变量，都不能准确、直接地测量，这种变量称为潜变量（latent variable）例：智力、学习动机、家庭社会经济地位所以，我们退而求其次，用一些外显指标（observable indicators），去间接测量这些潜变量例：测量学生的家庭社会经济地位（潜变量），用学生父母教育程度、父母职业、父母收入等（外显指标）来测量。传统的统计分析方法不能妥善处理这些潜变量，而结构方程模型能同时处理潜变量及其指标。,潜在变量,简言之，结构方程模型是一个包含面很广的数学模型，可用以分析一些涉及潜变量的复杂关系。许多流行的传统方法（如回归分析），虽然容许因变量含测量

6、误差，但需要假设自变量没有误差。例：用回归方法以生长时间预测某植物的高度（生长时间是自变量，高度是因变量），假设生长时间的测量不含测量误差，但高度容许测量误差。,因果问题,1）SEM以相关数据评价假定的因果关系。 2）何时能说X引起Y？ 3）SEM探究概率的而非确定论的因果。,何时能说X引起Y？,X时间在先。（纵向设计）明确说明因果方向，比如不可逆，或者循环。（同时测量设计）常识、理论、经验研究的成果都可以成为说明的线索。难以说明怎么办？ X与Y之间的关系不因引进第三变量而消失（统计控制）。,结构方程模型的结构,结构方程模型可以分为测量方程（measurement）和结构方程（str

7、uctural equation）两部分测量方程描述潜变量与指标之间的关系如家庭收入等指标与社会经济地位的关系结构模型描述潜变量之间的关系如社会经济地位与学业成就的关系,x1,x2,1,2,1,1,2,y1,y2,1,2,1,1,2,矩阵形式的方程式,矩阵形式的方程式,而且与无相关存在,而且与无相关存在,转成向量形式,测量模型,LISREL应用示例,PRELIS 主要用于对数据进行前期处理和初步分析处理连续性数据探索性因子分析多元回归分析,结构模型,又称为潜在变量模型（latent variable models）或线性结构关系（linear structural relatio

8、nships）结构模型主要是建立潜在变量与潜在变量之间的关系，相当类似于路径分析模型，惟独不同的是路径分析模型使用观察变量，而结构模型使用潜在变量。在结构模型中除了涉及外因潜在变量（）、内因潜在变量（），也涉及潜在干扰，以表示。与之间的协方差矩阵以（psi）表示。内因潜在变量与内因潜在变量间的协方矩阵以表示，其结构系数矩阵为。外因潜在变量与内因潜在变量间的回归系数以（gamma）表示，其结构系数矩阵为,处理连续性数据,如何用菜单对连续性变量进行处理？读取EXCEL数据定义数据类型定义整体缺失值插入,读入其它格式数据文件,选择File菜单： Import Data in Free

9、Format Import External Data in other Formats 打开PSF窗口,定义变量类型,软件将.sav或.xls格式的数据文件读入并生成PSF文件时，变量默认为有序变量，你可以重新定义变量类别（例如，定义某变量为名义变量）点击PSF窗口中Data菜单的Define Variables选项激活Define Variables对话框从变量列表中选择变量以激活Define Variables对话框上的所有键点击Variable Type键打开Variable Types for对话框激活ordinal（也可选择其它按钮），选中Apply to all复选框点

10、OK，回到Define Variables对话框再点击Define Variables对话框上OK键回到PSF窗口点击File菜单上的Save选项保存修改后的数据文件*.psf,插入新变量,点击Data菜单Insert Variables选项，打开对话框点击OK键，在光标的左边，一个新变量就被插入到数据文件中点击Data菜单Define Variables选项激活Define Variables对话框选中刚才插入的变量点击Rename键，键入新的变量名点击OK键回到Define Variables对话框点击Define Variables对话框中的OK键得到PSF窗口点击Fi

11、le菜单上Save as选项，在“文件名”字符区键入新的文件名这样，一个新变量被插入到原有的数据集中并存储为新的文件名。但是，这个变量的所有值都是0,为新变量赋值,例：使这个新变量代表变量A和变量B的和点击Transformation菜单上的Compute选项打开Compute对话框选中并用鼠标将新变量拖入Compute对话框中的灰色字符区点击“=”键选中并用鼠标将变量A拖入Compute对话框中的灰色字符区点击“+”键选中并用鼠标将变量B拖入Compute对话框中的灰色字符区点OK看到PSF窗口点击File菜单上save选项保存,处理缺失值,删除含缺失值的观测对象，或者填

12、充缺失值。如何删除含缺失值的对象？ Listwise deletion（成列删除，即删除所有含缺失值的观测对象） Pairwise deletion（成对删除，即计算两个变量的相关系数时，只使用两个变量都有数据的那些样本）,处理缺失值,删除含缺失值的观测对象，或者填充缺失值。如何填补缺失值？匹配计算 impute by matching 多元计算 multiple imputation,如何删除含缺失值的对象？成列删除,定义整体缺失值，并成列删除打开PSF窗口，点Data菜单上Define Variables选项在变量列表中选择变量Group激活Define Variables对话

13、框上的所有键点击Missing Values键打开Missing Values for Group对话框，在Global missing value对应的字符区键入9 激活Deletion methods中的Listwise选项按钮点Ok，回Define Variables对话框点Ok，回PSF对话框,探索性因子分析,复习：因子分析的主要功能是将具有错综复杂关系的观测变量综合为少数几个因子，以再现原始变量与因子之间的相互关系，同时还可以根据不同因子对变量进行分类。因此，因子分析本质上是一种用来检测潜在结构是怎样影响观测变量的方法。因子分析主要有两种基本形式：探索性因子分析（EFA,

14、Exploratory Factor Analysis）和验证性因子分析（CFA, Confirmatory Factor Analysis）,EFA和CFA,当我们手中有原始数据资料，但纷繁复杂的表面关系让我们难以理清头绪的时候，EFA可以帮助我们找出事物内在的本质结构；而当我们头脑中已经有了明确的关系结构、清晰的思路，但仍对这一结构的正确与否有些怀疑，这时CFA可以帮助检验已知的特定结构是否按照预期的方式产生作用。,探索性因子分析,是在事先不知道影响因素的基础上，完全依据资料数据，利用统计软件以一定的原则进行因子分析，最后得出因子的过程。（因子结构未知）因此探索性主要是为了找出影响观测

15、变量的因子个数，以及各个因子和各个观测变量之间的相关程度。,验证性因子分析,验证性因子分析充分利用了先验信息，是在已知因子结构的情况下检验所搜集的数据资料是否按事先预定的结构方式产生作用。验证性因子分析的主要目的是检验事先定义因子的模型拟合实际数据的能力。进行验证性因子分析之前要求事先假设因子结构，我们要做的是检验它是否与观测数据一致。,探索性因子分析的基本步骤,收集观察变量,获得协方差阵,确定因子个数,提取公共因子,进行因子旋转,解释因子结构,获得因子得分,用得到的因子解释原始变量,Factor Loading 三个因子与各变量之间的相关系数，称为因子载荷量（loading）

16、系数绝对值越大，与相应因子的相关强度越强。,因子旋转,因子旋转：用一个正交阵右乘已经得到的因子载荷阵（由线性代数可知，一次正交变化对应坐标系的一次旋转），使旋转后的因子载荷阵结构简化。旋转的目的：清晰的负载矩阵，以便研究者进行因子解释及命名。 1. 方差最大化正交旋转(Varimax)：使负载的方差在因子内最大因子与因子之间没有相关，因子轴之间的夹角等于90度 2. 直接斜交转轴法(Direct Oblimin)：使因子负载的差积（cross-products）最小化。 3. Promax 转轴法：将直交转轴(varimax)的结果再进行有相关的斜交转轴。因子负荷量取2，4，6次方以产

17、生接近0但不为0的值，藉以找出因子间的相关，但仍保有最简化因素的特性。 2.3.与1.不同，因子与因子之间彼此有某种程度的相关，因素轴之间的夹角不是90度,优缺点,正交转轴的优点：因子之间提供的信息不会重叠，被试在某一个因子的分数与在其它因子的分数，彼此独立互不相关正交转轴的缺点：研究迫使因子之间不相关，但这种情况在实际的情境中往往并不常存在所以，有时会采用非正交转轴的方法。,探索性因子分析小结,一般来说，如果没有坚实的理论基础支撑，有关观测变量内部结构，一般用探索性因子分析。先用探索性因子分析产生一个内部结构的理论，再在此基础上用验证性因子分析，但必须用分开的数据集来做。如果直接

18、把探索性因子分析的结果放到同一数据的验证性因子分析中，就仅仅是拟合数据，而不是检验理论结构。合理的做法：用一半数据做探索性因子分析，然后把析取的因子用在剩下的一半数据中做验证性因子分析。,验证性因子分析,定义因子模型,收集观测值,获得相关系数矩阵,根据数据拟合模型,评价模型是否恰当,与其它模型比较,检验原始假设是否成立,验证性因子分析,如何编程如何阅读结果拟合指数的介绍,Factor Analysis,先有方块才有圈圈EFA 先有圈圈才有方块CFA,人文,科学,To explain why two tests are correlated To explain how the

19、entire scale is organization,验证性因子分析,例 :用17个题目测量350名学生的学习态度及取向，理论假设学习态度及取向分为5个维度(1-4为A，5-8为B，9-11为C，12-14为D，15-17为E)，且5个维度都分别相关，请问这假设是否符合实际数据？,思路,1)首先根据理论假设(模型MA)画出路径图；(见图3-1) 2)求得17题的相关矩阵； 3)根据路径图写出LISREL的程序； 4)RUN程序； 5)看各种拟合指数是否理想； 6)对模型进行修正； 7)得到各种参数值。,结构方程模型的结构,1.测量模型x=x+y= y+其中，：外源潜变量：内生潜变量x：外

20、源指标：x的误差项y：内生指标：y的误差项x：外源指标与外源潜变量的关系y：内生指标与内生潜变量的关系,结构方程模型的结构,2.结构模型对于潜变量间的关系，可用结构方程表示：=B+：内生潜变量。：外源潜变量。B：内生潜变量间的关系。：外源潜变量对内生潜变量的影响。：结构方程的残差项。,x1,x2,1,2,1,1,2,y1,y2,1,2,1,1,2,矩阵形式的方程式,矩阵形式的方程式,而且与无相关存在,而且与无相关存在,转成向量形式,测量模式,x1,x3,1,3,1,11,31,x2,2,21,x4,x6,4,6,1,42,62,x5,5,52,矩阵形式的方程式,用协方差矩阵表示：,转成

21、向量形式：, ：与之间的协方差矩阵：之间的协方差矩阵,：外因观察变量的测量误差,测量模式,路径图的图标规则,1.路径图的概念在结构方程模型中用直观的图形表达各变量之间的关系，这种图形称为路径图。 2.图标规则1)用圆或椭圆表示潜变量或因子2)用正方形或长方形表示观测变量或指标3)单向箭头表示单向影响或效应4)双向弧形箭头表示相关5)单向箭头且无起始图形表示测量误差或未被解释部分,LISREL数学方程常用符号的表示法及含义,(1-E1)(2-E2),1,2,3,4,5,1,2,3,4,5,(1-E1)(2-E2),(1-E1)(2-E2),结构方程模型的路径图 TD X LX PH GA B

22、E LY Y TE PS,结构方程模型的优点,1.同时处理多个因变量 2.允许自变量与因变量含测量误差 3.同时估计因子结构和因子关系 4.允许更大弹性的测量模型 5.估计整个模型的拟合程度,图3-1 学习态度及其取向模型MA,验证性因素分析程序的写法-1,1)数据输入：DA NI=17 NO=350 MA=KMKM SYDA为数据输入的命令，NI为观测变量数，NO为被试人数，MA为矩阵类型，KM为相关矩阵，SY为对称的。 2)模型建构：MO NX=17 NK=5 LX=FU,FI PH=ST TD=DI,FR PA LX 4(10000) 4(01000) 3(00100) 3(00010)

23、 3(00001)MO模型，NX观测变量X数目，NK潜变量数，LX为X与的关系矩阵，FU为完整，FI为固定，PH为之间的关系矩阵，ST为对称,对角线为1，对角线外自由估计，TD为X的误差矩阵，,MO,从MO开始,是对模型的建构和参数(parameter,PA)的设定其中描述了数个矩阵(LX-因子负荷矩阵NXNK,PH-因子间的协方差矩阵NKNK,TD-指标误差间的协方差矩阵NXNX) TD: Thelta-Delta,MO,设定某些元素（参数）为固定（FI，fixed）；某些元素自由估计（FR，free），代替路径图，去表达变量及因子间关系简单模型而言，在两种情况下要将元素固定。第一种情

24、况：希望某两个变量（指标或因子）间没有关系，将代表该关系的矩阵元素固定为0 例：x1不从属，将该因子负荷（）固定为0 第二种情况：需要设定因子的度量单位。因为观察变量（指标）所隐含的因子本身没有单位，不设定其单位无法计算。做法有二：一：将所有因子的方差固定为1（或其它常数），固定方差法。二：在每个因子中选择一个负荷固定为1（或其它常数），固定负荷法。一般来说，模型中除了因设定因子的度量单位而固定的路径外，所有需要估计的参数（因子负荷、指标的误差方差、因子之间的相关系数等），都设定为自由，让LISREL去估计。,验证性因素分析程序的写法-2,DI,FR为对角线元素为自由，非对角线元素固定为

25、0。 PA LX为矩阵LX的模式4(10000)表示连续4行格式相同，1为需要估计的参数(自由)，0为固定，即参数值为0。 3)结果输出 OU MI SS SC OU为结果输出命令，MI为要求输出修正指数，SS表示要求输出参数的标准化解，SC表示输出参数的完全标准化解。,DA NI=17 NO=350 MA=KMKM SY MO NX=17 NK=5 LX=FU,FI PH=ST TD=DI,FR PA LX 4(10000) 4(01000) 3(00100) 3(00010) 3(00001) OU MI SS SC,验证性因素分析程序的写法-4,4)验证性因素模型设定规则小结验证性因素

26、模型涉及3个矩阵LX、PH、TD。 LX中凡是表示X与有从属关系的，均设定为自由，无从属关系的，均设定为固定，两种表达方法：LX=FU,FI,然后列出要自由的元素，FR LX 1 1 LX 2 1 LX 3 1 或用PA LX表达，凡自由的元素用1表示，凡固定的用0表示。 PH若因子间允许相关，用PH=ST；若部分因子间允许相关，用PH=SY，FI；VA 1 PH1,1 PH2,2 PH3,3 再在FR后列出有相关的元素。 TD=DI,FR,结果输出和解释,1)输入的变量与被试等数据 2)参数设定 3)迭代次数 4)参数估计 5)平方复相关系数 6)拟合指数 7)修正指数 8)完全标准化解

27、9)模型分析结果解释(见图3-2),操作入门,1.新建一个命令文件点击菜单“File”下的“New”，打开一个小窗口，点击“Syntax Only”并按“确定”。然后编写程序。 2.打开一个命令文件点击菜单“File”下的“Open”，然后找到要打开的文件。,图3-2 模型MA的参数估计值,模型修正-1,1)模型修正：删去Q4，将Q8归入 1，新模型为MB。 2)按MB来修改程序 DELETE Q4, Move Q8 to Factor A SE；1 2 3 5 6 7 8 9 10 11 12 13 14 15 16 17/ MO NX=16 NK=5 PH=ST TD=DI,FR PA

28、 LX 3(10000) 3(01000) 1(10000) 3(00100) 3(00010) 3(00001) OU MI SS SC,Confirmatory Factor Analysis Example 1 Delete Q4, Move Q8 to Factor B DA NI=17 NO=350 KM SY SE; 1 2 3 5 6 7 8 9 10 11 12 13 14 15 16 17/ MO NX=16 NK=5 PH=ST TD=DI,FR PA LX 3(1 0 0 0 0) 3(0 1 0 0 0) 1(1 0 0 0 0) 3(0 0 1 0 0) 3(0 0

29、0 1 0) 3(0 0 0 0 1) OU MI SS SC,模型修正-2,3)模型MB的输出结果 4)模型MB输出结果的解释(见图3-3)*模型MB的Q8归属 1后，因子负荷很高(0.49)， 2(94)=149.51 2 /df=1.5RMSEA=0.040，NNFI=0.96，CFI=0.97。以上结果说明模型MB较MA理想。,模型修正-3,5)对MB作修正：即Q8改为同时归属A与B。新模型为Mc。其它程序不变，只改变 PA LX Mc输出结果：Q8在因子A的负荷为 3(10000) 0.54, 在因子B的负荷为-0.08。拟合 3(01000) 指数与MB基本相同，综合考虑我 1(1

30、1000) 们选择MB 。(见图3-4) 3(00100) 3(00010) 3(00001),结构方程模型的一些概念,1.潜变量(latent variable)：不能直接测量的变量，如智力、学业成就、动机、家庭社会经济地位等等。 2.内生变量（因变量）与外源变量（自变量）：在一组变量系统中，受其它变量影响的变量称内生变量，即因变量；而引起其它变量变化且自身变化是由系统外其它因素决定的变量称为外源变量，即自变量。如学业成就属于内生潜变量，而家庭社会经济地位则是外源潜变量。 3.外显指标(observable indicators)：间接测量潜变量的指标，如用语文、数学、英语三科成绩作为学业成

31、就的指标。,拟合指数,一、拟合指数概述二、绝对拟合指数三、相对拟合指数四、简约拟合指数五、一般需要报告的拟合指数,一、拟合指数概述,1.拟合指数的概念拟合指数是检查理论模型与实际数据是否拟合的指标，是表示再生协方差矩阵与样本协方差矩阵S的差异(S)的统计量。 2.理想的拟合指数的特征：(1)与样本容量无关 (2)惩罚复杂模型 (3)对误设模型敏感 3.拟合指数的分类 (1)绝对指数 (2)相对指数 (3)简约指数,二、绝对拟合指数,1.绝对拟合指数的概念绝对拟合指数是将理论模型Mt和饱和模型Ms比较得到的一个统计量。它是检查理论模型与样本数据的拟合程度。它包含基于拟合函数的指数、基于

32、离中参数的指数、近似误差指数、拟合优度指标等。 2.基于拟合函数的指数：2、2/df 3.基于离中参数的指数：Dk=(2-df)/(n-1) 4.近似误差指数： RMSEA(近似误差均方根) 5.拟合优度指标：GFI,GFI*,AGFI,AGFI*,三、相对拟合指数,1.相对拟合指数的概念相对拟合指数是将理论模型Mt与虚模型Mn比较得到的统计量。虚模型是指限制最多、拟合最不好的模型。 2.常用的相对拟合指数 1)非范拟合指数NNFI (non-normed fit index) 以虚模型为基准来衡量模型的拟合改进程度的指数，叫非范拟合指标。会超出0-1范围。 2).赋范拟合指数NFI (no

33、rmed fit index)在0-1范围内，但易受样本容量大小影响。 3)比较拟合指数CFI(comparative fit index) 取值0-1，有估计偏低，没有对复杂模型进行惩罚。,四、简约拟合指数,1.简约拟合指数设置的目的为惩罚复杂模型而设置。 2. 简约拟合指数的指标简约拟合指数用简约比乘以原拟合指数而得。简约比为dft/dfn dft、dfn分别为理论模型Mt和虚模型Mn的自由度。虚模型自由度最大，理论模型若简单，则简约比dft/dfn就较大，反之则较小。,五、一般常用的拟合指数,1. 2值：越小越好，P0.05 2. 2 /df ：越小越好，小于2或5 3. RMSEA(近似误差均方根) ：越小越好，小于0.05或0.08 4. AGFI*或GFI*(拟合优度指数) ：越大越好，一般应大于0.9 5. NNFI(非范拟合指数)：越大越好，一般应大于0.9 6. CFI(比较拟合指数)：越大越好，一般应大于0.9,

展开阅读全文