1、第7讲 探索性因子分析,一、基本概念二、基本原理三、EFA分析的几个关键问题四、EFA分析的操作程序五、实际调查案例剖析,一、基本概念因子分析(factor analysis),也称因素分析,可分为探索性因子分析(Exploratory Factor Analysis,EFA)和验证性因子分析(Confirmatory Factor Analysis,CFA)两种。在旅游研究领域,有许多涉及心理学方面的抽象概念,如游客的动机和满意度、景区所在地居民对旅游影响的感知等均很难用单一指标来表述,通常研究者们会通过构建繁杂的指标体系来进行测量。如何将上述繁杂的指标体系缩减为较少数量具有代表性意义的公共
2、评价因子,就需要借助探索性因子分析方法。,表1 美国马萨诸塞州科德角游客满意度评价指标,资料来源:Pizam, Neumann, and Reichel(1978).,探索性因子分析的目的在于找出量表的潜在结构,减少题项的数目,使之变为一组较少而彼此相关较大的变量。因而探索性因子分析是一种资料推导的分析。如果一个量表层面及所包含的题项已非常明确,使用者为再确认该量表各层面及所包含的题项是否如原先使用者所预期的,需要采用一定的方法加以验证,以探究量表的因素结构是否能与抽样样本适配,此种因子分析称为验证性因子分析。因而验证性因子分析是一种理论推导的分析。目前探索性因子分析方法在旅游研究领域的应用相
3、对较广,因而这里仅讨论探索性因子分析。,二、基本原理(一) 潜在变量模型与基本原则因子分析所得到的潜在变量,就是社会科学中所谓的抽象构念,因而因子模型又被称为潜在变量模型(latent variable model)。因子分析是一种潜在结构分析法,其假定每个变量(在量表中称为题项)均由两个部分所构成,一为公共因子(common factor),一为独特因子(unique factor)。公共因子的数目会比指标(原始题项)数少,而每个指标皆有一个独特因子,如果一个量表共有n个题项数,则也会有n个独特因子。,独特因子有两个假定: (1)所有的独特因子间互不相关; (2)所有的独特因子与所有的公共因
4、子间也不相关。而公共因子间则可能彼此相关,也可能不存在相关。如在直交转轴状态下,所有的公共因子间彼此没有相关;而在斜交转轴的情况下,所有的公共因子彼此间就有相关。 潜在变量的一个重要统计原则是局部独立性原则(principal of local independence)。如果一组观察变量背后确实存在潜在变量,当统计模型正确确定了潜在变量后,各观察变量之间所具有的相关就会消失,即具有统计独立性。如果观察变量的剩余方差中仍带有相关,那么局部独立性即不成立,此时因子分析所得到的结果并不适切。,因子分析对于潜在变量的定义与估计,有一个重要的方法学原则,称为简约原则(principle of pars
5、imony)。简约有结构简约和模型简约双重涵义,前者指观察变量与潜在变量之间具有最简化的结构特性,后者指最简单的模型应被视为最佳模型。测验所得的最佳化因子结构,称之为简化结构(simple structure),是因子分析的最重要的基本原则。,(二) 因子与共变结构因子分析所处理的材料是观察变量之间的共变,亦即利用数学原理来抽离一组观察变量之间的公共变异成分,然后利用这个公共变异成分来反推这些变量与此一公共部分的关系。如有一组观察变量,以X表示,第i与第j个观察变量间具有相关 ,从因子分析模型的观点来看, 系指两者的公共部分,此一公共部分可以系数 和(因子载荷量factor loading)来
6、表示,于是有,以三个观察变量( 、 、 )为例,在两两之间具有相关的情况下,可以计算出三个相关系数( 、 、 ),如图(a)所示。这三个观察变量的公共变异部分,可以F来表示,其与三个观察变量的关系可以图(b)表示 (a) 相关模型 (b) 潜在变量模型,三个相关系数可以 、 、 表示,亦即 、 、 。在不同的数学算则与限定条件下,可以求得前述方程中 、 、 的 、 、 三个系数的最佳解,此即因子分析所得到的参数估计结果。估计得出的共同部分F则称为公因子(common factor),此因子模式建立后,研究者即可利用F的估计分数来代表观察变量,达到资料简化的目的。,(三) 因子分析方程式因子分析
7、的一般数学模型可以表达为: 式中, 代表第j个变量的标准化分数; 为第i个公共因子;m为所有变量公共因子的数目; 为变量 的特殊因子; 为因子载荷量(factor loading),表示第i个公共因子对第j个变量的方差贡献。,(四)几个重要指标的计算 在因子分析中,涉及几个重要指标的计算:共同性、特征值和解释量。这里以三个变量抽取两个公共因子为例,三个变量的线性组合为:,表2 共同性、特征值与解释量的计算,三、因子分析的几个关键问题(一)使用因子分析的可能性并非所有的多变量数据均适合采用因子分析方法。SPSS软件提供4个统计量来判断观测数据是否适合进行因子分析。 1. KMO检验(Kaiser
8、-Meyer-Olkin Measure of Sampling Adequacy)KMO是Kaiser-Meyer-Olkin的取样适当性量数,其值变化于01之间。KMO值越接近于1,表示变量间的公共因子越多,变量间的偏相关(partial correlation)系数越低,越适合进行因子分析;当KMO系数过小时,表示变量偶对之间的相关不能被其他变量解释,进行因子分析不适合。,表3 KMO统计量的判断原理,资料来源:Kaiser (1974),根据Kaiser(1974)的观点,当KMO的值小于0.50时, 较不宜进行因子分析,KMO的值至少要在0.60以上, 才可以进行因子分析。,2. 巴
9、特利特球体检验(Bartlett test of sphericity)巴特利特球体检验的目的在于检验零假设(null hypothesis)“相关矩阵是一个单位矩阵”和备择假设“相关矩阵不是一个单位矩阵”何者成立。若检验结果的Sig. 值0.05,就要拒绝零假设而接受备择假设,表示该相关矩阵不是单位矩阵,代表总体的相关矩阵间有公共因子存在,适合进行因子分析。如检验结果的Sig. 值0.05,就要接受零假设,表示相关矩阵是单位矩阵,数据就不适宜进行因子分析。,3. 反映像相关矩阵(Anti-image correlation matrix)若以第n个题项变量为因变量(校标变量),其余各题项变量
10、为预测变量进行多元回归分析,此第n个校标变量能被预测变量预测的部分称为Pn,不能被预测变量预测的部分称为En,Pn即为该变量的映像,En为该变量的反映像。根据每个变量的反映像En即可求得各变量反映像共变量矩阵及反映像相关系数矩阵。反映像相关系数越小,表示变量间公共因子越多,变量越适合进行因子分析;反之,如果反映像相关系数越大,表示公共因子越少,越不适合进行因子分析。,反映像相关系数矩阵的对角线数值代表每一个变量的取样适当性量数(Measure of Sampling Adequacy; 简称MSA),SPSS软件输出结果中的MAS的数值的右边会加注“(a)”的标示。个别题项的MSA值越接近1,
11、表示此个别题项越适合投入于因子分析程序中。一般而言,当个别题项的MSA值小于0.50时,表明该题项不适合进行因子分析,在进行因子分析时可以考虑将之删除。,4. 共同性(communalities)共同性也称为公共因子方差,在SPSS软件输出的共同性结果中,如果共同性越低,表示该变量越不适合投入因子分析程序之中;共同性越高,表示该变量与其他变量可测量的共同特质越多,亦即该变量越有影响力。初始共同性表示萃取前各个变量的全部公共因子的载荷系数平方和,采用主成分分析方法萃取公共因子时,公共因子数等于变量因子数,所以初始共同性估计值均为1。萃取(extraction)对应的是萃取的共同性,如果因子分析时
12、要求输出全部公共因子,所萃取的共同性也等于1,如果以特征值大于1为标准输出公共因子,所萃取的共同性就会小于1。共同性估计值也可以作为项目分析时筛选题项是否合适的指标之一,若是题项的共同性低于0.20,可考虑将该题项删除。,(二)样本规模的确定一般而言,样本的规模越大越好。由于小样本变量之间的相关性随样本的波动大于大样本,因而来自大样本分析的因子比来自小样本的因子更适用。许多研究者曾对因子分析的样本规模进行有关研究,譬如,Gorsuch(1983)建议每个测量变量需要平均观察5个样本,而总样本规模不应少于100。Everitt(1975) 和Nunnally(1978)则提出样本与题项的比率为1
13、0:1。随着样本规模的增加,测量的随机误差会相互抵消,项目和实验参数开始稳定,增加样本就会显得不再重要。因而,对于超过300的样本而言,题项与调查样本的关系变得越来越不重要。Kass和Tinsley(1979)因而主张,每个题项调查人数为5-10人,直至总样本达到300。,Comrey和Lee(1992) 认为,样本规模小于50时是非常不佳的(very poor),样本规模达100时是不佳的(poor),200是普通的(fair),300是好的(good),500是非常好的(very good),1000左右则是理想的(excellent)。但这些简单的准则并不考虑所分析变量的数量和类型。当确
14、定样本的适当规模时,应该考虑测量变量的属性。在良好的条件下(共同性达0.70或更高,4-5个变量组成一个因子),样本规模达100就应该是足够的(虽然在可能的情况下,最好获得大样本)。在中等共同性(如0.40-0.70)和中等超估因子的情况下,获取200个或更多样本似乎是明智的。最后,在较差的条件下,任何样本规模可能都无法产生关于母体参数的准确估计。,(三)公共因子的数量确定经常令研究者困扰的一个问题是根据什么标准来确定公共因子的数量。在探索性因子分析中,常用的筛选原则有如下几种:1. Kaiser的特征值大于1的原则2. 碎石图检验法3. 方差百分比决定法4. 事先决定准则法,1. Kaise
15、r的特征值大于1的原则Kaiser(1960)认为,可以保留特征值大于1的因子作为公共因子。目前,很多研究者都根据该原则确定公共因子的数量。但该原则也存在着一定的局限性,如在题项较多的情况下,可能会高估公共因子的数量;反之,如果题项较少,则可能会低估公共因子的数量。低估因子的数量通常比高估因子的数量更槽糕,因为低估因子的数量意味着还有公共因子未被发现,从而限制新结构的发现。有关研究证实,当变量数目介于10-30,且共同性大于0.70时,采用特征值大于1的标准来确定公共因子的数量是最正确的(Stevens,2002)。当变量数目超过40或共同性低于0.40时,采用特征值大于1作为公共因子萃取的准
16、则可能会萃取过多的公共因子。,2. 碎石图检验法碎石图是以未转轴前的因子变异量(特征值)为纵坐标,因子数目为横坐标依序而绘制的折线图。根据碎石图因子变异量递减的情况,可以确定公共因子的数量。一般在碎石图中,因子变异量会有一个从由斜坡转为平坦的过程,在这个转折点以上的因子可以代表公共因子,而在这个转折点以下的因子则为特殊因子,不予采用。有关研究证实,当样本数量大于250,变量的共同性达0.60以上,且因子数目与题项数目的比值小于0.3时,使用碎石图准则可以产生精确的公共因子数量,如果变量的平均共同性只有0.30,且因子数目与题项数目的比值大于0.30时,采用碎石图无法获得精确的结果(Steven
17、s,2002)。,3. 方差百分比决定法该方法是根据所萃取的公共因子能够解释总方差的百分比来确定公共因子的数目,当所萃取的公共因子累积解释方差占总方差的百分比达到某一预设指标时,就可以停止抽取公共因子,之后的因子就不予以保留。在社会科学领域中,当所萃取的公共因子累积解释方差占总方差的百分比达到70%以上时,效果最佳;达60%以上时,就表示公共因子是可靠的;最低要求要达到50%以上(吴明隆,2010)。,4. 事先决定准则法如果研究者在进行因子分析前,已经参考相关理论或文献,对有关题项的因子构面已经有很明确的了解,也可以根据已有的构面确定公共因子的数目。但需要说明的是,这种事先决定准则法更适合于
18、验证性因子分析。,由于以上四种准则都有其内部局限性,因而一些研究者认为,这四个标准不应单独使用,Fabrigar等(1999)因而建议使用多种准则来确定模型中因子的合适数量。有人建议至少3-5个测量变量代表研究中的1个公共因子(MacCallum et al., 1999; Velicer & Fava, 1998)。所包括的测量变量总数应该是期望公共因子的3-5倍,选定的变量应该包括可能受各公共因子影响的多变量。台湾学者邱皓政(2010)也指出:“无论在哪一种因素分析模式下,每个因素至少要有三个测量变数是获得稳定结果的最起码标准”。,(四)转轴方法的选择因子萃取的转轴方法可分为直交转轴和斜交
19、转轴两类。 1. 直交转轴直交转轴限定各因子间不存在相关。方差最大旋转法通常被认为是最佳的正交转轴方法(Kaiser, 1958),在许多领域具有广泛的应用。一些研究人员偏好使用正交旋转,因为其简单和概念清晰。然而,该观点在几方面值得质疑:其一,对于许多结构而言,有许多理论和实证基础均期望这些结构是互相相关的,因此,斜交旋转提供了更准确和更现实的各结构可能是如何相关的陈述。因而从实质上看,通过最大方差和其他直交旋转施加的不相关因子的限制往往是不必要的,而且可能产生误导的结果。其次,由于直交旋转要求因子在多维空间相交,于90度,而斜交旋转允许小于90度取向,当变量集群在多维空间的相交小于90度时
20、,直交旋转可能产生较差的简单结构。最后,斜交旋转可以提供比直交旋转更多的信息。斜交旋转可以提供公共因子间的相关性估计。了解因子间的相关程度对于解释公共因子的概念性质经常是有用的。事实上,因子间大量相关表明高价因子可能存在。可以对因子相关矩阵进行进一步分析,以洞察这些高价因子的数量和性质,因而可以进一步完善研究者对数据的理解。由于正交旋转不提供因子间的相关性,因而不能确定数据中是否存在一个或多个高价因子。,2. 斜交转轴与直交转轴相反,斜交转轴允许因子间具有相关性。不像直交转轴,在斜交转轴中不存在某种占主导地位的方法。几种斜交旋转方法均被经常使用,而且均可以得到令人满意的结果。这些方法包括直接O
21、blimin方法(Direct Oblimin) , Promax方法(Promax)等。 由于在现实世界中各公共因子之间完全没有相关的可能性极小,因而一些研究者认为采用斜交转轴方法萃取公共因子效果可能更好。Nunnally和Bernstein(1994)认为可以利用成份相关矩阵来判断应该选择直交转轴还是斜交转轴,当各因子间的相关系数大于.30时,最好采用斜交转轴,如果因子间的相关系数小于.30时,则可采取直交转轴法。,(五)因子载荷选取指标准则一些学者从个别共同因子可以解释题项变量的差异程度,提出因子载荷选取的指标准则。一般而言,因子载荷越大,变量能测量到的公共因子特质越多,因而选取的因子载
22、荷越大,因子结构越佳。但是,如果选取的载荷阀值过高,可能又会低估公共因子的数量。Comrey和Lee (1992)指出,因子载荷大于0.71时,公共因子可以解释指标变量50%的方差,此时的因子载荷属于理想状况;但如果因子载荷小于.32,则公共因子可以解释指标变量的方差不到10%,此时因子载荷状况极不理想,测量题项变量无法有效反映其公共因子。也就是说,只有载荷达.32和以上的变量才可以被解释。,资料来源:Comrey和Lee (1992),表4 因子载荷选取指标准则,从理论上说,必须删除因子载荷在.32以下的题项。但在实际操作中,不同研究者在决定因子载荷的阀值时会有不同的偏好。如一些学者倾向于挑
23、选因子载荷0.6以上的题项组成公共因子(如Pizam等,1978);另一些学者则舍弃因子载荷在0.5以下的题项(如宋秋,2008;陈楠和乔光辉,2010;)或0.4以下的题项(如Ap和Crompton,1998;罗艳菊等,2007;黄宇等,2011)。台湾学者吴明隆(2010)认为:“在因素分析程序中,因素负荷量的挑选准则最好在0.4以上,此时共同因素解释题项变量的百分比为16%”。一般而言,当因子结构较佳时,可以考虑取较高的阀值,而当因子结构较差时,就要考虑取较低的阀值。,四、因子分析的操作程序 依据SPSS软件所提供的因子分析方法,其操作程序包括5个模块。,(一)描述统计(Descript
24、ives)在“因子分析”分析对话窗口中,单击“描述(D)”按钮,系统弹出“因子分析:描述统计”(Factor Analysis: Descriptives)对话框,如下图所示。,1. 统计量(Statistics)框 (1)单变量描述性(Univariate descriptives)复选框:输出各个题项的变量名称、平均数、标准差与有效观察值个数。 (2)原始分析结果(Initial solution)复选框:输出因子分析未转轴前的共同性、特征值、个别因子解释的方差百分比及所有公共因子累计解释百分比。 2. 相关矩阵(Correlation Matrix)框 (1)系数(Coefficient
25、s)复选框:输出题项变量间的相关系数矩阵。 (2)显著性水平(Significance levels)复选框:输出相关系数矩阵的显著性水平。 (3)行列式(Determinant)复选框:输出相关系数矩阵的行列式值。,(4)KMO和Barlett的球形检验(KMO and Barletts test of Sphericity)复选框:输出KMO抽样适当性参数与Bartlett球形检验结果。 (5)逆模型(Inverse)复选框:输出相关系数矩阵的逆矩阵。 (6)再生(Reproduced)复选框:输出再生相关阵,上三角形矩阵代表残差值,而主对角线及下三角形代表相关系数。 (7)反映像(Ant
26、i-image)复选框:输出反映像共变量及相关矩阵,反映像相关矩阵的对角线数值代表每一个变量的取样适当性量数(MSA)。,(二)因子抽取(Extraction)在“因子分析” 对话窗口中,单击“抽取(E)”按钮,系统弹出“因子分析:抽取” (Factor Analysis: Extraction)对话框,如下图所示。,1方法(Method)下拉框从方法下拉框可选择公共因子抽取方法。共包含7种公共因子抽取方法:主成分法(Principle components)、未加权的最小平方法(Unweighted least squares)、综合最小平方法(Generalized least squar
27、es)、最大似然(Maximum likelihood)、主轴因子分解(Principle axis factoring)、因子分解(Alpha factoring)、映像因子分解(Image factoring)。,2. 分析(Analyze)框 (1)相关性矩阵(Correlation matrix)复选框:以相关矩阵来萃取因子,选择此项才能输出标准化处理后的特征值,适用于参与分析的变量测度单位不同的情况。相关矩阵的对角线为变量与变量自身的相关系数,其数值为1。 (2)协方差矩阵(Covariance matrix)复选框:以协方差矩阵来萃取因子,适用于参与分析的变量测度单位相同的情况。协
28、方差矩阵的对角线为变量的方差。 3. 输出(Display)框 (1)未旋转的因子解(Unrotated factor solution)复选框:输出未经旋转的因子萃取结果。,(2)碎石图(Scree Plot)复选框:输出以特征值大小排列的因子序号为横轴,以对应的特征值为纵轴绘制的碎石图。碎石图有助于判别公共因子保留的数目。 4. 抽取(Extract)框 (1)基于特征值:特征值大于(Eigenvalues over)单选框:该项根据特征值大小来确定公共因子的萃取,系统默认取值为1,表示要求萃取那些特征值大于1的公共因子。由于此值为系统默认,使用者一般不要随意更改,使用者若要另设特征值指标
29、,必须要有相关的理论或文献支持,或要经验法则支持。,(2)因子的固定数量:要提取的因子(Number of factors)单选框:选取该项时,可以在后面的空格中输入限定的因子个数。理论上有多少个分析变量就有多少个因子,如果不知道该萃取多少个因子,也可以先输入所有因子,再根据输出结果中各公共因子的特征值、累计方差百分比、以及自己的需要等确定萃取多少个因子。 5. 最大收敛性迭代次数(Maximum Iterations for Convergence)框此项可指定因子分析收敛的最大迭代次数。系统默认的最大迭代次数为25,一般在进行因子分析时,此数值通常不用更改。但当数据量较大时,25次迭代可能
30、不够,此时可以将之改为50次、100次甚至更多。,(三)因子旋转(Rotation)在“因子分析”对话窗口,单击“旋转(R)”按钮,系统弹出“因子分析:旋转”(Factor Analysis: Rotation)对话框,如下图所示。,1方法(Method)框共有6种方法供使用者选择。 (1)无(None)单选框:此项表示不需要进行转轴。 (2)最大方差法(Varimax)单选框:方差最大旋转属于正交旋转,能够使每个因子上具有最高载荷的变量数最小。 (3)直接Oblimin方法(Direct Oblimin)单选框:属斜交转轴方法之一。选择此法时,需要在其下方“Delta”中键入一个小于或等于0
31、.80的数值。当Delta值取负数,且其绝对值越大时,表示因子间的斜交情形越不明显,Delta的数值越接近0.80,表示因子间的相关越高。系统默认的“Delta”值为0。 (4)最大四次方值法(Quartimax)单选框:属于正交转轴法之一。,(5)最大平衡值法(Equamax)单选框:属于正交转轴法之一。是Varmax方法和Quartimax方法的结合,可使在一个因子上有高载荷的变量数和变量中需要解释的因子数最少。 (6)Promax(Promax)单选框:又称最优转轴法,是斜交转轴法之一。选择此项时,需要在其下方的编辑框中键入Kappa值。其值应大于1,系统默认值为4,表示因子负荷量取4次
32、方以产生接近0但不为0的值,以估算出因子间的相关并简化因子。,2. 输出(Display)框 (1)旋转解(Rotated solution)复选框:输出因子旋转结果。正交旋转输出因子组型(pattern)矩阵及因子转换矩阵;斜交旋转输出因子组型矩阵、因子结构矩阵与因子相关矩阵。 (2)载荷图(Loading plot(s))复选框:输出经旋转后的因子载荷散点图。因子散点图可以显示题项变量与公共因子间的关系,若萃取的公共因子达三个以上,则会输出前三个公共因子的3D立体图;如果只萃取两个公共因子,则输出2D平面图。 3. 最大收敛性迭代次数(Maximum Iteration for conve
33、rgence)框指定转轴时执行的最大迭代次数,系统默认值为25,如果题项变量较多,无法进行默认的收敛最大迭代25次因子转轴时,可以将数值改大,如50或100。,(四)因子得分(Factor scores)在“因子分析”对话窗口中,单击“得分(S)”按钮,系统弹出“因子分析:因子得分”(Factor Analysis: Factor Scores)对话框,如下图所示。,保存为变量(Save as variable)框 (1)方法(Method)框指定计算因子得分的方法,系统提供3种方法供使用者选择。 1)回归(Regression)单选框:使用回归法。因子得分的均值为0,方差等于估计因子得分与实
34、际因子得分之间的多元相关的平方。回归法得分是根据Bayes思想导出的,得到的因子得分是有偏的,但计算结果误差较小。 2)Bartlett(B)单选框:使用Bartlett法。Bartlett因子得分是极大似然估计,也是加权最小二乘回归,得到的因子得分是无偏的,但计算结果误差较大。,3)Anderson-Rubin(A)单选框:使用Anderson-Rubin法。因子得分均值为0,标准差为1,且彼此不相关。 2. 显示因子得分系数矩阵(Display factor score coefficient matrix)框输出因子得分系数矩阵,是标准化后的得分系数。,(五)因子选项(Options)在
35、“因子分析”对话窗口中,单击“选项(O)”按钮,系统弹出“因子分析:选项”(Factor Analysis:Options)对话框,如下图所示。,1缺失值(Missing values)框可选择处理缺失值的方法,系统提供3种方法供使用者选择。 (1)按列表排除个案(Exclude cases listwise)单选框:观察变量只带有缺失值的记录全部删除后,再进行因子分析。 (2)按对象排除个案(Exclude cases pairwise)单选框:当因子分析计算涉及到的观察变量中含有缺失值的记录,则删除该记录后再进行因子分析。选择此项可以最大限度地利用得之不易的观察数据。 (3)使用均值替换(
36、Replace with mean)单选框:采用变量均值代替缺失值。如果观察值缺失的题项变量数目很多,选择该项可能会造成分析结果的偏误,因而选择何种方法,使用者应根据实际情况进行判断。,2. 系数显示格式(Coefficient Display Format)框(1)按大小排序(Sorted by size)复选框:载荷系数按数值大小排列,并构成矩阵。(2)取消小系数:绝对值如下(Suppress absolute values less than)复选框:因子负荷小于后面限定数据者不被输出,系统默认值为0.10,一般在选取题项时因子负荷量最好在0.45以上,此时公共因子解释题项的方差为20%
37、。,五、实际调查案例剖析本范例为基于EFA方法的森林游客游憩动机研究以福州市森林公园为例。在广泛阅读前人有关森林公园和生态旅游游客动机研究文献的基础上,初步拟定森林公园游客出游动机量表,并通过预测试,对量表项目进行修进,最后形成38个题项的调查量表,并于2011年9-10月期间在福州国家森林公园、闽侯国家森林公园和福清灵石山国家森林公园进行施测,正式发放问卷500份,回收487份,其中有效问卷462份。,表5 森林游客游憩动机测量指标,将462个调查样本输入SPSS 17.0软件进行EFA分析,采取主成份法萃取公因子,并采取方差最大直交旋转法对提取的公因子进行旋转,以使公因子有较满意的解释。在
38、第一次因子分析输出结果中,萃取的特征值大于1的公共因子达9个。通过进一步对输出结果进行观察,发现根据特征值大于1的标准提取的公共因子数目与根据碎石图判断的公共因子数目不一致。另外,输出的旋转矩阵中,一些公共因子仅由两个题项组成,属于不稳定结构。另有一些题项的因子载荷较小,可以删除;因而必须删除某些题项后再进行新的因子分析。,本文设定题项删除的原则为:(1)每次只删除一个题项,即进行新的因子分析,逐个删除题项,直至出现最佳因子结构为止; (2)在题项删除过程中,首先删除组成不稳定结构公因子的题项,删除时从因子载荷最大的题项开始; (3)其次删除因子载荷较小的题项,删除时从因子载荷量最小的题项开始
39、,直至所有题项的因子载荷均达到 .50以上为止; (4)接着删除某些同时在两个公因子中载荷超过 .45以上的题项; (5)最后考察各公因子是否能合理解释该构面的所有题项,删除那些无法合理解释的题项。,探索性因子分析重在“探索”二字。通过不断探索,删除了9个题项,共进行了10次因子分析,最后保留了29个题项。最后输出福州市森林公园游客游憩动机的最终因子分析结果。因子删除的顺序为:2526187319273836 。25: 感受新事物 9: 远离人群 26: 参加野外活动 27: 锻炼身体 18: 增进与家人和朋友的关系 38: 看尽可能多的东西7: 增长见识 36: 了解本土文化 31: 舒适的
40、气候,因子分析表明,福州市森林公园调查数据的KMO系数检验结果显示KMO= .863,达到“良好的”水平,表示变量间有公共因子存在;Bartlett球形检验的X 2值为4511.045(自由度为406),显著性概率值达p=0.0000.05,代表总体的相关矩阵间有公共因子存在。因而KMO系数检验和Bartlett球形检验均表明变量适合进行因子分析。因子分析结果表明特征值大于1的公共因子有6个;根据图1的碎石图进行判断,可以在第6和第7个特征值之间找到明显的转折点(图1),亦指示有6个公共因子存在;而且6个公共因子累积解释的方差占总方差的55.13%,超过50%的最低要求。因而,可以认为萃取6个
41、公共因子是合理的。,从表2的汇总结果可以看出,所有因子载荷均大于 .50,公共因子可以解释指标变量的方差达25%以上。共同性均达到 .40以上,也达到要求。29个题项的Cronbachs 系数为 .897,达到“理想”的水平,各个构面的Cronbachs 系数均达到 .60以上,表明各因子构面内部稳定性和一致性较高,各因子至少由3个题项构成,因子结构稳定。各共因子可以根据其所包含的共同特性进行命名。,表6 因子分析结果摘要表,第1个公共因子解释总方差的11.63%,由“观察生态景观”、“了解大自然”、“寻找相对原始的自然区域”、“回归大自然”、“欣赏自然美景” 和“接受生态环境教育”6个题项组
42、成,解释了森林游客具有回归大自然和在大自然中学习的动机,因而将之命名为回归和学习自然因子。第2个公共因子解释总方差的10.46%,由“换个心情”、“暂时摆脱繁忙”、“减少压力”、“追寻简单的生活方式”、“放松身心” 和“消磨时间”6个题项构成,解释了森林游客渴望通过消遣放松身心的休闲动机,因而将之命名为消遣放松因子。,第3个公共因子解释总方差的9.68%,由“品尝美食”、“价格实惠、物美价廉”、“享受优质服务”、“购买土特产、纪念品”和“追寻热闹气氛”5个题项组成,解释了森林游客具有喜好享受方面的动机,因而将之命名为享受乐趣因子。第4个公因子解释总方差的9.18%,由“探险猎奇”、“结识志趣相
43、同的新朋友”、“体验新的生活方式”、“慕名而来”、“增加聊资”和“发现自我”6个题项组成,反映森林游客具有自我提高的动机,因而将之命名为自我实现因子。,第5个公因子解释总方差的7.13%,由“风光摄影、绘画写生”、“旧地重游”和“追求时尚”3个题项组成,反映森林游客具有追求兴趣爱好的动机,因而将之命名为兴趣爱好因子。第6个公因子解释了总方差的7.05%,由“呼吸新鲜空气”、“追寻乡野气息”和“逃避喧嚣”3个题项组成,解释了森林游客具有逃避日常生活的动机,因而将至命名为逃避现实因子。根据各构面因子平均得分,可知福州市森林公园游客游憩动机的重要性排序是:逃避现实回归和学习自然消遣放松自我实现兴趣爱好享受乐趣。,思考题:一、什么是探索性因子分析? 二、确定变量适合因子分析的依据有哪些? 三、确定公共因子数量的原则有哪些? 四、为什么要进行因子的旋转?直交转轴与斜交转轴有什么区别?,