收藏 分享(赏)

第四讲-因子分析.ppt

上传人:weiwoduzun 文档编号:4194013 上传时间:2018-12-14 格式:PPT 页数:57 大小:1.94MB
下载 相关 举报
第四讲-因子分析.ppt_第1页
第1页 / 共57页
第四讲-因子分析.ppt_第2页
第2页 / 共57页
第四讲-因子分析.ppt_第3页
第3页 / 共57页
第四讲-因子分析.ppt_第4页
第4页 / 共57页
第四讲-因子分析.ppt_第5页
第5页 / 共57页
点击查看更多>>
资源描述

1、第七章 因子分析,第一节 因子分析概述,第二节 因子分析模型及概念,第三节 因子载荷矩阵求解,第四节 公因子重要性的分析,第五节 实例分析与计算机实现,第一节 因子分析概述,因子分析(factor analysis)也是一种降维、简化数据的技术。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个“抽象”的变量来表示其基本的数据结构。这几个抽象的变量被称作“因子”,能反映原来众多变量的主要信息。原始的变量是可观测的显在变量,而因子一般是不可观测的潜在变量。,第一节 因子分析概述(factor analysis),何谓因子?分析变量之间往往存在相关性,变量之间为何会有相关

2、性呢?这是因为往往有一些共同的因子支配着这些相关的变量。例如,随着年龄的增长,儿童的身高、体重会随着变化,具有一定的相关性;身高和体重之间为何会有相关性呢?因为存在着一个同时支配或影响着身高与体重的生长因子。因子分析就是通过对多个变量的相关系数矩阵的研究,找出同时影响或支配所有变量的共性因子的多元统计方法。因子分析的应用(1)寻求基本结构:通过对变量间相关关系探测,寻找作用于这些具有强相关关系的变量的共同因子,用这些较少的几个因子代表原数据的基本结构。(2)数据简化:用个数较少的几个因子变量替代原变量进行回归分析、聚类分析等,因子分析问题举例,问题2:影响大学生考试成绩的因素分析100个学生的

3、数学、物理、化学、语文、历史、英语成绩的相关系数矩阵。,因子分析的基本思想,假定可用变量间的相关性把它们分组,即假设组内的所用变量之间是高度相关,而不同组的变量间是弱相关。假定每一组变量,存在一个导致其组内变量高度相关的潜在(不能观察)公共因子,并且这些因子变量具有以下特点: 因子变量的数量远远少于原始变量的个数; 因子变量并非原始变量的简单取舍,而是一种新的综合; 因子变量之间没有线性关系; 因子变量具有明显解释性,可以最大限度地发挥专业分析的作用。假定因子对观测变量的影响是线性的,即观测变量可用因子的线性组合表示。因子分析的基本问题: 一类是探测性因子分析;另一类是证实性因子分析。,第二节

4、 因子分析模型及概念,一 因子分析的数学模型,二 因子载荷阵的统计意义,一、因子分析的数学模型,求公共因子的核心是求因子载荷矩阵,二、因子载荷阵的统计意义,二、因子载荷阵的统计意义,补充:因子分析的基本步骤,因子分析的核心问题:一是如何构造因子变量;二是如何对因子变量进行命名解释。因此,因子分析的基本步骤和解决思路就是围绕这两个核心问题展开的。基本步骤: (1)进行变量之间的相关性检验,确认待分析的这些变量是否适合作因子分析。 (2)构造因子变量:确定因子的个数,求负载矩阵。 (3)利用旋转方法使因子变量更具有可解释性。 (4)计算因子变量得分。以便在其他分析中使用,因子分析的流程图,补充:因

5、子分析的基本步骤,补充:因子分析&主成分分析区别,模型有区别 主成分解释了原来变量的全部变差,没有方差损失,而公因子只解释原来变量的部分变差(特殊因子未被计算),有方差损失。 因子分析中的公因子(旋转后)没有主成分那么综合,公因子往往可以找到实际含义,而主成分一般找不到实际的含义,补充: 变量之间的相关性检验,检验的意义:因子分析的前提是观测变量X1, X2, , Xp之间具有相关性。如果相关性较低,则他们不可能共享公因子,只有相关性较高时,才适合作因子分析。SPSS提供的3种检验 反映象相关矩阵检验(Anti-image correlation matrix) 巴特利特球度检验(Bartle

6、tt test of sphericity) KMO(Kaiser-Meyer-Olkin) KMO越接近1,越适合作因子分析;KMO越小,则越不适合作因子分析。Kaiser给出了一个KMO的度量标准:0.9以上 非常适合;0.8-0.9 很适合;0.7-0.8 适合;0.6-0.7 不太适合;0.5-0.6 很勉强; 0.5以下不适合。,第三节 因子载荷矩阵求解,一 因子载荷矩阵的求解,二 约相关阵的估计(不要求),一、因子载荷矩阵的求解,因子个数确定,确定因子个数的方法主要有:(主成分法) (1)特征值准则:选取特征值大于等于1的因子(主成分)作为初始因子,通过求相应的标准化正交特征向量来

7、计算因子载荷 (2)碎石检验准则:删去特征值变平缓的那些因子(碎石) (3)累计方差贡献:85%,第四节 公因子重要性的分析,一 因子旋转,二 因子得分,一、因子旋转,因子分析的目标之一就是要对所提取的抽象因子的实际含义进行合理解释。有时根据特征根、特征向量求得的因子载荷阵难看出公共因子含义。例如,可能有些变量在多个公共因子上都有较大的载荷,有些公共因子对许多变量的载荷也不小,说明它对多个变量都有较明显的影响作用。这时需要通过因子旋转的方法,使每个变量仅在一个公共因子上有较大的载荷,而在其余的公共因子上的载荷比较小,至多达到中等大小。这时对于每个公共因子而言(即载荷矩阵的每一列),它在部分变量

8、上的载荷较大,在其它变量上的载荷较小,使同一列上的载荷尽可能地向靠近1和靠近0两极分离。,因子旋转,负载矩阵的不唯一性:如果A一个负载矩阵解,则AT也是一个负载矩阵解,这里T是一正交矩阵。 因子旋转:给负载矩阵A右乘一个矩阵,等于做一次坐标旋转 因子旋转的目的:初始因子的综合性太强,难以找出因子的实际意义,因此需要通过坐标旋转,使因子负荷两极分化,要么接近于0,要么接近于1,从而降低因子的综合性,使其实际意义凸现出来,以便于解释因子。 因子旋转的基本方法:一类是正交旋转(保持因子间的正交性,3种,常用最大方差旋转),一类是斜交旋转(因子间不一定正交)。,补充:解释因子,解释因子主要是借助于因子

9、负载矩阵,首先找出在每个因子上有显著负载的变量,根据这些变量的意义给因子一个合适的名称,具有较高负载的变量对因子名称的影响更大。因子负载的显著性和样本规模、观测变量数及公因子的序次有关,样本规模增大或观测变量数增多,使因子负载的显著性提高,即较小的因子负载就可以认为是显著的。从第一个因子到最后一个因子,因子负载的显著件逐渐降低,即对于排在后面的因子要求较大的因子负载才能被接受,因为对于越后面的因子,误差方差越大。把在同一因子上有较高负载的变量排在一起,有助于识别每个因子上的重要负载。,二、因子得分,因子得分的用途:利用公因子作进一步的研究,比如用公因子(视为变量)作回归分析、聚类分析和评价等。

10、,小结,第五节 实例分析与计算机实现,一 利用SPSS进行因子分析,二 因子分析在市场研究中的应用,一、利用SPSS进行因子分析,(一) 操作步骤1. 在SPSS窗口中选择AnalyzeData ReductionFactor,调出因子分析主界面图(7.1),并将变量X1X13移入Variables框中。,图7.1 因子分析主界面,2. 点击Descriptives按钮,展开相应对话框,见图7.2。选择Initial solution复选项。这个选项给出各因子的特征值、各因子特征值占总方差的百分比以及累计百分比。单击Continue按钮,返回主界面。,图7.2 Descriptives子对话框

11、,3. 点击Extraction按钮,设置因子提取的选项,见图7.3。在Method下拉列表中选择因子提取的方法,SPSS提供了七种提取方法可供选择,一般选择默认选项,即“主成分法”。在Analyze栏中指定用于提取因子的分析矩阵,分别为相关矩阵和协方差矩阵。在Display栏中指定与因子提取有关的输出项,如未旋转的因子载荷阵和因子的碎石图。在Extract栏中指定因子提取的数目,有两种设置方法:一种是在Eigenvalues over后的框中设置提取的因子对应的特征值的范围,系统默认值为1,即要求提取那些特征值大于1的因子;第二种设置方法是直接在Number of factors后的矩形框中

12、输入要求提取的公因子的数目。这里我们均选择系统默认选项,单击Continue按钮,返回主界面。,图7.3 Extraction子对话框,4.点击Rotation按钮,设置因子旋转的方法。这里选择Varimax(方差最大旋转),并选择Display栏中的Rotated solution复选框,在输出窗口中显示旋转后的因子载荷阵。单击Continue按钮,返回主界面。,图7.4 Rotation子对话框,5.点击Scores按钮,设置因子得分的选项。选中Save as variables复选框,将因子得分作为新变量保存在数据文件中。选中Display factor score coefficien

13、t matrix复选框,这样在结果输出窗口中会给出因子得分系数矩阵。单击Continue按钮返回主界面。6. 单击OK按钮,运行因子分析过程。,图7.5 Scores子对话框,(二) 主要运行结果解释1. Communalities(给出变量共同度) 变量共同度反映每个变量对所提取的所有公共因子的依赖程度,此数值是因子载荷阵中每一行的因子载荷量的平方和,提取的因子个数不同,变量共同度也不同。2. Total Variance Explained(给出各公因子方差贡献表) Initial Eigenvalues给出初始相关矩阵或协差阵矩阵的特征值,用于确定哪些因子应该被提取,共有三项: Tota

14、l列为各因子对应的特征值,本例中共有四个因子对应的特征值大于1,因此应提取相应的四个公因子;% of Variance列为各因子的方差贡献率;Cumulative %列为各因子的累积方差贡献率,由表7.1可以看出,前四个因子已经可以解释89.651%的方差。 Rotation Sums of Squared Loadings给出提取出的公因子经过旋转后的方差贡献情况。,表7.1 特征根与方差贡献率表,表7.2 旋转前因子载荷阵,表7.3 旋转后因子载荷阵,注意:在因子表达式中的各变量为进行标准化变换后的标准变量,均值为0,标准差为1。7. 由于我们已经在Scores子对话框中选择了Save a

15、s variables复选框,因此,因子得分已经作为新的变量保存在数据文件中,变量名分别为fac1_1、fac2_1、fac3_1和fac4_1。此后,我们还可以利用因子得分进行其他的统计分析。,表7.4 因子得分系数矩阵,二、因子分析在市场研究中的应用,表7.5是研究消费者对购买牙膏偏好的调查数据。通过市场的拦截访问,用7级量表询问受访者对以下陈述的认同程度(1表示非常不同意,7表示非常同意)。V1:购买预防蛀牙的牙膏是重要的;V2:我喜欢使牙齿亮泽的牙膏;V3:牙膏应当保护牙龈;V4:我喜欢使口气清新的牙膏;V5:预防坏牙不是牙膏提供的一项重要利益;V6:购买牙膏时最重要的考虑是富有魅力的

16、牙齿。,表7.5 牙膏属性评分得分表,将表7.5中的数据通过SPSS进行因子分析,得到相关结果是:1. 特征根和累计贡献率,表7.6 方差贡献率表,从表7.6可以看出,提取两个因子累计方差贡献率就达到82%,第三个特征根相比下降较快,因此我们选取两个公共因子。2.因子的含义 为了得到意义明确的因子含义,我们将因子载荷阵进行方差最大法旋转,得到旋转后的因子载荷矩阵如下表7.7。,表7.7 旋转后因子载荷矩阵,从因子载荷阵可以看出:因子1与V1(预防蛀牙),V3(保护牙龈),V5(预防坏牙)相关性强,其中V5的载荷是负数,是由于这个陈述是反向询问的;因子2与V2(牙齿亮泽),V4(口气清新),V6(富有魅力)的相关系数相对较高。因此,我们命名因子1为“护牙因子”,是人们对牙齿的保健态度;因子2是“美牙因子”,说明人们“通过牙膏美化牙齿影响社交活动”的重视。从这两方面分析,对牙膏生产企业开发新产品都富有启发意义。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报