收藏 分享(赏)

10因子分析.doc

上传人:myw993772 文档编号:6329633 上传时间:2019-04-07 格式:DOC 页数:10 大小:176KB
下载 相关 举报
10因子分析.doc_第1页
第1页 / 共10页
10因子分析.doc_第2页
第2页 / 共10页
10因子分析.doc_第3页
第3页 / 共10页
10因子分析.doc_第4页
第4页 / 共10页
10因子分析.doc_第5页
第5页 / 共10页
点击查看更多>>
资源描述

1、因 子 分 析因子分析最早开始于 1904年英国著名统计学家斯皮尔曼(C.Spearman)发表的一篇文章。看看他是如何引入因子分析的。斯皮尔曼在这一篇研究人的智力的定义和测量的文章中,对某学校 33个学生 6门功课(古典语、法语、英语、数学、判别和音乐)的成绩进行分析。33 个学生 6门功课成绩的样本相关系数矩阵如表表 33 个学生 6门功课成绩的样本相关系数矩阵如表古典语 法语 英语 数学 判别 音乐古典语 1 0.83 0.78 0.70 0.66 0.63法语 0.83 1 0.67 0.67 0.65 0.57英语 0.78 0.67 1 0.64 0.54 0.51数学 0.70

2、0.67 0.64 1 0.54 0.51判别 0.66 0.65 0.54 0.54 1 0.40音乐 0.63 0.57 0.51 0.51 0.40 1表中的相关系数(不考虑对角线上的值)自左到右越来越小,值得注意的是同一列上的值比起前一列上的值基本上按同样的比例减少。例如,第 2列与第 1列在同一行上两个相关系数的比值 905.63.05798.6.0597.70.6859.07.6 它们基本上是相等的。又如,第 3列与第 2列在同一行上两个相关系数的比值 895.057.183.065.49.067.490.83.07 它们基本上也是相等的。第 4列与第 3列,第5列与第 4列及第

3、6列与第 5列在同一行上两个相关系数的比值也都是基本上是相等的。根据相关矩阵行与行之间的关系,可以建立什么样的模型来描述它们呢?考虑到相关系数矩阵与协方差阵有下列关系:相关系数: jiijjijiij XVarXVarCov )()(,相关阵 pppppppR /100/1/100/111111 所以对 33个学生 6门功课成绩的样本协方差阵来说,也有与相关系数完全相同的情况,同一列上的协方差值比起前一列上的协方差值基本上按同样的比例减少。根据样本协方差阵这样一个情况,斯皮尔曼推测总体协方差阵具有下面的性质:对任意给定的第 列和第 列 ,只要jk)(kj,kiji, 无 关的 值 与 ixCo

4、vkiji),((因为比值与行无关)斯皮尔曼然后进一步推测,总体协方差阵,也就是这 6门功课成绩的协方差阵,有这样的结构 ),( 26252423221 diaga其中, 。这也就是),( 654321 aa说,它的协方差阵的结构为 265646362661 525555 645424342441 333233 6252432221 11111 aaaaa aaaaa根据协方差阵的这样一个结构,斯皮尔曼指出可以对这 6门功课的成绩建立模型 uafx由数据建立一个模型需要统计学家对数据的敏锐地观察力。而建立的模型能否得到人们的认可依赖于能不能给模型一个合理的解释,即能不能用模型来解释实际问题。模

5、型很好地解释了课程的考试成绩的结构问题,从而解释了人的智力的结构问题。模型说明 6,1,iufaxiii每一门功课的成绩都是由两部分组成。前一部分中的 是对所有课程的考试成绩都有贡献的f一个随机变量。为此称 是公共因子,而把f称为特殊因子,并假设公共因子 与特殊因iu f子 相互独立,特殊因子 之间相互独i 61,u立,特殊因子 的方差分别为 。61,u 2621,不失一般性,假设公共因子 的方差为 1。有了f这些假设,不难验证,由模型推得的协方差阵形如上面所示,从而证明同一列上的协方差值比起前一列上的协方差值有那样的关系。模型中的 称为第 门课程考试成绩的因子负荷,它iai可直观地理解为公共

6、因子 对第 门功课的考试fi成绩作了多大程度的贡献。有人把这个公共因子 看成是人的阅读能力。不同的人有不同的f阅读能力,所以它是一个随机变量。显然,阅读能力对这 6门课程的考试成绩都有贡献,不同的课程,阅读能力对它的贡献是不同的。上述模型只是一个公共因子的因子模型,自从斯皮尔曼提出了这个模型之后,开始了因子分析的理论及它在很多领域的应用研究。因子分析是主成分分析的推广和发展,它也是多元统计分析中降维的一种方法。因子分析是研究相关阵或协方差阵内部的依赖关系,它将多个变量综合为少数几个因子,以再现原始变量与因子之间的相关关系。下面几个实际问题说明应用因子分析来构造因子模型。例:为了了解学生的学习能

7、力,观测了个学生 个科目的成绩(分数) ,用np表示 个科目(例如代数、几何、XX,21 p语文、英语、政治) ,表示第 个学生的),1(),(21)( ntxxXtpttt t个科目的成绩。我们对这些资料进行归纳分p析,可以看出各个科目(即变量)由两部分组成: ),1(piFaXiii 其中 是对所有 都起作用的公),2,(iX共因子,它表示智能高低的因子;系数 称为ia因子载荷,表示第 个科目在智能高低因子上的i体现; 是科目(变量) 特有的特殊因子。i iX这就是一个最简单的因子模型。进一步地可把这个简单因子模型推广到多个因子的情况,即全部科目 所共有的因子有X个,如数学推导因子、记忆因

8、子、计算因子m等,分别记为 ,即mFF,21 ),1(21 piaaaX iiiii 用这 个不可观测 的互不相关的公共因子m(也称为潜在因子)和一个特殊因FF,21子 来描述原始可测得相关变量(科目)i,并解释分析学生的学习能力。pXX,21他们的系数 称为因子载荷。imii aa,21例:调查青年对婚姻家庭的态度(分类) ,抽取 个青年回答了 个问题,这些问题n50p可归纳为如下几个方面:对相貌的重视、对孩子的观点、对老人的态度等,这也是因子分析的模型,每一方面就是一个因子。例:考察人体的五项生理指标:收缩压,舒张压 ,心跳间隔 ,呼吸间隔)(1X)(2X)(3X和舌下温度 。从生理学的知

9、识可知,这4 5五项指标是受植物神经支配的,植物神经又分为交感神经和副交感神经,因此这五项指标至少受到两个公共因子的影响,也可用因子模型去处理。通过以上几个实例,我们可以看到,因子分析的主要应用有两方面。一是寻求基本结构,简化观测系统,将具有错综复杂关系的对象(变量或样品)综合为少数几个因子(不可观测的随机变量) ,以再现因子与原始变量之间的内在联系;二是用于分类,对 个对象或 个pn样品进行分类。公因子重要性的分析因子旋转因子旋转的目标之一就是对所提取的抽象因子的实际含义进行合理解释。有时直接根据特征根、特征向量求得的因子载荷阵难以看出公共因子的含义。例如,可能有些变量在多个公共因子上都有较

10、大的载荷,有些公共因子对许多变量的载荷也不小,说明它对多个变量都有较明显的影响作用。这种因子模型反而是不利于突出主要矛盾和矛盾的主要方面的,也很难对因子的实际背景进行合理的解释。这时需要通过因子旋转的方法,使每个变量仅在一个公共因子上有较大的载荷,而在其余公共因子上的载荷比较小,至多达到中等大小。这时对于每个公共因子而言(即载荷的每一列) ,它在部分变量上的载荷较大,在其他变量上的载荷较小,使同一列上的载荷尽可能地靠近 1和靠近 0,两极分离。这时突出了每个公共因子和其载荷较大的那些变量的联系,矛盾的主要方面显现出来了,该公共因子的含义也就能通过这些载荷较大变量做出合理的说明,这样也显示了该公

11、共因子的主要性质。因子得分在因子分析模型 中,如果不考虑特AFX殊因子的影响,当 且 可逆时,我们可pm以非常方便地从每个样品的指标取值 计算出X其在因子 上的相应取值: ,即该FAF1样品在因子 上的“得分”情况,简称为该样品的因子得分。但是因子分析模型在实际应用中要求 ,pm因此,不能精确计算出因子的得分情况,只能对因子得分进行估计。估计因子得分的方法也有很多,1939 年汤姆孙回归法。该方法假设公共因子可在对 各原始变量作回归,p即 mjXbXbF pjjjj ,2,1, 10 如果 都标准化了,回归的常数项为零,即ijX,。0jpb由因子载荷的统计意义知道,对于任意的都有mjpi ,1;,1 )()( 1, pjjijiFxij XbXbEFXEraji 11 pijpij Xbb ipjij rr1记 ,则上式可写成矩阵形mpmpbbbbB 2122211式为 ,或RA1RAB于是 XRABXbFmm 111 即得因子得分估算公式 XRAF1其中 是 的相关系数矩阵。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 社会民生

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报