收藏 分享(赏)

r软件在因子分析中的应用.doc

上传人:cjc2202537 文档编号:171965 上传时间:2018-03-23 格式:DOC 页数:8 大小:149.50KB
下载 相关 举报
r软件在因子分析中的应用.doc_第1页
第1页 / 共8页
r软件在因子分析中的应用.doc_第2页
第2页 / 共8页
r软件在因子分析中的应用.doc_第3页
第3页 / 共8页
r软件在因子分析中的应用.doc_第4页
第4页 / 共8页
r软件在因子分析中的应用.doc_第5页
第5页 / 共8页
点击查看更多>>
资源描述

1、 R 软件在因子分析中的应用摘要:本文主要叙述了 R 软件在多元统计分析中的因子分析中的应用。因子分析是一种常用的多元统计分析(即多指标的统计分析)方法,是一种化繁为简,将指标数尽可能压缩的降维(即空间压缩)技术,也是一种综合评价方法。本文通过举例,分析了主成分算法的原理,加上一些分析结果,体现了 R 软件自主灵活的特点,同时加深对因子分析思想的理解和掌握,并为解决实际问题奠定基础。1、概述因子分析的思想始于 1904 年查尔斯. 斯皮尔曼对学生考试成绩的研究。它是利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多元统计分析方法

2、。根据相关性大小把原始变量分组,使得同组内的变量之间相关性较高,而不同组的相关性则较低。每组变量代表一个基本结构,并用一个不可观测的综合变量表示,这个基本结构就是公共因子。这些因子能够反映原来众多的观测变量所代表的主要信息,并解释这些观测变量之间的相互依存关系。对于所研究的问题就可以试图用最少个数的不可测的公共因子的线性函数和特殊因子之和来描述原来观测的每一分量。2、因子分析基本原理设对于某个问题的研究涉及到 p 个指标,分别用 X1,X2,X3XP 表示,这个指标构成的 p 维随机向量设为,对 X 进行线性变换,可以通过线性组合的方式形成新的综合变量,这里用 C 表示。新的综合变量和原来变量

3、之间的关系可以用下面的公式表示:C1=u X1+u X2+u XP12p1C2=u X1+u X2+u XP2CP=u X1+u X2+u XP1p2p上式中的线性组合可以是任意的,由不同的线性变换得到的综合变量的统计特征也是不一样的。为了使综合变量可以较好的描述原变量的特征,应该要让Ct=ut X 的方差尽可能的大,并且 Ci 之间相互独立。为此,上式要满足以下的,m.21CC约束:(1)u +u +u =1(i=1,2,3,p);21ii2ip(2)Ci 和 Cj 互不相关( (ij;i,j=1,2,3,p);(3)C1 是 X1,X2,X3,Xp 所有满足约束 1)的线性组合中方差最大的

4、,C2是线性组合中方差第二大的,其他的依次类推。以上三条约束确定 X1,X2,X3,,XP 分别被称为原始变量的第一,第二,第 p 个因子。各因子对变量的总方差贡献的大小不同,在实际的研究过程中,一般挑选前面几个方差最大的因子(累积方差贡献率在 80%到 90%之间)来分析问题,从而达到降低问题复杂程度,抓住主要矛盾的目的。3、因子分析过程一般而言,用因子方法对问题进行分析时,主要包含以下的基本过程:(1)为了消除不同变量在数量级和量纲上的差异,将收集的原始数据进行标准化;(2)求标准化后数据的相关矩阵;(3)求相关矩阵的特征值和特征向量;(4)根据特征值计算方差贡献率与累积方差贡献率,根据前

5、几个主成分累积方差贡献率大于 80%的原则,确定主成分为 C1,C2,Cm;(5)构建综合评价函数,其数学形式为:C=(6)根据综合评价函数计算总得分,然后排序并评价。4、R 软件在因子分析中的应用如何客观、准确地评价企业经营业绩的问题是多年来一直未能很好解决的问题,由于企业的经营业绩是多因素共同作用的结果,其众多的财务指标为分析上市公司经营业绩提供了丰富的信息,但同时也增加了问题分析的复杂性。由于各指标之间存在着一定的相关关系,因此可以用因子分析方法,将较少的综合指标分别综合存在于各单独指标中的信息,而综合指标之间彼此不相关,即各综合指标代表的信息不重叠,代表各类信息的综合指标即为因子。本例

6、以上市公司中的水泥行业为例,研究因子分析方法在公司经营业绩评价分析中的应用。为了说明 R 软件和是如何应用于因子分析中的,本文选取行业上市公司 14家,分析其主营业务利润率(X1) 、销售毛利润( X2) 、速动比率(X3) 、资产负债率(X4) 、主营业务增长率(X5) 、营业利润增长率(X6) 。数据如下:14 家水泥上市公司经营业绩六项指标数据公司 X1 X2 X3 X4 X5 X6海螺股份 36.29 36.96 0.27 58.31 70.85 117.59冀东水泥 33.8 34.75 0.67 59.77 15.49 16.35福建水泥 34.51 35.44 0.38 61.6

7、1 23.91 -163.99祁连山 33.31 34.3 1.17 45.8 12.18 39.46华新水泥 25.08 26.12 0.64 69.35 22.38 -10.2太行股份 30.45 31.13 1.02 46.14 6.57 -16.59四川金顶 28.74 29.4 0.6 65.46 -33.97 -55.02西水股份 20.84 21.17 1.08 48.45 65.09 54.81四川双马 22.86 23.47 0.61 42.8 35.48 -49.22天鹅股份 25.52 26.73 1.1 47.02 -4.51 -68.79尖峰集团 16.94 17.2

8、6 0.61 52.04 9.03 -94.05牡丹江 19.05 19.95 1 48.51 -12.32 -65.99大同水泥 27.54 28.04 2.36 35.29 -20.96 -46.45狮头股份 28.14 28.84 2.51 24.52 -6.43 -15.94用数据框的形式输入数据,用 princomp()作主成分分析,由前面的分析,选择相关矩阵作因子更合理。因此,这里选择的参数是 cor=TRUE。最后用summary()列出因子分析的值,这里选择 loadings=TRUE。以下是数据输入相应的程序:cement=data.frame(x1=c(36.29,33.8

9、,34.51,33.31,25.08,30.45,28.74,20.84,22.86,25.52,16.94,19.05,27.54,28.14),x2=c36.96,34.75,35.44,34.3,26.12,31.13,29.4,21.17,23.47,26.73,17.26,19.95,28.04,28.84),x3=c(0.27,0.67,0.38,1.17,0.64,1.02,0.6,1.08,0.61,1.1,0.61,1,2.36,2.51),x4=c(58.31,59.77,61.61,45.8,69.35,46.14,65.46,48.45,42.8,47.02,52.04

10、,48.51,35.29,24.52),x5=c(70.85,15.49,23.91,12.18,22.38,6.57,-33.97,65.09,35.48,-4.51,9.03,-12.32,-20.96,-6.43),x6=c(117.59,16.35,-163.99,39.46,-10.2,-16.59,-55.02,54.81,-49.22,-68.79,-94.05,-65.99,-46.45,-15.94)(1)在 R 软件中输入代码,对数据进行标准化:sd=scale(cement)sd得到的结果:(标准化后的变量值)(2)在 R 软件中输入代码,进行因子分析:cement=sd

11、cement.pr summary(cement.pr, loadings=TRUE)cement得到因子分析的结果:第一因子的贡献率为 41.6%,第二个因子的贡献率为 28.9%,第三因子的贡献率为 21.3%。前三个因子的积累贡献率为 91.9%,基本上能全面地反映六项财务指标的信息。所以我们提取前三个因子作为公因子,另三个因子可舍去,达到降维的目的。(3)在 R 软件中输入代码,做碎石图:screeplot(pca,type=“lines“)得到结果:横坐标为因子数目,纵坐标为特征根。可以看出:由碎石图可知,第一个因子的特征根值很高,对解释原有变量的贡献最大;第四个以后的因子特征值都较

12、小,对解释原有的贡献很小,已经成为可被忽略的“高山脚下的碎石” ,因此提取三个因子是合适。(4)在 R 软件中输入代码,求相关矩阵、求相关矩阵的特征值和特征向量、输出特征值:dcor=cor(cement)deig=eigen(dcor)deig$valuesdcordeig得到的结果:在 R 软件中输入代码,得到前3个因子的载荷系数:sumeigv=sum(deig$values)sumeigv前三个特征值分别为:2.5083366377、1.7274580182、1.2782459445,均超过 1,而第四个特征值为 0.3844573548,小于 1,由此可以选择前三个因子。(5)在 R

13、 软件中输入代码,得到三个因子的载荷系数:sum(deig$value1:3)/6pca$loadings,1:3得到结果:由 R 软件输出前三个因子的载荷系数可以得到:因子 C1 在主营业务利润率X1,营业利润增长率 X2 上载荷系数较大,可以视为企业的盈利能力,反映企业投资收益的情况,是资产周转营运能力的结果,也是资金流动偿债能力的基础;因子 C2 在速动比率 X3、资产负债率 X4 上载荷系数较大,可以视为企业的偿债能力;因子 C3 在主营业务增长率 X5、营业利润增长率 X6 上载荷系数较大,代表企业的发展能力,是反映企业持续经营发展能力的指标。(6)在 R 软件中输入代码,计算因子

14、C1、C2 和 C3 的系数 b1、b2 和 b3:deig$value1/6;deig$value2/6;deig$value3/6;得到结果:从上述结果得到因子 C1、C2、C3 的系数 b1、b2、b3 分别是 0.4180644、0.2879097、0.213041。水泥企业经营业绩综合得分函数 C 为:C=(b1*C1+b2*C2+b3*C3)/(b1+b2+B3)=0.454904821*C1+0.313280707*C2+0.231814472*C3(7)在 R 软件中输入代码,输出综合得分信息:s=pca$scores,1:3c=s1:14,1*0.454904821+s1:1

15、4,2*0.313280707+s1:14,3*0.231814472cbind(s,c)得到结果:从因子得分表可以看出,在盈利能力 F1 因子上得分最高的三个公司依次是福建水泥、海螺水泥、冀东水泥,这三家公司的得分远高于其它公司,这说明就盈利能力而言,这三家公司的盈利水平远好于其它公司的,而盈利能力相对较弱的公司是尖峰集团、西水股份、牡丹江。福建水泥、华新水泥、四川金顶三家公司在因子 F2 上的得分较高,说明在水泥行业中,这三家的偿债能力是较好的,而狮头股份、大同水泥、祁连山这三家公司的在 F2 因子上的得分较低,则表明这三家的偿债能力相对较差,应着力提高。在发展能力 F3 因子上,海螺水泥

16、、西水股份的得分远远高于其它公司。同时也说明在水泥行业上市公司中,就发展能力而言,好的公司还是少数,很多公司不注重公司长远稳建的发展,而只注重短期利润。 这一点需要引起有关企业家的注意。尖峰集团、牡丹江、狮头股份在因子 F3 上的得分最低,说明它们的发展能力较差,并且它们的前两个因子得分也不高,在综合排名上它们也是靠后的,因此这三家公司应从企业内部着手,进行整改,要从整体上提高公司的各项经营能力,达到提升公司经业绩的目的。5、结束语因子分析方法是一种定量的测量方法,能够降低和减少各指标之间的信息冗余,简化问题的结构,提高问题分析的效率,同时也是一种可行有效的综合评价方法。借助 R 软件可以方便快捷地用分析方因子法对实际问题进行分析计算。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 高等教育 > 教育学

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报