1、喀什大学实验报告多元统计分析 SPSS实 验 报 告实验课程: 基于 SPSS 的数据分析 实验地点:现代商贸实训中心 实验室名称:经济统计实验室 学 院: xxx 学院 年级专业班: xxx 班 学生姓名: xxx 学 号: 20131808015 完成时间: 2016 年 x 月 x 日 开课时间: 2016 至 2017 学年第 1 学期 成 绩 教师签名批阅日期实验项目:中国上市银行竞争力分析(一)实验目的本实验目的围绕上市商业银行竞争力这一主线,遵循一般理论、具体分析到对策建议的研究思路,以我国国内上市的十家商业银行为研究对象,采用其2012 年度财务报告的数据,从盈利能力、安全能力
2、和发展能力三方面共选取了8 个重要指标,试图通过这些指标量化影响竞争力的因素,构建我国上市商业银行的竞争力评价指标体系,并运用因子分析方法,对我国上市商业银行的竞争力状况进行了分析评价。最后针对分析的结果,通过对我国上市银行竞争力进行优劣势比较,提出了提升我国上市商业银行竞争力的一些建议。(二)实验资料通过对资产利润率、不良贷款率、资产负债率、资本充足率、每股收益增长率、贷款增长率、存款增长率、总资产增长率等指标的选择分析不同指标在进行因子分析时所考虑的因素是否存在差异,影响我国上市商业银行的竞争力状况的因素与上述指标是否有关。具体数据如下所示:十家同类型上市商业银行 2012 年指标盈利能力
3、 安全能力 发展能力资产利润率 不良贷款率资产负债率资本充足率每股收益增长率贷款增长率存款增长率总资产增长率平安银行 1.09% 0.95% 94.72% 11.37% 6.07% 16.13% 20.01% 27.69%浦发银行 1.42% 0.58% 94.29% 12.45% 25.55% 16.01% 15.31% 17.17%建设银行 1.80% 0.99% 93.20% 14.32% 13.24% 15.64% 13.57% 13.77%中国银行 1.48% 0.95% 93.21% 13.63% 12.19% 8.23% 4.04% 7.19%农业银行 1.42% 1.33% 9
4、4.33% 12.61% 18.42% 14.10% 12.90% 13.40%工商银行 1.76% 0.85% 93.77% 13.66% 13.30% 13.00% 10.00% 10%交通银行 1.43% 0.92% 92.77% 14.07% 7.31% 15.05% 13.56% 14.36%招商银行 1.75% 0.61% 94.12% 12.14% 25.75% 16.05% 14.07% 21.94%中信银行 1.41% 0.74% 93.14% 13.44% -7.04% 15.96% 14.59% 7.02%民生银行 1.58% 0.76% 94.58% 10.75% 27
5、.62% 3.53% 2.76% 8.44%(三)实验步骤1、选择菜单2、选择参与因子分析的变量到(变量 V)框中3、选择因子分析的样本4、在所示窗口中点击(描述 D)按钮,指定输出结果,输出基本统计量、图形等5、在所示窗口中点击(抽取 E)按钮指定提取因子的方法为:主成分分析法6、在所示的窗口中点击(旋转 T)按钮选择因子旋转方法7、在所示窗口中点击(得分 S)按钮选择计算因子得分的方法8、在所示窗口中点击(选项)按钮(四)实验结果及分析分析结果如下表所示。通过观察原始变量的相关系数矩阵,可以看到,矩阵中存在许多比较高的相关系数,并且大多数变量通过了原假设为相应变量之间的相关系数为 0 的
6、t假设。相关系数实际上反映的是公共因子起作用的空间,相关系数越大,表明数据适合做因子分析。KMO 和巴特利特检验KMO 取样适切性量数。 .518近似卡方 50.188自由度 28巴特利特球形度检验显著性 .006同时,KMO 级 Bartlett 检验是否适合做因子分析。以上是 KMO 级 Bartlett检验结果,由表可知:KMO 值为 0.518,说明该数据适合做因子分析。上表中的巴特利特球体检验的 X 统计值的显著性概率是 O000,小于 1,因此拒绝原假设,说明数据具有相关性,适宜做因子分析。反映像矩阵每股收益增长率 贷款增长率 存款增长率 总资产增长率相关性矩阵每股收益增长率 贷款
7、增长率 存款增长率 总资产增长率资产利润率 .383 -.144 -.404 -.359不良贷款率 -.207 -.025 -.009 -.086资产负债率 .563 -.166 .105 .494资本充足率 -.479 .357 .044 -.392每股收益增长率 1.000 -.366 -.345 .159贷款增长率 -.366 1.000 .922 .551存款增长率 -.345 .922 1.000 .738相关性总资产增长率 .159 .551 .738 1.000资产利润率 .137 .346 .124 .154不良贷款率 .283 .472 .490 .407资产负债率 .045
8、 .323 .386 .073资本充足率 .081 .155 .452 .131每股收益增长率 .149 .164 .330贷款增长率 .149 .000 .049存款增长率 .164 .000 .007显著性 (单尾)总资产增长率 .330 .049 .007资产利润率 -.075 -.025 .025 -.005不良贷款率 .038 .031 -.012 -.031资产负债率 -.064 -.001 -.007 .027资本充足率 -.002 -.021 .011 .015每股收益增长率 .207 -.026 .034 -.107贷款增长率 -.026 .025 -.021 .018存款增
9、长率 .034 -.021 .020 -.032反映像协方差矩阵总资产增长率 -.107 .018 -.032 .175资产利润率 -.277 -.273 .306 -.019不良贷款率 .113 .266 -.114 -.101资产负债率 -.464 -.031 -.158 .214资本充足率 -.018 -.524 .307 .146每股收益增长率 .496a -.358 .533 -.560贷款增长率 -.358 .496a -.932 .269存款增长率 .533 -.932 .503a -.542反映像相关性矩阵总资产增长率 -.560 .269 -.542 .651aa. 取样适切
10、性量数 (MSA)反映像矩阵在其对角线上的数字若大于 0.05(出口合同为 0.406)则适合因子分析,小于 0.05 则不适合因子分析。从表中得知,适合做因子分析。公因子方差初始 提取资产利润率 1.000 .818不良贷款率 1.000 .519资产负债率 1.000 .912资本充足率 1.000 .928每股收益增长率 1.000 .786贷款增长率 1.000 .953存款增长率 1.000 .979总资产增长率 1.000 .865提取方法:主成分分析法。变量共同度,它刻划了全部公共因子对各个变量的总方差所作的贡献,也称为公因子方差,从上表中可以得到变量共同度大部分都接近 1,说明
11、该变量的几乎全部原始信息都被所选取的公共因子说明了,也就是说,由原始变量空间转为因子空间转化的性质较好,保留原来信息量多,因此, 是 方差的2hiiX重要组成部分。检验可以做因子分析后,我们通过因子分析得到相应的特征值和对应因子的贡献率,如下表所示初始特征值 提取载荷平方和 旋转载荷平方和成分 总计方差百分比 累积 % 总计方差百分比 累积 % 总计方差的 % 累积 %1 2.800 34.998 34.998 2.800 34.998 34.998 2.664 33.302 33.3022 2.671 33.383 68.381 2.671 33.383 68.381 2.646 33.07
12、0 66.3723 1.288 16.104 84.485 1.288 16.104 84.485 1.449 18.113 84.4854 .818 10.225 94.7105 .221 2.757 97.4666 .154 1.922 99.3897 .038 .478 99.8678 .011 .133 100.000综合因子 F,F2,F3 的特征值大于 1,且对原始数据的累积贡献率达到了84.485,其中 F1 的贡献率最强,达到了 34.998,F2 的贡献率达到了33.383,F3 的贡献率也达到了 16.104。这三个因子的贡献率都远远大于其它因子的贡献率,因此,F1,F2,
13、F3 是决定商业银行竞争力强弱的关键因子。从碎石图中得到,第 1 个因子的特征值高于其他项,对解释原有变量的贡献最大;第 5 个因子之后的特征值都小,对解释原有变量的贡献较小;因此我们可以取 3 个或 4 个因子较为合适。成分矩阵 a成分1 2 3总资产增长率 .897 -.157 .187存款增长率 .892 .400 .150贷款增长率 .685 .607 .339资本充足率 -.367 .873 .175资产负债率 .475 -.822 -.104每股收益增长率 -.107 -.789 .391资产利润率 -.596 -.006 .680不良贷款率 -.040 .239 -.678提取方
14、法:主成分分析法。 aa. 提取了 3 个成分。表中给出旋转前的因子载荷阵,从中可以看出,每个因子在不同原始变量上的载荷没有明显的差别,3 个因子的实际含义比较模糊。为了避免初始因子综合性太强,难以找出因子的实际意义的问题,需要通过旋转坐标轴,使负载尽可能向正负 0 或 1 的方向靠近,从而降低因子的综合性,使其真实意义凸现出来。下面使用的因子旋转方法为方差最大正交旋转法,目的是使旋转后的因子载荷矩阵的结构简化,便于对各个公共因子进行合理的解释,同时保证每一个公共因子反映的信息量尽量最大。旋转后的成分矩阵 a成分1 2 3资本充足率 -.962 .051 .020资产负债率 .951 .084
15、 .011每股收益增长率 .602 -.267 .593存款增长率 -.001 .977 -.153贷款增长率 -.302 .928 .016总资产增长率 .493 .788 .023资产利润率 -.347 -.322 .771不良贷款率 -.131 -.151 -.692提取方法:主成分分析法。 旋转方法:凯撒正态化最大方差法。 aa. 旋转在 4 次迭代后已收敛。表中给出旋转后的因子载荷阵,从表中可以看出,经过旋转后的载荷系数已经明显的两极分化了。第一个公共因子在指标 X2 每股收益增长率、X3 资产负债率、X4 资本充足率上有较大载荷,说明这 3 个指标有较强的关联性,可以归为一类,因此
16、可以把第一个因子命名为“流动因子”;第二个公共因子在指标 X6 贷款增长率、X7 存款增长率、X8 总资产增长率上有较大载荷,同样可以归为一类,第二个因子可以命名为“发展因子”;同理,X1 资产利润率、X5 不良贷款率归到第 3 类, 将其命名为“安全和盈利因子”。在三维空间组件图中,各因子更接近于组价几,接近组件几对应的是旋转后的成分矩阵的成分几。成分得分系数矩阵成分1 2 3资产利润率 -.165 -.029 .544不良贷款率 -.009 -.138 -.516资产负债率 .359 .012 -.034资本充足率 -.368 .046 .072每股收益增长率 .203 -.051 .37
17、0贷款增长率 -.138 .378 .137存款增长率 -.016 .371 .003总资产增长率 .167 .304 .083提取方法:主成分分析法。 旋转方法:凯撒正态化最大方差法。 组件得分。表中给出了因子得分系数矩阵,根据表中的因子得分系数和原始变量的标准化值就可以计算出每个观测值的各因子的得分。旋转后的因子得分表达式可以写成: F1=-0.165x1+0.203x2+0.359x3-0.368x4-0.009x5-0.138x6-0.016x7+0.167x8F2=-0.029x1-0.051x2+0.012x3+0.046x4-0.138x5+0.378x6+0.371x7+0.3
18、04x8F3=0.544x1+0.370x2-0.034x3+0.072x4-0.516x5+0.137x6+0.003x7+0.083x8五、结论本文通过采用多元统计分析中的因子分析法对国有商业银行的经营绩效加以评价,从盈利能力、安全能力和发展能力三方面来具体分析我国上市商业银行竞争力,对上市银行及非上市银行具有一定的指导作用。实验项目:商厦评分(一) 实验目的:本实验目的利用 SPSS 层次聚类对商厦评分进行分类分析,以了解了解各商厦之间的相互关系。(2)实验资料:编号 购物环境 服务质量A 商厦 73 68B 商厦 66 64C 商厦 84 82D 商厦 91 88E 商厦 94 90(
19、三)实验步骤:表一聚类成员个案 3 个聚类 2 个聚类1:A 商厦 1 12:B 商厦 1 13:C 商厦 2 24:D 商厦 3 25:E 商厦 3 2表一可知,当聚成 3 类时,A,B 俩个商厦为一类,C 商厦自成一类,D,E两个商厦为一类;当聚成两类时,A,B 俩个商厦为一类,C,D,E 三个商厦为一类,SPSS 的层次聚类能够产生任意类数的分类结果。图一图一,可知,D 商厦与 E 商厦的距离最近,首先合并成一类,其次,合并的是 A,B 俩个商厦它们的距离比 D 商厦与 E 商厦大,最后是合并 C 商厦。最后聚城一体。图二:图二,可知,当聚成 4 类时,D,E 两个商厦为一类;其他各商厦
20、自成一类,聚成 3 类时,A,B 俩个商厦为一类,C 商厦自成一类,D,E 两个商厦为一类;当聚成两类时,A,B 俩个商厦为一类,C,D,E 三个商厦为一类。表二初始聚类中心聚类1 2 3购物环境 94.00 66.00 84.00服务质量 90.00 64.00 82.00表二,可知,3 个初始类中心点的数据,分别为(94,90)(66,64)(84,82)可见第一类最优,第三类次之,第二类最差。表三迭代历史记录 a聚类中心中的变动迭代 1 2 31 1.803 4.031 .0002 .000 .000 .000a. 由于聚类中心中不存在变动或者仅有小幅变动,因此实现了收敛。任何中心的最大
21、绝对坐标变动为 .000。当前迭代为 2。初始中心之间的最小距离为 12.806。表三,可知,第一次迭代后,3 个类中心点分别偏移了1.803,4.013.0.000,第 2 类中心点的偏移最大,在第 3 类和第二次迭代时中心点偏移均小于判定标准(0.02),聚类分析结束。表四最终聚类中心聚类1 2 3购物环境 92.50 69.50 84.00服务质量 89.00 66.00 82.00表四,可知,最终类中心点的情况,分别为(92.5,89)(69.5,66)(84,82)仍然可见第一类为最优,第三类第二,第二类效果最差。表五ANOVA聚类 误差均方 自由度 均方 自由度 F 显著性购物环境
22、 268.100 2 14.500 2 18.490 .051服务质量 272.600 2 5.000 2 54.520 .018由于已选择聚类以使不同聚类中个案之间的差异最大化,因此 F 检验只应该用于描述目的。实测显著性水平并未因此进行修正,所以无法解释为针对“聚类平均值相等”这一假设的检验。由表五,展现了各指标在不同的均值比较情况,各数据项的含义依次为组间均方、组间自由度、组内均方、组内自由度、F 统计量的观察值以及对应的概率 P-值。仍然看出第二类的差异最大。(三)实验结论:因此,在总数为五,有效数值为五的情况下的聚类分析可得,E 商厦属最优类;C,D 商厦属良好类;A,B 商厦属合格类。