收藏 分享(赏)

关于全国各省经济的聚类分析.doc

上传人:精品资料 文档编号:8396183 上传时间:2019-06-24 格式:DOC 页数:11 大小:202.50KB
下载 相关 举报
关于全国各省经济的聚类分析.doc_第1页
第1页 / 共11页
关于全国各省经济的聚类分析.doc_第2页
第2页 / 共11页
关于全国各省经济的聚类分析.doc_第3页
第3页 / 共11页
关于全国各省经济的聚类分析.doc_第4页
第4页 / 共11页
关于全国各省经济的聚类分析.doc_第5页
第5页 / 共11页
点击查看更多>>
资源描述

1、1关于全国各省经济经济类型的聚类分析系 : 工商管理系专 业: 11 统计学 号:1103151010姓 名: 李 良2摘要: 3引言 3一 聚类分析 3二 聚类分析的优点 3三 聚类分析相比较于其他分析方法而言: 3实验方案 41.1 数据统计 41.2 聚类分析 4表 1 2009 年我国 31 个省、直辖市、自治区的各项经济指标数据统计 41.3 结果分析与讨论 .6表 2 描述统计量 .6表 3 案例处理 7表 4 聚类表 7表 5 平均联结 8总结 9小 结 10参考文献 103摘要:改革开放以来,中国各省市在经济发展方面都取得了显著的成绩。这篇论文利用 SPSS软件对全国 31个省

2、、直辖市、自治区(浙江、湖南、甘肃除外)的主要经济指标进行聚类分析,将其经济分成 4种类型,并对浙江、湖南、甘肃进行类型判别分析。通过这两个方法对全国各省进行经济分类。本文选取了7项经济指标作为决定经济类型的影响因素,各项数据均来自 2010年国家统计年鉴。分析结果表明:北京市和上海市为第一类经济类型;江苏省和山东省为第三类型; 广东省为第四类经济;其他 25个省、直辖市、自治区均属于第二类型。关键词:聚类分析、经济类型引言:一 聚类分析(cluster analysis)是一组将研究对象分为相对同质的群组(clusters)的统计分析技术。 聚类分析区别于分类分析(classificatio

3、n analysis) ,后者是有监督的学习。它直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类。系统聚类分析又称集群分析,是聚类分析中应用最广的一种方法,它根据样本的多指标(变量) 、多个观察数据,定量地确定样品、指标之间存在的相似性或亲疏关系,并据此连结这些样品或指标,归成大小类群,构成分类树状图或冰柱图。二 聚类分析的优点:聚类分析简单、直观;主要应用于探索性的研究,其分析的结果可以提供多个可能的解,选择最终的解需要研究者的主观判断和后续的分析;不管实际数据中是否真正存在不同的类别,利用聚类分析都能得到分成若干类别的解;聚类分析的解完全依赖于研究者所选择的聚类

4、变量,增加或删除一些变量对最终的解都可能产生实质性的影响。研究者在使用聚类分析时应特别注意可能影响结果的各个因素。三 聚类分析相比较于其他分析方法而言:(1)聚类分析一般寻求客观的分类方法,在进行聚类分析以前,对总体到底有几种类型并不知道。(2)两类方法的建立的模型不一样,因此在处理某些特定的问题时,就会得出不一样的结果,就本题看来,出现了经济类型上的判别不一致的细微差异,但是作为分类方法来说,两种方法在大部分情况下都能取得一致的效果。4(3)聚类分析与判别分析也是有联系的。改革开放以来,中国取得了举世睹目的伟大成就,各省市在经济发展方面也取得了巨大的成绩。然而,基于地理位置、经济发展环境等各

5、方面的原因,中国各省市的经济发展综合水平并不均衡,沿海地区发展较快,经济增长也较快,而中西部发展相对较慢。因此,基于这种现状,本文对全国各地区的经济进行聚类分析。首通过本文的分析研究,可以清楚地认识到我国经济类型构成,以及各地区的发展差异,最终对国家以及各地区的发展及政策制定实施起到指导作用。本文采用多元统计分析方法,对全国 31个省、直辖市、自治区的 7项经济指标进行聚类分析,从而能够比较客观地反映了当前各地区的经济类型。实验方案1.1 数据统计本文根据 2010年国家统计年鉴,选取了 2009年 31个省、直辖市、自治区的 7项经济指标 1,如表 1所示。其中包括:各省的国内生产总值 X1

6、、农业生产总值 X2、工业生产总值 X3、建筑业生产总值 X4、进出口总值 X5、批发企业销售额 X6和餐饮业 X7。1.2 聚类分析先将 2009 年我国 31 个省、直辖市、自治区的各项经济指标数据统计的各项数据输入的 spss 当中,对这些数据进行标准差标准化处理,其过程为:“AnalyzeDescriptive StatisticsDescriptives”, 然后对标准差标准化后的数据进行聚类分析(Hierarchical Cluster Analysis)。其过程为:依次选择“AnalyzeClassifyHierarchical Cluster”,引入的变量是 X1 至 X7,选

7、用 Q 型聚类分析距离测量技术选择 Squared Euclidean distance,最终得出聚类分析结果表 1 2009 年我国 31 个省、直辖市、自治区的各项经济指标数据统计单位:亿元地区国内生产总值(X1)农业生产总值(X2)工业生产总值(X3)建筑业生产总值(X4)进出口总值(X5)批发企业销售额(X6)餐饮业(X7)北京 12153.03 315.0 11039.13 34297216 5334148 22558.0 341.7天津 7521.85 281.7 13083.63 15641917 4488051 8599.5 62.65河北 17235.48 3640.9 24

8、062.76 23328055 1343558 2730.6 26.5山西 7358.31 908.7 9249.98 16501463 163150 2705.0 44.9辽宁 15212.49 2704.6 28152.73 28557785 3076882 6428.7 93.3上海 15046.45 283.2 24091.26 32476545 18670215 20170.8 292.6江苏 34457.30 3816.0 73200.03 89289353 25969712 15364.8 205.2浙江 22990.35 1873.4 41035.29 88614109 692

9、9148 13888.0 166.5福建 12236.53 2001.2 16762.82 19415838 4377455 4617.1 80.5山东 33896.65 6003.1 71209.42 40516317 7559835 7584.4 262.6广东 39482.56 3337.6 68275.77 29806043 38241318 18599.1 384.4广西 7759.16 2377.2 6880.04 8758730 367765 1464.0 17.6海南 1654.21 705.0 1057.45 1366053 301396 517.5 8.41.3 结果分析与

10、讨论在得出结果之前,通过 SPSS对数据进行标准差标准化,得到结果进行分析,结果如表 2所示。从表中的方差结果可以看出,由于方差的数值很大,可以得知全国各省经济差异是相当大的,之间存在相关性不明显,这也说明各地区发展的不平衡。表 2 描述统计量N 极小值 极大值 均值 标准差国内生产总值(X1) 31 4.413600000000E23.948256000000E41.17839900000000E49.730402200927087E3农业生产总值(X2) 31 93 6003 1947.13 1472.726工业生产总值(X3) 31 5.160000000000E17.320003000

11、000E41.76874648387097E41.998882310116645E46建筑业生产总值(X4) 31 910274 89289353 21924060.81 2.102E7进出口总额(X5) 31 99 38241318 3927349.58 8552969.318批发企业销售额(X6) 31 33 22558 5091.44 6270.777餐饮业(X7) 31 .4 384.4 86.648 104.0595有效的 N (列表状态) 31CLUSTER 国内生产总值X1 农业生产总值X2 工业生产总值X3 建筑业生产总值X4 进出口总额X5 批发企业销售额X6 餐饮业X7 /

12、METHOD BAVERAGE /MEASURE=SEUCLID /PRINT SCHEDULE /PLOT VICICLE.再对标准差标准化后的数据进行聚类分析,结果如表3、4所示。表3显示,进行聚类分析的只有28个省、直辖市、自治区。采用的是组间聚类。表3 案例处理汇总 a,b案例有效 缺失 总计N 百分比 N 百分比 N 百分比31 96.9 1 3.1 32 100.0a. 平方 Euclidean 距离 已使用 b. 平均联结(组之间)表4说明整个聚类分析过程共进行了31步,而且每一步的合并也有清楚地显示。通过该表,可以详细地了解每一步的聚类过程。表4 聚类表群集组合 首次出现阶群集

13、阶 群集 1 群集 2 系数 群集 1 群集 2 下一阶1 25 29 3.367E10 0 0 132 6 21 2.044E11 0 0 123 30 31 2.260E11 0 0 74 22 27 2.985E11 0 0 75 8 26 5.464E11 0 0 126 9 15 7.270E11 0 0 147 22 30 1.046E12 4 3 198 5 23 1.063E12 0 0 169 4 19 1.358E12 0 0 1010 4 28 2.109E12 9 0 2111 18 24 2.200E12 0 0 15712 6 8 2.637E12 2 5 1413

14、 25 32 4.448E12 1 0 1914 6 9 6.559E12 12 6 2315 17 18 6.824E12 0 11 1716 5 13 7.036E12 8 0 2017 7 17 1.154E13 0 15 2218 3 14 1.425E13 0 0 2019 22 25 1.929E13 7 13 2320 3 5 2.222E13 18 16 2121 3 4 3.540E13 20 10 2522 2 7 3.762E13 0 17 2423 6 22 5.710E13 14 19 2524 2 16 1.304E14 22 0 2625 3 6 1.966E14

15、 21 23 2826 2 10 2.693E14 24 0 2827 11 12 3.630E14 0 0 3028 2 3 5.607E14 26 25 2929 2 20 1.634E15 28 0 3030 2 11 5.587E15 29 27 0* * * * * * * * * * * * * * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * * * * * * * * * * * * * *Dendrogram using Average Linkage (Between

16、Groups)Rescaled Distance Cluster Combine8C A S E 0 5 10 15 20 25Label Num +-+-+-+-+-+2 -+9 -+4 -+-+3 -+ +-+5 -+ | |12 -+-+ +-+13 -+ | |1 -+ | +-+10 -+-+ | |6 -+ | |11 -+ |7 -+-+8 -+表5显示了31个省、直辖市、自治区在这4种类型中的分布情况。结果为:第一类:北京市、上海市(2个)第二类:天津市、河北省、山西省、内蒙古、辽宁省、吉林省、黑龙江省、安徽省、福建省、江西省、河南省、湖北省、广西省、海南省、重庆市、四川省、贵

17、州省、云南省、西藏、陕西省、青海省、宁夏、新疆、浙江、湖南、甘肃等等(25个)第三类:江苏省、山东省(2个)第四类:广东省(1个)表5 平均联结(组之间)聚类表群集组合 首次出现阶群集阶 群集 1 群集 2 系数 群集 1 群集 2 下一阶1 2 7 1.700E8 0 0 22 2 6 1.718E9 1 0 43 1 3 4.518E9 0 0 44 1 2 1.148E10 3 2 55 1 5 2.668E15 4 0 66 1 4 2.674E16 5 0 09从图表中可以直观地看出各个省、直辖市、自治区之间的相似程度,聚类的先后顺序,将表4所表达的聚类过程更直观地展现出来。总结通过

18、对31个省、直辖市、自治区进行经济类型的聚类分析,得出4中经济类型,其分布如前所示* * * * * * * * * * * * * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * * * * * * * * * * * * * *Dendrogram using Average Linkage (Within Group)Rescaled Distance Cluster CombineC A S E 0 5 10 15 20 25Label Num +-+-+-+-+-+10天津 2 -

19、+福建 9 -+山西 4 -+-+广西 12 -+ +-+河北 3 -+-+ +-+辽宁 5 -+ | |海南 13 -+ +-+北京 1 -+-+ | |山东 10 -+ +-+ +-+上海 6 -+ | |广东 11 -+ |江苏 7 -+-+浙江 8 -+。第一类:北京市、上海市(2个)第二类:天津、福建、山西、广西、河北、辽宁、海南、山东(8个)第三类:江苏省、浙江省(2个)第四类:广东省(1个)根据聚类分析结果可知,以上分类结果大致反映了全国各省、直辖市、自治区所属的经济类型。北京市和上海市分别作为全国的政治、经济中心,综合经济实力较为突出,各个领域均衡发展,所以被一起划分为第一类经

20、济类型。江苏省和浙江省都是经济较为发达的地区,都为第三类型。它们的经济实力都很强,而且交通便利,拥有良好的发展空间和机遇。第四类经济类型仅为广东省,这可能是因为广东省的国民生产总值为39482.56亿元,位居全国首位。其他省、直辖市、自治区(共 25个)均属于第二类型。这些地区发展较为缓慢,甚至有的地区的经济相对第一、第三、第四类型的省相差很多。这也说明我国的经济发展还存在很大的不平衡性,还需要国家投入更多的力量在发展第二类省份当中。小 结:综上可得,全国各省经济可分为四大类型,分别为第一,第二,第三,11以及第四类型,较为全面的分析了全国大多数省的经济状况,差异较大,普遍相关性较小。发展存在着不平衡,需要进一步的进行调节,协调发展等等。当然,在上述分析中也存在一些问题,在选择变量时没有综合考虑外商投资、旅游业等对经济的影响,这对于一些在吸引外资方面具有优势或者在旅游业方面具有得天独厚优势的城市来说,没有办法综合考虑全部的影响因素,分析结果可能存在较大偏差。但还是存在很好的参考价值。参考文献:1 中华人民共和国国家统计局编:中国统计年鉴 2010M 北京:中国统计出版社

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报