1、关于我国居民就业分布的因子分析摘要:改革开放以来,我国的产业结构有了明显变化,二三产业发展有了较快的发展,以农业为主的第一产业也逐渐向现代化发展。近年来,随着经济的发展,我国的就业人数在扩大,就业分布也发生了明显变化。本文主要针对 2008 年我国各地区按不同行业分的居民就业人数差异和相似性进行了因子分析,得出我国居民就业集中分布趋势,进而提出一些今后发展的政策建议。关键词:三大产业 就业分布 因子分析正文:一、问题的提出近年来随着经济的发展,产业结构的调整,劳动力市场饱和,劳动力过剩就业难等问题逐渐成为社会关注的热点,如不及时解决会影响我国经济的持续稳步发展。二、数据来源数据来自于中国统计年
2、鉴“各地区按行业分就业人数(2009)”,由于数据较多在附表中呈现。三、分析过程1、因子分析的原理:因子分析是一种多元变量统计 方法 。它是用较少个数的公共因子的线性函数和特定因子之和来表达原来观测的每个变量,从研究相关矩阵内部的依赖关系出发,把一些具有错综复杂的变量归纳为少数几个综合因子的一种多变量统计分析方法。当这几个公共因子或综合因子的累计方差和即贡献率达到 85%以上时,就说明这几个公共因子集中反映了研究问题的大部分信息,而彼此之间又不相关,信息不重叠。2、考查原有变量是否适合进行因子分析:将农林牧渔业,采矿业,制造业,电力、燃气及水的生产和供应业,建筑业,交通运输、仓储和邮政业,信息
3、传输、计算机服务和软件业,批发和零售业,住宿和餐饮业,金融业,房地产业,租赁和商务服务业,科学研究、技术服务和地质勘查业,水利、环境和公共设施管理业,教育,卫生、社会保障和社会福利业,文化、体育和娱乐业,公共管理和社会组织作为因子分析的变量。采用巴特利特球度检验和 KMO 检验考查收集到的原有变量之间是否存在一定的线性关系,是否适合采用因子分析提取因子。KMO and Bartletts TestKaiser-Meyer-Olkin Measure of Sampling Adequacy. .788Approx. Chi-Square 833.355df 153Bartletts Test
4、of SphericitySig. .000由表可知,巴利特球度检验统计量的观测值为833.355,相应的概率P-值接近0。如果显著性水平a为0.05,由于概率P-值小于显著性水平a,则应拒绝原假设,认为相关系数矩阵与单位阵有显著差异。同时,KOM值为0.788,根据Kaiser给出的KOM度量标准可知原有变量适合进行因子分析。3、提取因子。CommunalitiesInitial Extraction农林牧渔业 1.000 .662采矿业 1.000 .651制造业 1.000 .774电力、燃气及水的生产和供应业 1.000 .955建筑业 1.000 .725交通运输、仓储和邮政业 1.
5、000 .924信息传输、计算机服务和软件业 1.000 .953批发和零售业 1.000 .920住宿和餐饮业 1.000 .944金融业 1.000 .908房地产业 1.000 .922租赁和商务服务业 1.000 .945科学研究、技术服务和地质斟查业 1.000 .869水利、环境和公共设施管理业 1.000 .935居民服务和其他服务业 1.000 .704卫生、社会保障和社会福利业 1.000 .967文化体育和娱乐业 1.000 .925公共管理和社会组织 1.000 .929Extraction Method: Principal Component Analysis.根据原
6、有变量的相关系数矩阵,制定提取3个因子,根据因子分析的初始解可知原有变量的共同度均较高,各个变量的信息丢失都较少。因此,本次因子提取的总体效果较理想。Total Variance ExplainedInitial EigenvaluesExtraction Sums of Squared LoadingsRotation Sums of Squared LoadingsComponent Total% of VarianceCumulative % Total% of VarianceCumulative % Total% of VarianceCumulative %1 11.007 61.
7、149 61.149 11.007 61.149 61.149 7.065 39.249 39.2492 3.185 17.695 78.844 3.185 17.695 78.844 6.951 38.619 77.8693 1.420 7.888 86.732 1.420 7.888 86.732 1.595 8.863 86.7324 .763 4.239 90.9715 .516 2.869 93.8416 .333 1.850 95.6907 .265 1.473 97.1638 .184 1.020 98.1839 .094 .524 98.70710 .066 .364 99.0
8、7111 .047 .259 99.33012 .032 .176 99.50613 .029 .162 99.66814 .023 .128 99.79615 .015 .082 99.87716 .011 .062 99.94017 .008 .042 99.98218 .003 .018 100.000Extraction Method: Principal Component Analysis.由表可知,选取的3个因子总共解释了原有变量总方差的86.732%,因而,因子分析效果较为理想。由图可知,第1个因子的特征值很高,对解释原有变量的贡献最大;第3个因子特征根值都较小,对解释原有边量
9、的贡献很小,已经成为可被忽略的“高山脚下的碎石”,因此 提取3个因子是合适的。4、因子旋转。Rotated Component MatrixaComponent1 2 3信息传输、计算机服务和软件业 .967 .115 -.068租赁和商务服务业 .940 .168 -.182科学研究、技术服务和地质斟查业 .912 .185 .052房地产业 .892 .278 -.220文化体育和娱乐业 .840 .463 .063住宿和餐饮业 .821 .471 -.218居民服务和其他服务业 .798 .077 .247交通运输、仓储和邮政业 .708 .627 .171公共管理和社会组织 .126
10、.945 .140卫生、社会保障和社会福利业 .291 .937 .054电力、燃气及水的生产和供应业 .145 .912 .320水利、环境和公共设施管理业 .404 .831 .286建筑业 .112 .808 -.243金融业 .514 .802 -.029制造业 .328 .786 -.220批发和零售业 .646 .709 .028农林牧渔业 -.012 -.070 .810采矿业 -.112 .497 .626Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser N
11、ormalization.a. Rotation converged in 5 iterations.采用最大方差法对因子载荷矩阵实施正交旋转以使因子命名具有解释性。有图表可知,信息传输、计算机服务和软件业,租赁和商务服务业,科学研究、技术服务和地质斟查业,房地产业,文化体育和娱乐业,住宿和餐饮业在第1个因子上有较高的载荷。第1个因子主要解释了这几个变量,可解释为以信息业和各类技术服务业为主的第三产业因子。公共管理和社会组织,卫生、社会保障和社会福利业,电力、燃气及水的生产和供应业,水利、环境和公共设施管理业在第2个因子上有较高的载荷。第2个因子主要解释了这几个变量,可解释为以工业为主的第二产
12、业因子。农林牧渔业在第3因子上有较高的载荷。第3个因子主要解释了这个变量,可解释为以传统农业为主的第三产业因子。5、计算因子得分。Component Score Coefficient MatrixComponent1 2 3农林牧渔业 .062 -.090 .546采矿业 -.046 .069 .363制造业 -.046 .155 -.197电力、燃气及水的生产和供应业 -.065 .157 .139建筑业 -.097 .191 -.230交通运输、仓储和邮政业 .084 .034 .105信息传输、计算机服务和软件业 .190 -.093 .010批发和零售业 .050 .074 -.00
13、3住宿和餐饮业 .102 .020 -.133金融业 .005 .117 -.058房地产业 .142 -.033 -.111租赁和商务服务业 .169 -.067 -.072科学研究、技术服务和地质斟查业 .177 -.081 .080水利、环境和公共设施管理业 .000 .109 .141居民服务和其他服务业 .180 -.109 .213卫生、社会保障和社会福利业 -.055 .169 -.031文化体育和娱乐业 .126 -.010 .057公共管理和社会组织 -.086 .184 .014Extraction Method: Principal Component Analysis.
14、 Rotation Method: Varimax with Kaiser Normalization. Component Scores.根据上表可写出因子得分函数:(行业名称简称为第一个字)F1=0.062农-0.046采-0.046制-0.065电0-0.097建+0.084交+0.190信+0.050批+0.102住+0.005金+0.142房+0.169租+0.177科+0.000水+0.180居-0.055卫+0.126文-0.086公F2=-0.090农+0.069采+0.155制+0.157电+0.191建+0.034交-0.093信+0.074批+0.020住+0.117金-
15、0.033房-0.067租-0.081科+0.109水-0.109居+0.169卫-0.010文+0.184公F3=0.546农+0.363采-0.197制+0.139电0-0.230建+0.105交+0.010信-0.003批-0.133住-0.058金-0.111房-0.072租+0.080科+0.141水+0.213居-0.031卫+0.057文-0.014公因子得分的均值为0,标准差为1,正值表示高于平均水平,负值表示低于平均水平。总结:通过因子分析,可以看出我国人口在三大产业中的就业比重逐渐发生了变化,就业主要集中于一些新兴产业及服务业、国有控股的大型工业和具有悠久历史的农业产业,但
16、不难看出新兴产业及热门服务行业的就业人数占据了较大比重,超过了第一产业和第二产业。四、政策建议:虽然近年来我国就业比重发生了比较明显的变化,不再是主要居于第一、二产业,第三产业的就业人数明显增加,但是对于越来越热的就业难问题的解决我们仍待于大力发展第三产业,继续增大第三产业的规模化,特别是高新技术产业信息产业研究型产业,以此来增加更多的就业岗位,但同时也要求更高素质的劳动力人才。另外,我们基于第一、二产业的发展的同时,应更多的向横纵发展,延伸更多的产业链,逐步使农业更加现代化,工业摆脱传统路子向科技化、高效性发展,使农业与工业有效地结合起来,最终实现三大产业的紧密结合,让不同层次的人员都找到适合自己的岗位。基于本人的水平有限,可能对一些数据的处理与分析不当,同时导致分析的结果有一定差误。在今后的学习中,我会更加努力的提高自己。同时希望我国三大产业特别是第三产业能有效的发展,能进一步有效解决我国总体就业难及一些地区出现劳动力剩余的问题。主要参考文献:中国统计年鉴2009薛薇 统计分析与spss的应用张江雪 北京师范大学经济研究管理所 我国三大经济地带的就业弹性