1、我国各地区城镇居民信息消费力的因子分析与聚类分析肖 霞摘要:信息消费力是指信息消费的能力,它的高低反映了一个地区经济水平以及信息产业的发展状况。本文基于因子分析与聚类分析的方法,分析了我国各地区城镇居民信息消费力的发展状况,并提出了相关的对策建议。关键词:信息消费力 因子分析 聚类分析 1 引言随着 20 世纪 90 年代我国全面实行加快信息化建设以来,信息社会化和社会信息化进程加快,知识和信息已成为生产和社会发展最重要因素,并在人们日常消费中占据越来越重要的地位,形成知识社会的新型消费方式信息消费。信息消费改变着人们工作、学习、生活方式,加速了知识转化为生产力的进程,推动第三产业迅速发展,逐
2、渐成为带动国民经济发展的决定性力量。因此,对信息消费的规律的探讨也就显得越来越重要。本文利用 excel 多元统计分析模型对我国 2006 年 31 个省市的城镇居民信息消费力进行因子与聚类分析,从定量的角度分析其区域差异,并提出了相关对策建议。2 信息消费力的涵义与样本指标选取信息消费力是指消费者在一定的信息消费环境下为了满足和提高自己的精神文化等发展资料需要对信息商品和服务进行消费的能力。简言之,是对信息的消费能力。构成信息消费力的要素包括信息消费主体、信息消费客体和信息消费环境。信息消费力实质上是三者的有机结合,也就是说,在三者的有机结合中,信息消费力才能不断形成和发展。要使信息消费力达
3、到最优或最佳状态,一是要使三者各自保持高质量状态;二是三者要协调发展。必须强调的是,信息消费力本质上是“一种个人才能的发展,一种生产力的发展” 。但是,信息消费质的好坏和量的大小是衡量信息消费力水平高低的最终指标。信息消费能力是信息消费力的本质,它直接决定着信息消费的质与量,而信息消费的质与量是信息消费力的外在具体表现。因此,本文遵循指标数据的客观性和可收集性原则,选取共性的指标,力争指标的科学性、真实性,从构成信息消费力的三个要素方面建立城镇居民信息消费力的指标体系,具体如下: 1、 年人均可支配收入 (元/人) :衡量一个国家信息消费者实际支付能力的一个重要指标。2、 每千人中大学毕业生比
4、重:即拥有大专毕业文凭数/千人( 总人口),反映信息消费主体信息素质整体水平。3、 信息产业增加值占 GDP 比重:即信息产业增加值 /GDP。信息产业增加值包括信息产品制造业、信息产品销售业和信息服务业三部分的增加值之和,反映信息产业的地位和作用。4、 人均信息消费支出占消费总支出的比例(%):人均信息消费支出占消费总支出的比例=人均信息消费支出/人均消费总支出,其中信息消费额取自统计年鉴消费支出中的通信和教育文化娱乐服务两项。5、 互联网宽带接入端口(万个):用来测度互联网的使用情况,反映出互联网的发展状况。6、 移动电话年末用户(万户):目前,通信网络规模决定了话音业务规模,用这个指标移
5、动通信业务普及率。以 31 个省市、自治区作为样本,以上六个指标作为变量的原始数据如表1。表 1 2006 年全国 31 省市、自治区信息消费力评价指标地区 人均可支配收入(元/人)每千人中大学毕业生比重人均信息消费占总消费比率( %)信息产业增加值占 GDP比重(% )移动电话年末用户(万户)互联网宽带接入端口(万个)北 京 19977.52 282.7759899 23.31092361 0.457714058 1571 335.2天 津 14283.09 145.9665773 19.19236257 0.309051513 601.2 95.9河 北 10304.56 36.74911
6、661 17.01629607 0.148963114 2251 235.9山 西 10027.70 62.50400872 20.61975139 0.055332408 989.6 148内蒙古 10357.99 61.63210099 19.86275551 0.066320169 874.1 69.9辽 宁 10369.61 91.78965614 16.54149176 0.181381038 1611 224.1吉 林 9775.07 66.94925326 17.77769617 0.07639742 1137.8 96.2黑龙江 9182.31 58.41595313 18.7
7、3808304 0.079944613 1266.6 174.6上 海 20667.91 211.5582451 22.82270056 0.634458997 1609.5 421.3江 苏 14084.26 69.0042318 19.97727601 1.182229922 2873 547.3浙 江 18265.10 79.76187861 21.05051425 0.501666908 3012.3 549.9安 徽 9771.05 43.93459916 18.75107098 0.116350758 1216.7 134.3福 建 13753.28 54.57312433 20.
8、69983717 0.30115569 1538.9 305.6江 西 9551.12 42.90099578 19.64821519 0.069971691 933.3 122.1山 东 12192.24 53.86664805 19.76418214 0.675379751 2916 433.8河 南 9810.26 38.20830466 20.19033145 0.18740842 2353.3 230.8湖 北 9802.65 73.20520068 19.46326507 0.158869644 1683.3 221.7湖 南 10504.67 47.23190748 20.762
9、97847 0.146497151 1494.5 207.9广 东 16015.58 53.70329195 21.03204416 1.632789754 7117.5 725.9广 西 9898.75 42.02165732 17.97039142 0.064641417 1204.1 161.6海 南 9395.13 50.15592516 17.19177525 0.022682114 239.9 33.5重 庆 11569.74 42.37646606 22.22596979 0.129733347 1064.6 111.6四 川 9350.11 42.43750328 19.595
10、17915 0.196053516 1976.8 244.4贵 州 9116.61 24.98124964 20.93995815 0.055626427 648.8 69.6云 南 10069.89 28.62738461 17.62877364 0.068971079 1068.9 113.7西 藏 8941.08 9.712509713 13.88147409 0.004912956 60.5 4.8陕 西 9267.70 70.71788049 22.9160047 0.151040213 1183.6 134.8甘 肃 8920.59 30.94280144 20.94961293
11、0.033271527 545.9 62.2青 海 9000.35 55.060408 18.50657952 0.007492733 172.6 15.4宁 夏 9177.26 66.7990612 18.00246198 0.012168577 218.6 18.6新 疆 8871.27 80.18842674 18.43607959 0.054383961 671.1 73.1资料来源:中国统计年鉴 2007 中国信息年鉴 20073 因子分析因子分析是用少数几个因子反映原始资料的大部分信息的统计学方法。利用个变量之间的相关关系,把各种错综复杂的变量归结为少数几个综合因子,这些综合各不相
12、关的因子描述了原来指标的大部分信息,变量的减少也便于进行分析和计算。31 因子分析的数据结果及分析根据收集到的实际数据,依据因子分析的原理、步骤,运用 excel 多元统计分析软件,提取初始主因子。根据表中列出的所有因子,按照特征根从大到小的次序排列,前 3 个因子累计贡献率达到 95.23254%,已符合因子提取准则,所以提取前 3 个因子进行因子分析,能较全面地反映所有信息。表 2 累计贡献率N0 特征值 CH 比例值 LH 累计比例值1 3.6882307 0.6147051 0.61470512 1.4413635 0.2402272 0.85493243 0.5843585 0.09
13、73931 0.95232544 0.1280776 0.0213463 0.97367175 0.1146547 0.0191091 0.99278086 0.043315 0.0072192 1在初始的因子载荷矩阵中,各因子所代表的含义不明显,所以要进行因子旋转。通过旋转后的因子载荷矩阵(如表 3)可以看出,第一主因子在信息产业增加值占 GDP 比重(X4)、移动电话年末用户(X5) 、互联网宽带接入端口(X6)这三个指标上的载荷较大,集中反映了信息产业结构与基础设施建设这两方面,因此,第一主因子可定义为环境因子;第二主因子在城镇居民平均每人可支配收入(X1)、每千人中大学毕业生比重(X2
14、) 两个指标上的载荷较大,反映了信息消费主体需求水平,所以可将第二主因子定义为主体因子;第三个主因子在人均信息消费占总消费比率(X3)指标上具有较高的载荷,反映信息消费力质量水平,因此,可定义为质量因子。另外,根据因子分析中的共性方差表可以看出,经旋转提取公因子后,各变量中信息分别被提取的比例,如:信息产业增加值占 GDP 比重的信息量被提取了 97.9654%、城镇居民平均每人可支配收入的信息量被提取了 82.5328%等等。说明城镇居民信息消费力评价指标大部分信息都被上面所定义的公共因子所解释,损失的信息较少。表 3 旋转后的因子载荷矩阵指标 主因子 f1 主因子 f2 主因子 f3X1
15、0.5068978 -0.825328 0.2487741X2 -0.009309 -0.979105 0.2031436X3 0.1834419 -0.285443 0.9406761X4 0.979654 -0.174898 0.0984317X5 0.9917185 0.011879 0.1278802X6 0.9419765 -0.28132 0.18313832 我国各地区城镇居民信息消费力评价的因子得分以及综合排名根据因子得分系数和原始变量的标准化值,可以得出各省市、自治区三个因子的得分数,对 31 省市、自治区信息消费力水平进行综合评价并排序。然后以旋转后三个因子的方差贡献率为权
16、数计算综合得分,最终可以得到所有省市、自治区综合得分排名,最终排名结果如表 4。表 4 31 省市、自治区各因子得分及排名地区 主因子 f1 排名 主因子 f2 排名 主因子 f3 排名 综合得分 综合排名北 京 0.5077138 5 1.0792762 1 0.8514049 6 0.654287 6天 津 0.4581639 6 0.5859715 5 -1.755742 30 0.251405 9河 北 0.4064231 7 0.1864669 23 0.1793822 16 0.312095 7山 西 -0.56558 23 0.7698825 3 0.7724147 9 -0.0
17、8749 14内蒙古 -0.604806 25 0.3019329 17 0.3839797 12 -0.26185 24辽 宁 0.0714777 12 -0.119912 30 -2.808794 31 -0.25843 23吉 林 -0.373913 19 0.227008 19 0.0239381 17 -0.17298 20黑龙江 -0.30322 18 0.2139996 21 -1.255656 29 -0.25727 22上 海 0.3903936 8 1.0112567 2 2.0664601 1 0.684167 5江 苏 2.0727438 2 0.3503524 13
18、-0.323361 22 1.326797 2浙 江 1.2980048 4 0.3651521 9 0.5769247 10 0.941798 3安 徽 -0.247069 17 0.3391327 14 -0.054981 18 -0.07576 13福 建 0.2450887 10 0.3587078 12 0.3085784 14 0.266882 8江 西 -0.47875 21 0.3319194 16 0.572895 11 -0.15876 19山 东 1.3256755 3 0.3670634 8 -0.23384 19 0.880304 4河 南 0.2482703 9 -
19、0.017476 26 0.214545 15 0.16931 10湖 北 -0.090476 13 -0.853119 31 1.153486 4 -0.14822 17湖 南 -0.160597 14 0.4324152 7 -0.277288 20 -0.02185 12广 东 4.3058704 1 0.3385915 15 -0.482699 23 2.681168 1广 西 -0.225583 15 -0.051164 29 -0.811097 27 -0.22995 21海 南 -0.72707 28 0.731426 4 -0.583042 24 -0.32801 25重 庆
20、-0.470124 20 0.363252 10 0.805969 8 -0.12323 16四 川 0.1560663 11 0.1960628 22 -0.665232 25 0.078245 11贵 州 -0.689476 26 0.176685 24 -0.674447 26 -0.44707 31云 南 -0.241115 16 0.3600521 11 -0.277997 21 -0.0888 15西 藏 -0.498166 22 -0.047548 28 -1.086555 28 -0.42347 29陕 西 -0.601029 24 0.4902005 6 1.0162792
21、5 -0.15272 18甘 肃 -0.787449 29 0.2149591 20 0.8491311 7 -0.34971 27青 海 -0.906361 31 -0.014695 25 1.7079453 2 -0.39433 28宁 夏 -0.880366 30 -0.028331 27 1.1546439 3 -0.43552 30新 疆 -0.702986 27 0.2726956 18 0.3555629 13 -0.33199 2633 对因子分析结论的评价结合各省市、自治区的因子得分与综合得分,对我国城镇居民信息消费力的分析评价如下:(1)从因子得分方面来看,从第一主成分环境
22、因子来看,广东、江苏、山东、浙江、北京、天津、河北、上海排在在了前 8 位,这与这 8 个城市作为全国信息产业实力最强的实体相符合,得分最高的广东比得分其次的江苏高出了 2 个得分;京、天津、河北、上海排在了后四位,且得分低于 1,说明其近年信息产业发展速度减缓。在第二主成分主体因子中,北京、上海得分最高,说明这些地区信息消费主体素质与水平远远领先于其他城市,但整体得分较低,反映了主体因素是我国信息消费力进一步提高的瓶颈。从反映信息消费质量的第三主成分质量因子来看,得分普遍不高,且负分居多,只有 10 个城市得分大于零,其余城市都小于零,说明我国现阶段各地区信息消费比例较低。(2)从省市、自治
23、区本身来看,信息消费力内部因素发展不协调。如:江苏虽然在环境因子上得到了最高得分,但在主观因子与质量因子上得到了较低分;广东环境因子和质量因子虽然排名第一,然而在主观因子上却排到了 15 位。在31 个省市、自治区中,只有六个省市的 3 个主因子得分全为正数,其余 25 个省市、自治区的 3 个因子得分至少有 1 个主因子得分为负,进一步说明了信息消费力内部因素发展的不协调,其中,西藏、广西这 2 个城市的 3 个主因子得分都为负分数,应引起政府的高度重视。(3)从综合得分来看,我国各地区的得分水平差距不大,反映了整体信息消费力较为协调。广东虽然综合排名第一,但在主观因子与质量因子上得分排名均
24、靠后,这缩小了其他城市与它的整体信息消费力的差距,说明环境因子在我国城镇居民信息消费力评价中起了决定作用。这些都说明综合得分从三个主因子方面较为全面地反映了各地区的信息消费力水平,并说明我国城镇居民信息消费力已经有了初步发展,其中以北京、上海、广东等发达城市更为明显。4 聚类分析聚类分析是根据观测值或者变量之间的亲属关系程度将接近的对象结合在一起,以逐次聚合的方法将观测值分类,直到最后都聚于一类。本文采用系统聚类分析中的最短距离法对各地区城镇居民信息消费力进行分类。对原始指标进行聚类分析后,把 31 省市、自治区的信息消费力分为 5 类,聚类谱系图如图1。图 1 聚类谱系图01234聚类谱系图
25、北京上海天津河北山西内蒙古黑龙江安徽广西云南江西吉林海南青海宁夏新疆湖南河南四川湖北贵州甘肃重庆陕西辽宁福建江苏山东西藏浙江广东聚类结果为:第一类:广东、北京、上海、江苏、山东、天津、浙江第二类:河北、福建、辽宁、重庆、陕西第三类:湖北、湖南、山西、内蒙古、吉林、河南、四川第四类:安徽、黑龙江、广西、云南、江西、海南、新疆第五类:青海、宁夏、贵州、甘肃、西藏从以上的分析结果可知,第一类地区的信息消费力很高,其中广东的信息消费力呈大幅度上升状态,山东、江苏、浙江、北京、上海、天津的信息消费力比较平稳。这些地区除北京以外都处于东部沿海,具有良好的区位优势,人才、技术、信息、资金密集,信息消费力随着
26、经济发展水平一同提高。而北京是全国政治、经济、文化中心,具有独特的发展优势。在第二类地区中,河北和福建地理位置良好,前者紧靠北京,后者是著名的侨乡,有良好的优惠政策,经济发展较快,从而也促进了信息产业发展和信息消费力的提高。另外,其他几个省市的信息消费力发展也比较平稳。第三类地区中,信息消费力发展一般,湖南、湖北地处长江畔,近几年信息基础设施建设逐步加强,综合服务能力和社会普及程度进一步提高,为信息消费力的增强提供了重要支撑。第四类地区中大部分省市,其经济发展水平比较较低,因此信息产业及信息消费的发展都比较落后。第五类地区中,信息产业发展刚刚起步,信息消费仅限于传统行业,发展有限,需要大力发展
27、信息消费力。结合因子得分与聚类分析结果可以看出,第一类,在 3 个主因子得分上有一个高得分,表现为地区信息消费力高;第二类在 3 个主因子上的得分基本都有两个或以上表现为正性,说明这 5 个省市、自治区信息消费力在这 3 个因子上表现得较好;第三类,各类因子得分都比较低,说明信息消费力不高;第四类,表现为信息消费环境较差,消费主体水平一般,信息消费质量较小;第五类,集中反映了信息消费环境较差、消费主体水平、信息消费质量一般。5 对策建议从上述结论中可以看到,我国城镇居民信息消费力存在较大的区域差异。区域差异的根源是区域收入上的差距和信息基础设施的缺少。因此,促进信息消费力层次提升和消除信息消费
28、力差异的措施应该着眼于增加居民收入,加强信息基础设施建设,并着重注意缩减区域之间的收入差距,如通过税收或财政转移支付缩小发达地区与欠发达地区居民收入差距等;另外还需采取相应具体措施稳定居民的消费预期,如改善信息消费环境等。具体措施如下:1、加快发展教育和经济,提高信息消费主体的能力信息消费主体能力包括信息消费者的支付能力和信息消费者的信息素质两个不可分割的方面,其中,信息消费者的支付能力是对信息产品和服务的潜在购买能力,是影响信息消费需求的客观物质基础;信息消费者的信息素质是一种判断、获取、分析、评价和整合利用信息的综合行为能力,有具有这种行为能力才会对信息产品和服务有强烈的需求。因此加快发展
29、教育经济,提高信息主体的支付能力和素质,成为提高信息消费力的重要举措。2、加快信息化进程,提高信息消费客体的质量国家在加快落后地区信息基础设施建设、降低信息消费成本的同时,应努力发展信息产业,并提高信息产品的质与量。另外,还需加强教育培训,普及信息消费的知识和技能。3、完善信息消费的立法,加强信息消费市场的监管,改善信息消费的环境信息消费总是在特定的信息消费环境中进行的。信息消费环境对信息消费质量具有显著的影响。国家应在信息消费政策法规、信息市场价格水平和社会信息环境等方面,加强控制,制定完善的信息法规,加强对信息消费市场的监管,打击信息消费市场中的不法行为。参考文献:1 崔建华.信息消费力的几个理论问题研究J.消费经济,2006.8,22(4)2 胡琪君.信息消费力的制约因素和指标体系分析J.大学图书情报期刊,2007.2,25(1)3 和淑萍.我国居民信息消费的现状分析与发展对策J.商业研究,2004,(15)4 郑兵云.中国城镇居民信息消费的差异性研究J.统计与信息论坛,2007.1,22(1)5 李新蕊.主成分分析、因子分析、聚类分析的比较与应用J.山东教育学院学报,2007,(6)