1、教育投入对中国经济增长作用的区域差异分析基于多指标面板数据聚类结果 孙玉环 季晓旭 东北财经大学统计学院 东北财经大学社会与行为跨学科研究中心 摘 要: 进入 21 世纪, 人力资本在经济增长中的作用越来越突出, 作为人力资本形成的重要途径, 教育在中国已经被提高到优先发展的战略地位。以 2001-2010 年中国 31 个省份的面板数据为基础, 基于人均受教育年限、人均教育经费、教育经费占地区 GDP 比例三项指标的多指标面板数据聚类结果, 进行“微观”面板数据建模, 具体比较和分析中国教育发展水平、GDP 对教育投入弹性的区域差异。研究发现:教育投入对不同发展水平、不同类型经济区域的影响作
2、用不同。总体来看, GDP 对教育投入富有弹性, 尤其是对于经济基础好、居民文化素质较低的省份, GDP 对教育投入的弹性通常较大。但中西部 9 个省份则出现教育与经济消极互动的局面, 表现为 GDP 对教育投入缺乏弹性。关键词: 教育投入; 经济增长; 面板数据; 多指标面板数据聚类; 中国; 作者简介:孙玉环 (1970-) , 女, 黑龙江牡丹江人, 博士, 副教授, 主要研究方向为宏观经济统计分析、社会调查方法。E-mail:收稿日期:2013-12-19Regional differences in the impact of educational investments on C
3、hinas economic growth: Based on a cluster analysis of multivariate panel dataSUN Yuhuan JI Xiaoxu School of Statistics, Dongbei University of Finance and Economics; Interdisciplinary Center for Social Abstract: Human capital has become increasingly important for economic growth in the 21st century.A
4、s an important means of developing human capital, education in China has become a strategic priority.The countrys investment in education has been increasing these years.However, the relative lack of regional educational investment has led to regional disparity in compulsory education.This has resul
5、ted in an unequal distribution of human capital across China, thus exacerbating the differences in regional economic development.This study analyzes and compares the regional differences in education investment and the elasticity of GDP by using panel data from 2001 to 2010 of 31 Chinese provinces a
6、nd a micro-panel data model of multidimensional clusters derived from the indexes of per capita education years, per capita education funds, and the proportion of education funds to GDP.The study finds that the effect of education at different levels of development differs across development levels
7、and types of economies.In nine of the central and western Chinese provinces that have a weak economic foundation and low level of education developmentYunnan, Gansu, Guizhou, Ningxia, Hainan, Xinjiang, Shanxi, Qinghai, and Xizangthere is a negative relationship between education funds and economic g
8、rowth, with GDP lacking elasticity.On the other hand, in the other 22 provinces, which have a better economic foundation, GDP is elastic and interacts negatively with education.Among these provinces, Beijing, Shanghai and Tianjin have the highest elasticity coefficient.The paper goes on to suggest t
9、hat the government should advocate equality in education, promote compulsory education in rural areas, and formulate different education priority development strategies aimed at different regional development levels of both economy and education.Furthermore, the government should not only ensure tha
10、t the state is the main investor in education funds but also encourage the education funds raised by enterprises and individuals by ensuring better policy decisions.Keyword: education investment; economic growth; panel data; multidimensional clusters; China; Received: 2013-12-191 引言自 1978 年改革开放以来, 中
11、国以粗放型的教育发展方式大力推行九年义务教育, 并对高等教育实行大幅扩张。在此期间, 虽然中国教育投入连年增长, 但教育经费仍相对不足, 这已成为束缚中国教育事业发展的客观因素。通过国际间比较可以发现, 2000 年世界所有国家公共教育投入比例中位数是 4.5%1, 发达国家、欠发达国家、转型国家的该比例分别是 5.3%、4.1%和 4.2%。中国早在20 世纪 90 年代就提出了“科教兴国”的基本国策, 并在 1993 年提出要在 2000年实现国家财政性教育经费占 GDP 4%的目标, 但该时间表推迟到了 2012 年才得以实现。中国教育经费不足的问题在义务教育领域表现尤为突出, 而且各区
12、域间的教育投入严重失衡。2010 年北京人均教育经费 (3126.79 元/人) 约为同年河南的3.23 倍, 这种失衡导致义务教育不公平, 最终引发人力资本在中国区域间分布失衡, 加重了中国区域间的差距。本文以 2001-2010 年中国 31 个省份的面板数据为基础, 结合多指标面板数据聚类分析结果, 进行“微观”面板数据建模, 具体比较和分析中国教育发展水平、GDP 对教育投入弹性的区域差异问题, 并提出相应政策建议。2 相关概念及计量研究角度综述2.1 经济增长与教育投入经济增长通常被定义为产量的增加, 这里的产量可以表示为经济的总产量, 也可以表示为人均产量。萨缪尔森2在经济学一书中
13、, 把经济增长定义为“经济增长代表的是一国潜在的 GDP 或国民产出的增加。”而刘易斯3在经济增长理论一书中, 则认为经济增长是人均实际产出的持续增长, 如果考虑到人口和价格因素, 经济增长就是人均实际产出的增加。本文主要是进行地区间的比较, 在衡量经济增长时, 采用以 2001 年为基期的可比人均地区生产总值 (人均地区 GDP) 。教育经济学认为, 用于教育的支出是一种投资, 其目的在于培养和提高人的劳动能力;但又不同于物质生产部门的投资, 教育投入兼具消费性和生产性二重性质, 表现出非盈利性、连续性、固定性和递增性等特点, 因此对社会体育、卫生医疗保健、社会科技文化等方面的投资不应属于教
14、育投入。2.2 教育投入与经济增长关系的计量研究角度综述传统上, 西方经济学家关于教育投入对经济增长贡献的计量研究方法主要包括:舒尔茨的增长余额分析法、丹尼森的因素分析法、斯特鲁米林的劳动简化法。在近几年对教育投入与经济增长关系的研究中, Teles 等4使用世代交叠模型分析政府对基础教育的投资对人力资本积累的影响, 从而分析出教育投入对经济增长的贡献程度;Malumfashi5基于内生增长理论, 通过协整和误差修正模型, 得出尼日利亚的教育支出能够显著地促进经济增长的结论;Khalifa6以教育支出作为人力资本的指标, 使用 1977-2004 年的时间序列数据, 通过误差修正框架下的格兰杰
15、因果关系, 分析了教育支出和经济增长在 6 个 GCC (海湾合作委员会) 国家的关系。中国在这方面的研究起步较晚, 但也取得了一定的定量研究成果。袁国敏7利用菲德模型, 对中国 1990-2000 年的教育投入对经济增长的作用及其外溢作用进行了测算;叶茂林等8通过构建教育的总量生产函数, 利用回归模型中的产出弹性系数, 度量了中国教育投入对经济增长的作用;于东平等9运用协整检验和误差修正模型, 对中国教育投入与经济增长之间的内在关系进行实证分析, 发现教育投入是经济增长的格兰杰原因;许抄军等10,11通过比较中国地级及以上城市人均教育经费、教育支出占 GDP 的比重等指标, 对中国城市教育资
16、源的差异进行了分析。随着计量经济方法的发展, 面板数据以其优良的性质也开始被研究者应用于研究教育投入及其区域差异等方面。例如, 朱凤果等12从明瑟收入方程入手, 以教育发展的面板数据为基础, 利用分位数回归对中国三个区域的三个不同阶段的教育投入风险进行了实证分析;宋马林等13采用 LISA 统计分析空间聚集和扩散模式, 结合 Morans I 和 Gearys C 方法, 对中国中部六省共 88 个地市产业发展所处的状态进行了综合判断;孟晓晨等14以全国 28 个省份为研究对象, 找出了中国初等、中等和高等人力资本的空间分布特征, 并利用经济学的资源利用最优化理论, 对人力资本空间分布的合理性
17、进行了定量分析和判断。3 实证检验3.1 数据来源数据来源于历年中国统计年鉴, 具体包括各省份的教育经费、地区生产总值、地区总人口数、地区 CPI、各地区按教育程度分组的人口数。由于各地区教育经费在统计上有两年的滞后期, 因此数据时间跨度为 2001-2010 年。为剔除价格因素的影响, 以 2001 年为基期利用 CPI 对样本数据进行了缩减。3.2 理论假设教育投入对于经济增长的作用并不是直接的, 而是通过社会经济中人的因素, 间接地对经济发展产生影响。总的来说, 教育对经济增长的作用通过两个层次传递:一方面, 教育能够促进人力资本的优化, 特别是提高劳动力的工作或生产效率, 即受教育程度
18、越高, 人们的知识和技能越高, 通常工作效率也就越高, 因而所获得的收入也越多;另一方面, 教育可以改善人类生活和生产的社会经济环境, 从而通过对生存环境的优化, 促进生产力的提高和人们生活质量的改善。由于人力资源的素质直接关系到经济发展, 并且教育投入是形成和积累人力资本的主体和核心, 因此提出以下假设: (1) 增加教育投入, 将促进中国经济的增长; (2) 对经济基础较好、但对教育投入较少的区域, 增大教育投入可以显著地对经济增长产生正面影响; (3) 地区 GDP 对教育投入的弹性取决于当地的教育发展水平。3.3 基于全国 31 个省份面板数据的基础模型首先, 以人均教育经费为解释变量
19、, 以人均 GDP 为被解释变量, 通过观察散点图 (图 1) 可以初步确定, 该面板数据更适合建立 ln (EDU) 和 ln (GDP) 的线性回归, 以减少异方差性的影响。根据是否存在个体效应和时间效应, 可以将静态面板数据模型划分为无个体影响的不变系数模型 (即混合模型) 、个体效应 (或时间效应) 只影响模型截距的变截距模型, 以及个体效应 (或时间效应) 同时影响模型截距和斜率的变系数模型三种类型15。为减少面板数据的异方差性, 采用 GLS 法 (cross-section weights) 尝试构建了全国 31 个省份的面板数据基础模型, 协方差分析法的检验结果如表 1 所示。
20、由于 F21.32、F 11.46, 所以同时拒绝 H2和 H1。因此, 模型采用变系数形式, 即:可以看出, 虽然固定影响变系数模型整体通过了显著性检验, 但北京市的 GDP对教育经费的弹性并不显著。观察图 1 并结合原始数据也很容易发现, 北京人均教育经费在经历了 2001-2005 年的增长后, 在 2006 年出现较大回落, 虽然之后表现出缓慢上升趋势, 但 2007 年可比人均教育经费甚至低于 2002 年, 直到2010 年也未达到 2005 年时最高的人均教育经费水平, 显然北京的数据结构与变系数模型是背离的。表 1 全国 31 个省份面板数据基础模型的检验结果 Tab.1 Re
21、sults of the panel model test of 31 Chinese provinces 下载原表 图 1 人均教育经费与人均 GDP 的混合数据散点图 Fig.1 Scatter diagram of per capita education funds and per capita GDP in pooled data 下载原图(左为原始数据, 右为对数形式) (Left:initial data;Right:the logarithm) 当变系数模型中所有系数均不相同时, 模型实际上已经转化为对每个个体的时间序列模型。实践中, 研究者往往对回归系数做出合理假定, 以使参
22、数估计能在面板数据模型的框架中进行。将一些系数看作相同, 也就意味着把相应的个体样本数据看作取自同一个总体。由此就产生了一个两难的选择:加强约束条件, 可以利用更多的信息使参数估计更准确, 统计检验也更有效, 但个体之间结构性差异又增加了样本与方程相背离的可能性;放松对参数的约束, 又可能因为估计参数时的样本量过小, 而造成参数估计准确性和检验有效性的下降。因此, 下面尝试利用多指标聚类的方法来达到对同组的数据合并建模的目的。为进一步分析教育经费分布的区域差异, 图 2 和图 3 分别给出了 2001 年和2010 年中国 31 个省份人均教育经费变化的折线图以及人均教育经费占人均地区生产总值
23、比例的折线图。其中, 各省份东、中、西部的划分沿用国家传统的三大经济带划分方法。从图 2 可以看出, 2010 年与 2001 年相比, 中国各省份人均教育经费都有很大幅度提高, 但各省份之间并不均衡, 甚至差异很大。其中, 东部地区的人均教育经费普遍较高, 北京、天津和上海三个直辖市的优势尤其明显;中部地区各省份的教育经费大多处于相对较低的水平;西部地区各省份 2001 年的教育经费也相对较少, 但 2010 年较 2001 年的增幅较大, 尤其以西藏、青海和内蒙古最为突出。不过也可以发现, 依据传统的三大经济带划分方法, 区域内部各省份之间的人均教育经费仍存在较大差异。东部区域的河北、山东
24、两省的人均教育经费水平, 与中部区域的情况相近, 均不及北京、上海的一半;西部区域的内蒙古、西藏、宁夏、新疆的人均教育经费, 又明显超过了同区域内的其他省份, 甚至与东部一些省份 (福建、浙江、江苏、辽宁) 的水平相当。进一步通过教育经费占 GDP 的比例来比较各地区教育对经济增长的贡献程度 (图 3) , 可以发现, 即使是三大经济带内部, 教育经费占 GDP 的比例也存在较大分化。其中, 以西部地区分化最为严重:西藏的教育经费占 GDP 的比例在2010 年高达 13%, 而内蒙古却只有 3.6%。10 年间, 除了北京和西藏在该比例上有较大变动外, 其他地区均为小幅波动。由于三大经济带的
25、内部仍然存在显著的结构性差异, 如果强行基于该划分标准构建面板模型, 将会直接导致模型设定的不合理, 而且也会由于估计参数时样本量过小, 而造成参数估计准确性和检验有效性的下降。因此, 接下来将首先利用面板数据聚类方法对各省份进行分组, 以达到增大组内样本量的目的。图 2 各省份 2010 年和 2001 年的人均教育经费折线图 Fig.2 Line graph of per capita education funds in 2001 and 2010 for 31 Chinese provinces 下载原图图 3 各省份 2010 年和 2001 年的人均教育经费占人均地区生产总值的比例
26、Fig.3 Line graph of ratio of per capita education funds to per capita GDP in 2001 and 2010 for 31 Chinese provinces 下载原图3.4 多指标面板数据聚类分析3.4.1 指标和聚类方法说明以 2001-2010 年中国 31 个省份相关面板数据为基础, 对教育发展水平进行聚类分析。所选取反映各省份教育发展水平的指标包括人均受教育年限、人均教育经费、教育经费占地区 GDP 的比例, 并事先对数据进行标准化处理。借鉴李因果等提出的面板数据聚类方法16, 综合考虑面板数据个体间的“绝对量距
27、离”、“增长速度距离”以及“变异系数距离”, 构造面板数据分类 Gl中样品离差平方和以及总离差平方和的表达式, 即:式中:、 分别表示个体间绝对量距离、增长速度距离以及变异系数距离的权重系数。采用 Ward 法进行系统聚类, 由于该方法计算出的三种距离绝对值差异较大, 为能综合考虑三种距离的影响, 避免 Ward 统计量退化为传统Ward 统计量, 在测算综合距离时, 把权重系数设为=0.8、=0.05、=0.15。3.4.2 聚类分析结果中国各省份基于教育发展水平的面板数据聚类结果如图 4 所示。结合聚类树形图与实际情况, 将中国 31 个省份按照教育发展水平划分为四大类:第一类:北京、天津
28、、上海。这三个直辖市的人均受教育年限、人均教育经费均明显高于国内其他地区, 而教育经费占地区 GDP 的比例则呈下降趋势, 北京更是从 8.6% (2001 年) 降到了 4.3% (2010 年) , 且该比例在 2006-2010 年均维持在 4%左右。第二类:河北、河南、山东、山西、吉林、黑龙江、湖北、内蒙古、辽宁、江苏、广东、安徽、广西、四川、江西、重庆、湖南、浙江、福建。这 19 个省份的特点是教育经费占地区 GDP 的比例在 10 年间一直处于较低水平, 且振幅较小, 但组内人均教育经费的差距却在拉大;至 2010 年, 江苏、广东、浙江、内蒙古的人均教育经费已经明显高于组内的其他
29、省份。第三类:海南、宁夏、青海、陕西、新疆、贵州、甘肃、云南。与第二类区域相比, 其特点是教育经费占地区 GDP 的比例普遍较高, 2010 年均达到 5.7%以上。图 4 面板数据聚类树形图 Fig.4 Cluster diagram of panel data 下载原图第四类:西藏。西藏的人均受教育年限在 2001-2008 年间几乎没有改变, 但受益于“教育援藏”政策, 2010 年出现大幅增长, 人均教育经费已排名全国第四, 教育经费占地区 GDP 的比例由 7.1% (2001 年) 大幅增长到 13.1% (2010 年) , 远远高于其他省份。根据聚类分析的原理, 上述划分已经满
30、足“组内差异最小、组间差异最大”的聚类要求。但进一步建立面板数据模型的结果 (表 2) 表明, 第二类、第三类区域内部仍然存在结构性差异, 即第二类、第三类区域仍然适用于变系数模型。对于变系数模型, 所有回归系数并不是均在统计上显著的互不相等。考虑到所使用面板数据的时间较短, 若采用变系数模型, 可能会因样本量过小而造成参数估计准确性和检验有效性的下降, 使参数估计不稳定, 而且容易拒绝原假设, 即容易检验为变系数模型。因此, 简单地根据聚类树形图将 31 个省份划分为四大类, 并不符合面板数据的模型结构, 需要进一步将第二类、第三类区域细分。区域细分的方法是:以各类之间的欧式距离为基础, 逐
31、渐拆分类, 每减少一个距离较“远”的成员, 做一次面板数据模型设定检验, 直至所有的小类均符合变截距模型或不变系数模型为止。表 2 一类、二类和三类区域的面板数据模型形式设定检验结果 Tab.2 Results of the panel model tests of three areas 下载原表 依照上述方法, 最终将全国 31 个省份划分为九组, 每组所适合的模型类型以及所包含的省份见表 3。3.5 九组区域的面板建模结果分析3.5.1 以五区的建模过程为例在变截距模型的基础上, 通过 Hausman 检验进一步验证模型中不可观测的个体影响与解释变量是否相关, 检验结果如表 4。Haus
32、man 检验表明, 第五区模型的 Hausman Test 统计量 (W) 为 1.0006, P 值是 0.3172, 接受原假设, 即随机影响模型中个体影响与解释变量不相关。因此, 将模型设定为个体随机效应模型, 估计随机效应模型采用可行广义最小二乘法 (feasible generalized least squares, FGLS) , 估计结果如表 5。与固定效应模型相比较, 个体随机效应模型相当于把固定效应模型中的截距项看成两个随机变量, 一个是截面随机误差项, 一个是时间随机误差项。一般表达式为:其中误差项在时间上和空间上都是相关的, 可表示为:据此, 得到黑龙江、吉林、山西和湖
33、北四省的估计表达式分别为:检验结果表明, 模型中各参数在 95%的置信水平下均显著, 五区的 GDP 对教育投入的弹性为 1.187, 即:教育投入平均每增加 1%, GDP 将会平均增加 1.187%。需要说明的是, 根据单指标回归方程的特点, 在解释回归系数时, 没有对其他变量进行控制, 因而回归系数一般会比因素分析得到的结果略高。表 3 九组区域的面板数据模型形式设定检验结果列表 Tab.3 Results of the panel model tests of nine areas 下载原表 3.5.2 九个区域建模结果分析分别对九个区域建立面板数据模型。其中, 个体随机效应模型采用
34、FGLS 估计法, 并采用 Swamy-Arora 法计算随机影响模型中的成分方差估计值;对于个体固定效应模型, 采用 GLS 法 (cross-section weights) 估计。结果如表 6。3.5.3 教育投入对经济增长作用的区域差异由表 6, 总体来看, 从一区到九区人均 GDP 和人均受教育年限基本呈递减趋势, GDP 对教育投入的弹性也随之由富有弹性渐变为缺乏弹性, 表明经济基础影响着当地教育发展水平, GDP 对教育投入的弹性受经济基础和教育发展水平的共同影响。由于各区所包括省份的文化背景、经济基础以及政策倾斜等的不同影响, 教育投入对经济增长的作用呈现出明显的区域差异。(1
35、) 一区面板数据建模结果表明, 该区 GDP 对教育投入的弹性系数为 1.384, 远高于其他各区。一区包括北京、上海、天津三个直辖市, 由于农村人口比例低, 以及一线城市的聚集效应, 该区经济基础雄厚、居民文化素质高, 表现出经济基础、受教育程度与教育弹性之间的良性互动关系。表 4 第五区的面板数据模型 Hausman 检验结果 Tab.4 Results of the Hausman test of area 5 下载原表 (2) 归属第二大类的二区至六区面板数据建模结果表明, 除六区 GDP 对教育投入的弹性系数略低于 1 外, 其他四区均大于 1, 虽然各区的居民文化素质不高 (平均受
36、教育年限几乎均不超过 9 年) , 但经济基础相对较好, 教育与经济增长之间仍表现为良性互动。表 5 第五区的个体随机效应模型估计结果 Tab.5 Results of individual random effects of area 5 下载原表 (3) 归属第三大类的七区至九区面板数据建模结果表明, 三个区的 GDP 对教育投入的弹性系数均低于 0.9, 其中九区 (西藏) 的弹性系数只有 0.649。该大类包括中国中部、西部的云南、甘肃、贵州、宁夏、海南、新疆、陕西、青海、西藏共 9 个省份, 它们普遍经济基础薄弱、教育发展水平低, GDP 对教育投入缺乏弹性, 教育和经济增长之间呈现为消极互动局面。尤其是西藏, 人均 GDP超过云南、甘肃、贵州 3 个省份, 但由于其受教育年限不足 7 年, 严重影响了教育转化为生产力的效率, 致使 GDP 对教育投入的弹性系数严重偏低。表 6 九组区域的面板数据建模结果列表 Tab.6 Panel models of nine areas 下载原表 4 结论与讨论4.1 结论