1、计量经济学,一个参考例题摘要:本文主要通过对文盲比例的变动进行多因素分析,建立以文盲比例为应变量,以其它可量化影响因素为自变量的多元线性回归模型,并利用模型对文盲这一社会现象进行数量化分析,就有关如何主动降低文盲比例提出一些可供参考的意见。 关键词:文盲比例 多因素分析 模型 计量经济学 检验 一、引言部分 世界经济一体化趋势的增强和全球性技术革新的加速,使得在未来的发展中减少对劳动密集型产品的依赖成为一种必然趋势。因而,保证经济的增速,实现持续发展,最首要、最根本的问题就是全面提高国民素质,而要提高国民素质,就必须首先解决扫盲的问题。 文盲既是贫穷、愚昧的产物,又是产生新的贫穷和愚昧的载体,
2、它阻碍着人类走向文明,给国家乃至整个世界带来沉重的负担和无穷的忧患。文盲问题是一个全球性的严重问题,并且,目前已引起国际社会特别是发展中国家的普遍重视,为了与世界教育发展的目标接轨,我们国家也把扫盲和普及义务教育作为发展教育事业的重中之重。多年来,我们国家为扫除文盲进行了艰苦卓绝的努力,也取得了令世人瞩目的成绩。但是,由于经济、文化、历史的原因,我国的文盲现象仍然十分严重。政府若要积极主动地、有效地减少文盲人口,首先就必须正确地认识影响文盲人口变动的主要因素,从而通过直接作用于主要因素,达到控制文盲比例问题。 二、文献综述 1.台湾教育与经济发展 罗祥喜编著 台湾教育丛书 从理论上讲,教育的发
3、展不能超越社会生产力的发展水平,必须有一定的物质条件作保证。教育经费是发展教育不可缺少的物质基础。40 多年来,台湾的教育随经济的发展而不断增加,且其增长率高于经济增长率,教育经费在台湾当局预算开支和“国民生产总额” (GNP)中的比率也不断增加。台湾社会经济条件的改进,促进了教育的快速发展,使就业人口的受教育程度普遍提高,战后初期到 50 年代,台湾劳动力的教育结构由文盲一半以上转为小学毕业生占一半以上。 2.家庭消费经济学 顾纪瑞 著 中国财政经济出版社 文化消费在整个消费结构中比重。随着生产力的发展和居民收入的增加而逐步增长。如今,走进普通城市居民家庭,常常会感到一股热烈的文化气息,文化
4、需求已在城乡成为一个重要的消费领域。根据统计资料反映,文化消费充分凸显了迅速增长的趋势,其中教育费用的支出,已被人们置于极重要的地位。 3.中国高等教育改革 中国财政经济出版社 中国是世界上经济增长最快的国家之一,为了保持这样的增长速度,社会对教育程度高的人才需求会是很高的,从 1978 至1994 年,国家财政收入中用于教育的公共经费从 210 亿增至 980 亿人民币,年均增长率为 10%。教育经费的大额支出,带来了文盲人口的急剧下降。直至 1999 年,全国青壮年文盲人数降到了 300 万以下。 4.中国物价及城镇居民家庭收支调查统计年鉴 1999 年 居民收入稳中渐升,差距拉大(不同地
5、区、城市;不同收入阶层;不同收入来源) 消费增长速度缓慢,消费结构改变,发展资料需逐年增长,98 年娱乐、教育、文化服务的消费人均 499 元,占消费总额的 11.5%。 5.http:/ 据统计资料显示,文盲率 13 年下降 18 个百分点,人均预期寿命 15 年提高 3 岁 改革开放以来,中国文盲人口总量不断减少,成人文盲率大幅度下降,人均受教育水平明显提高。1982 年,中国 15岁以上文盲人口有近 23 亿,成人文盲率为 3449,到 1995 年,15 岁以上文盲人口降到不足 15 亿,成人文盲率降为1648。13 年来文盲人口减少近 8000 万,文盲率下降 18 个百分点。 三、
6、研究目的 本文主要对文盲比例(应变量)进行多因素分析(具体分析见下图) ,并搜集相关数据,建立模型,对此进行数量分析。在得到文盲比例与各主要因素间的数量关系后,据模型方程中的各因素系数大小,分析主要因素和次要因素,从而找出政府干预的主要着手点,为政府提出一些关于解决文盲人口问题的建议。 *影响文盲比例变动的主要影响因素如下图: 政府干预方面 有效教育经费支出 办学力度 宣传力度(包括影视、传单、公开活动等宣传活动,制定相关政策等) 个人家庭方面家庭富裕程度 受教育成本(包括强迫性支出和自主性支出) 社会环境方面文化用品(如:图书)的发行流转率 社会对文化人口的需求 人们教育观念的转变 自然规律
7、方面人口的自然死亡 (注*:由于宣传力度、教育观念的转变情况、人们的心理预期等是不可量化的因素,所以我们仅用文盲比例、人均 GDP、人均教育经费支出、小学数、人均图书流转量、人均学费来进行回归分析) 四、建立模型 其中,Y文盲比例 X1人均 GDP X2 人均教育经费支出 X3 小学数 X4 人均图书流转量 X5人均学杂费 (注*:有关模型的一些假定: (1)假定政府教育经费投入的有效系数为 1,即投入全部有效。 (2)假定各省、地区间没有人口流动。 (3)死亡人口中文盲人数的比例与总人口中文盲人数的比例相同。) 五、数据搜集 1. 数据说明 一般说来,应使用同一地区时间序列数据进行拟合,因为
8、文盲比例的变动很大程度上是取决于前几期人均 GDP 等因素的影响,即模型中自变量对应变量(文盲比例)的影响是滞后的。另外,时间序列数据也可以消除地区间的差异(特别是在我国,政策性较强,使得各地区间的差异很多是有非经济因素引起的) 。但是,由于人口普查周期为十年,各年的文盲比率不易收集,且数量不会很多,若使用时间序列数据进行拟合,自由度很低。故在此我们被迫采用了效果可能不会很好的截面数据,试看一下效果。 2. 数据的搜集情况 采用 2000 年分地区截面数据,具体情况见附表一。 六、模型的参数估计、检验及修正 1.模型的参数估计及其经济意义、统计推断的检验 利用 EVIEWS 软件,用 OLS
9、方法估计得:(见附表二) 可见,X1、X3 、X4 的 t 值都不显著,且 X1、X2 、X5 的系数也不符合经济意义。因为从经济意义上讲,文盲比例应随着人均 GDP、人均教育经费支出、小学数、人均图书流转量的增长而降低,随人均学杂费的增长而提高。另外,修正可决系数为 0.456235,F 值为6.034186,仍是不高。故我们对上述模型进行计量经济学的检验,并进行修正,看是否能使模型方程得到改进。 2.计量经济学检验 (1)多重共线性检验 用 EVIEWS 软件,得相关系数矩阵表: X1 X2 X3 X4 X5 X1 1.000000 0.869998 -0.407863 0.917858
10、0.878835 X2 0.869998 1.000000 -0.432665 0.750329 0.871513 X3 -0.407863 -0.432665 1.000000 -0.242017 -0.240471 X4 0.917858 0.750329 -0.242017 1.000000 0.799473 X5 0.878835 0.871513 -0.240471 0.799473 1.000000 由上表可以看出,解释变量 X1 与 X2 、X1 与 X4 、X1 与 X5、X2 与X4、X2 与 X5 X4 与 X5 之间的相关系数都较大,可见存在严重的多重共线性。在经济意义上
11、,人均 GDP、人均教育经费支出、人均图书流转量、人均学费都与经济的发展密切相关,这使得他们之间的相关性很强。 下面我们利用逐步回归法(变量剔除法)进行修正(见附表三、四、五): 此时,修正可决系数开始下降,但所有参数的 t 值都已经比较显著,且 F 值也有了一定的增加,故不在删除变量,选择此模型为修正后的模型。 可见,由模型得出,文盲比例随人均教育经费支出的增加而增加,随人均学杂费的减少而减少的结论。这严重与经济意义相悖。另外,模型中虽然 X2、X5 的 t 值都比较显著,但修正可决系数为0.465184,F 值为 14.04701,仍不是很高。 (2)异方差检验(white 检验) (具体
12、数据见附表六) 由拟合的数据可知, ,故拒绝原假设,表明模型中随机误差项存在异方差。下面用取对数法对模型进行修正(见附表七) 。 修正后的方程如下:可见,模型表明文盲比例变化率仅与人均教育经费支出变化率和人均学杂费支出变化率相关,此时,异方差性得到削弱,参数估计精度有所提高,修正可决系数及 F 值也稍有提高。 (3)自相关检验 由附表七可知:d=0.679059。在显著水平 =0.05 下,查表 n=31,k=2 时,DL =1.297,du=1.570,由于d=0.679059DL=1.297,表明该模型中的误差序列存在一阶自相关。 下面用广义差分法进行修正,由 d=0.679059,计算出
13、 =1- =0.6604705,构造差分 模型并估计,得 DLY=1.642603+0.010382DLX2-0.423590DLX5 t=(3.078321) (1.948328) (-3.149106) =0.501723 F=8.693012 DW=1.112734 发现经过广义差分法修正后,DW 值有所提高,但仍存在自相关 七、模型的分析 我们进行了一系列检验和修正后的最终结果如下: LY=3.285205+0.009784LX2-0.407599LX5 (4.942838) (3.074541) (-5.680451) R =0.586595 F=19.86509 =0.557066
14、 从模型中可看出: (1) LX2、LX5 不符合经济意义的检验(参数的大小及符号) 。因为从经济意义上讲,文盲比例应随人均教育经费支出的增加而减少,随人均学杂费的减少而增加,即 LX2 的系数应为负值,而 LX5 的系数应为正值。 (2) 模型表明:文盲比率仅与政府财政人均教育经费的支出和个人家庭人均学杂费支出有明显的相关关系,与人均 GDP 无明显的相关关系。然而实际上,文盲比例的变化是和由人均 GDP 度量的财富积累水平高度相关的。 (3) 模型的修正可决系数及 F 值不高,模型的拟合优度相当差。 由上述分析可知,我们的模型并不成功。 八、总结 综上所述,我们采用截面数据拟合的模型不能成
15、功的反映文盲比率与各影响因素间的数量关系,是一个失败的模型。我们做了仔细分析,认为可能主要是出于以下几种原因: (1)由于当期的人均 GDP、人均教育经费支出、小学数、人均图书流转量、人均学杂费都对以后若干期的文盲比例产生影响,这种影响是长期的。而在模型中,我们考虑的是当期的因素对当期的文盲比例的影响,此二者的关系是不显著的,故而导致了模型的失败。 注*:由于我们无法获得时间序列数据而被迫使用截面数据,曾考虑在截面数据模型中引入滞后变量,这样同样可以把滞后效应(即发生影响的滞后性)考虑入模型中去。但是,究竟滞后几期(无先验信息) ,以及由引入滞后变量而带来的多重共线性问题,用我们目前所学的知识
16、无法解决。 (因为修正多重共线性一般要用逐步回归法,也即剔除变量法,这样会使得我们引入的滞后变量被大部分剔除,因而导致我们的引入无效) (2)我们在模型中所做的假定不合理。在模型中,我们所假定的教育经费支出的投入有效系数可能在各地区是不等的,且在数值上小于 1(这主要是由于政府的腐败现象在各地程度不一,以及各地区掌管教育经费安排的人员素质、执行力度不同等因素所引起的) 。另外,我们还假定死亡人口中文盲的比例与总人口中文盲比例相同。但实际上,文盲中老龄人口的比重比较大,而自然死亡是近年来文盲迅速减少的重要原因之一(我们的模型存在自相关,可能也就是因为此原因,即模型缺失了重要变量) 。可能正是由于
17、我们对这些重要因素所不得不作出的忽略,致了模型的失败。 (3)由于我国的统计数据含有一定的水分,而导致了我们赖以进行参数估计的数字基础不具备可靠性,可能也是重要原因之一。 参考文献: 1.台湾教育与经济发展 罗祥喜编著 台湾教育丛书 2.家庭消费经济学 顾纪瑞 著 中国财政经济出版社 3.中国高等教育改革 中国财政经济出版社 4.中国物价及城镇居民家庭收支调查统计年鉴 1999 年 附表: 一: obs 教育经费支出(X2) 总小学数(X3) 教育经费支出(X2) 人均图书流转量(X4) 人均 GDP(X1) 文盲比例 (Y) 1 1930682. 2169.000 1930682. 1663
18、64.0 22460.00 4.230000 2 579702.8 2323.000 579702.8 106067.0 17993.00 4.930000 3 1382482. 36465.00 1382482. 364172.0 7663.000 6.650000 4 694615.7 37451.00 694615.7 166999.0 5137.000 4.180000 5 533015.7 10147.00 533015.7 81519.00 5872.000 9.120000 6 1252493. 13356.00 1252493. 285093.0 11226.00 4.7600
19、00 7 837866.3 9435.000 837866.3 140619.0 6847.000 4.570000 8 1044767. 13995.00 1044767. 144853.0 8562.000 5.100000 9 1744476. 1034.000 1744476. 464494.0 34547.00 5.400000 10 2617051. 19110.00 2617051. 672121.0 11773.00 6.310000 11 1828191. 11841.00 1828191. 339527.0 13461.00 7.060000 12 1034184. 242
20、81.00 1034184. 299645.0 4867.000 10.06000 13 1042182. 13935.00 1042182. 226189.0 11601.00 7.200000 14 658618.3 21082.00 658618.3 201314.0 4851.000 5.160000 15 2087357. 26017.00 2087357. 498772.0 9555.000 8.460000 16 1531727. 41269.00 1531727. 535956.0 5444.000 5.870000 17 1538421. 23372.00 1538421.
21、327262.0 7188.000 7.150000 18 1397292. 34521.00 1397292. 332143.0 5639.000 4.650000 19 3144558. 24202.00 3144558. 433409.0 12885.00 3.840000 20 840142.7 16109.00 840142.7 226460.0 4319.000 3.790000 21 212244.1 4167.000 212244.1 52290.00 6894.000 6.980000 22 601278.1 14730.00 601278.1 140457.0 5157.0
22、00 6.950000 23 1375095. 43326.00 1375095. 387233.0 4784.000 7.640000 24 433565.9 17985.00 433565.9 101817.0 2662.000 13.89000 25 900880.6 22151.00 900880.6 148437.0 4637.000 11.39000 26 76981.00 842.0000 76981.00 2329.000 4559.000 32.50000 27 85250.90 33336.00 85250.90 224395.0 4549.000 7.290000 28
23、476792.9 21557.00 476792.9 105627.0 3838.000 14.34000 29 106626.5 3429.000 106626.5 12546.00 5087.000 18.03000 30 128222.1 3267.000 128222.1 19960.00 4839.000 13.40000 31 606396.7 6718.000 606396.7 91738.00 7470.000 5.560000 表二: Dependent Variable: Y Method: Least Squares Date: 07/10/98 Time: 14:43
24、Sample: 1 31 Included observations: 31 Variable Coefficient Std. Error t-Statistic Prob. C 15.24285 2.065306 7.380433 0.0000 X1 0.000200 0.000467 0.428899 0.6717 X2 0.016095 0.007187 2.239541 0.0343 X3 -0.00925 0.007686 -1.204243 0.2398 X4 -0.020311 0.046189 -0.439733 0.6639 X5 -0.294092 0.079633 -3
25、.693076 0.0011 R-squared 0.546863 Mean dependent var 8.272903 Adjusted R-squared 0.456235 S.D. dependent var 5.686135 S.E. of regression 4.192978 Akaike info criterion 5.876685 Sum squared resid 439.5267 Schwarz criterion 6.154231 Log likelihood -85.08862 F-statistic 6.034186 Durbin-Watson stat 1.78
26、0219 Prob(F-statistic) 0.000856 表三: Dependent Variable: Y Method: Least Squares Date: 07/10/98 Time: 14:52 Sample: 1 31 Included observations: 31 Variable Coefficient Std. Error t-Statistic Prob. C 15.47034 1.964463 7.875098 0.0000 X2 0.017015 0.006750 2.520606 0.0182 X3 -0.000106 6.86E-05 -1.550419
27、 0.1331 X4 -0.004643 0.027818 -0.166900 0.8687 X5 -0.281111 0.072493 -3.877762 0.0006 R-squared 0.543529 Mean dependent var 8.272903 Adjusted R-squared 0.473302 S.D. dependent var 5.686135 S.E. of regression 4.126653 Akaike info criterion 5.819500 Sum squared resid 442.7608 Schwarz criterion 6.05078
28、8 Log likelihood -85.20225 F-statistic 7.739664 Durbin-Watson stat 1.786424 Prob(F-statistic) 0.000301 表四: Dependent Variable: Y Method: Least Squares Date: 07/10/98 Time: 14:59 Sample: 1 31 Included observations: 31 Variable Coefficient Std. Error t-Statistic Prob. C 15.43888 1.919874 8.041611 0.00
29、00 X2 0.016833 0.006541 2.573503 0.0159 X3 -0.000106 6.74E-05 -1.579088 0.1260 X5 -0.286329 0.064218 -4.458686 0.0001 R-squared 0.543040 Mean dependent var 8.272903 Adjusted R-squared 0.492266 S.D. dependent var 5.686135 S.E. of regression 4.051681 Akaike info criterion 5.756055 Sum squared resid 44
30、3.2351 Schwarz criterion 5.941085 Log likelihood -85.21885 F-statistic 10.69536 Durbin-Watson stat 1.792203 Prob(F-statistic) 0.000083 表五: Dependent Variable: Y Method: Least Squares Date: 07/10/98 Time: 15:02 Sample: 1 31 Included observations: 31 Variable Coefficient Std. Error t-Statistic Prob. C
31、 13.26938 1.376316 9.641227 0.0000 X2 0.021674 0.005930 3.654938 0.0011 X5 -0.317662 0.062684 -5.067708 0.0000 R-squared 0.500838 Mean dependent var 8.272903 Adjusted R-squared 0.465184 S.D. dependent var 5.686135 S.E. of regression 4.158335 Akaike info criterion 5.779872 Sum squared resid 484.1690
32、Schwarz criterion 5.918645 Log likelihood -86.58802 F-statistic 14.04701 Durbin-Watson stat 2.138128 Prob(F-statistic) 0.000060 表六: White Heteroskedasticity Test: F-statistic 23.60129 Probability 0.000000 Obs*R-squared 25.58066 Probability 0.000108 Test Equation: Dependent Variable: RESID2 Method: L
33、east Squares Date: 07/10/98 Time: 16:00 Sample: 1 31 Included observations: 31 Variable Coefficient Std. Error t-Statistic Prob. C 19.65554 13.46246 1.460026 0.1567 X2 0.300607 0.056692 5.302491 0.0000 X22 0.000489 0.000102 4.782576 0.0001 X2*X5 -0.013009 0.001911 -6.806030 0.0000 X5 -3.081696 0.458
34、746 -6.717653 0.0000 X52 0.080169 0.009767 8.208089 0.0000 R-squared 0.825183 Mean dependent var 15.61836 Adjusted R-squared 0.790219 S.D. dependent var 30.28948 S.E. of regression 13.87313 Akaike info criterion 8.269771 Sum squared resid 4811.595 Schwarz criterion 8.547317 Log likelihood -122.1814
35、F-statistic 23.60129 Durbin-Watson stat 2.376012 Prob(F-statistic) 0.000000 表七: Dependent Variable: LY Method: Least Squares Date: 07/10/98 Time: 16:02 Sample: 1 31 Included observations: 31 Variable Coefficient Std. Error t-Statistic Prob. C 3.285205 0.664639 4.942838 0.0000 LX2 0.009784 0.131254 0
36、.074541 0.9411 LX5 -0.407599 0.071755 -5.680451 0.0000 R-squared 0.586595 Mean dependent var 1.970591 Adjusted R-squared 0.557066 S.D. dependent var 0.495294 S.E. of regression 0.329634 Akaike info criterion 0.710099 Sum squared resid 3.042444 Schwarz criterion 0.848872 Log likelihood -8.006541 F-statistic 19.86509 Durbin-Watson stat 1.679059 Prob(F-statistic) 0.000004