1、恩格尔系数模型检验恩格尔系数模型检验论文摘要:本论文的初衷在于分析影响恩格尔系数的因素,并找出它们与恩格尔系数之间的数量关系,希望能为政府经济决策提供参考。鉴于中国国情的复杂(城乡差距,东西差距等地域差别的存在),本小组把讨论范围仅限于四川城镇。关键词:恩格尔系数 城镇居民人均可支配收入 人均求实可支配收入 人均住房面积 每百人电视拥有量 食品物价指数一理论背景19 世纪德国统计学家恩格尔根据统计资料,对消费结构的变化得出一个规律:一个家庭收入越少,家庭收入中用来购买食物的支出所占的比例就越大,随着家庭收入的增加,家庭收入中用来购买食物的支出则会下降。推而广之,一个国家越穷,每个国民的平均收入
2、中用于购买食物的支出所占比例就越大,随着国家的富裕,这个比例呈下降趋势。这个定律被称为恩格尔定律。而恩格尔系数是根据恩格尔定律得出的比例数,是表示生活水平高低的一个指标。其计算公式为:恩格尔系数= 食物支出金额/总消费支出金额*100%。 其中:食品支出包括主食、副食、其他食品和在外饮食支出。主食是指各种粮食和粮食复制品。粮食复制品是指利用原粮加工而成的食品,如挂面等。但不包括用粮食加工成的豆油、豆腐、粉条、酒等。副食包括蔬菜、豆制品、油脂类、食糖、肉、禽及其制品、蛋 类、水产品、调味品等。其他食品包括烟草类、酒类、 饮料类、干 鲜果品、糖果糕点,奶制品、罐头类等。 生活消费支出:是指居民年内
3、用于物质生活和精神生活方面的实际支出,包括食品、衣着、住户、燃料用品及其他的生活消费品支出及文化服务、生活服务支出和其他非商品支出。恩格尔定律主要表述的是食品支出占总消费支出随收入变化而变化的一定趋势。揭示了居民收入和食品支出之间的定量关系和相关关系,用食品支出占消费总支出的比例来说明生产发展、收入增加对生活消费的影响程度。众所周知,吃是人类生存的第一需要,在收入水平较低时,其在消费支出中必然占有重要地位。随着收入的增加,在食物需求基本满足的情况下,消费的重心才会开始向穿、用等方面转移。因此,一个国家或家庭生活越贫困,恩格尔系数就越大;反之,生活越富裕,恩格尔系数就越小。 恩格尔定律和恩格尔系
4、数一经提出,就得到西方经济学界的广泛接受和确认,认为它具有普遍的适用性。在我国也较早的就被应用在统计工作当中。计算恩格尔系数一般是采用各地的城乡住户调查资料。如根据天津市年城镇住户调查资料,居民人均消费性支出为元,其中人均食品支出为元,则恩格尔系数为。 国际上常常用恩格尔系数来衡量一个国家和地区人民生活水平的状况。根据联合国粮农组织提出的标准,恩格尔系数在以上 为贫困,为温饱,为小康,低于为富裕。在我国运用这一标准进行国际和城乡对比时,要考虑到那些不可比因素,如消费品价格比价不同、居民生活习惯的差异、以及由社会经济制度不同所产生的特殊因素。对于这些横截面比较中的不可比问题,在分析和比较时应做相
5、应的剔除。另外,在观察历史情况的变化时要注意,恩格尔系数反映的是一种长期的趋势,而不是逐年下降的绝对倾向。它是在熨平短期的波动中求得长期的趋势。 二模型设定1 影响因素:对于系数的分子项食物支出,其影响因素主要有收入约束、食品价格、食品结构;对于分母项总消费支出,其主要影响因素有收入、家庭财富。其中:收入采用人均可支配收入(INCOME );食品价格采用消费物价指数(FINDEX);食品结构采用肉禽支出占食品消费百分比(MEAT),因 为观察历年城镇居民消费结构数据后我们发现在食品类支出中肉禽类始终占据第一位,粮食居其次;对于家庭财富,由于其中包括家庭储蓄、住房、耐用消费品等许多因素,而现阶段
6、四川身处西部,整体经济落后人民生活水平不高,住房、耐用消费品在家庭支出中仍占有重要地位,因此家庭财富用人均住房面积(HOUSE)代替2 建立模型(1)我们初步建立的是简单线性回归模型Y=+INCOME+FINDEX+MEAT+HOUSE+(2)数据的获得由于 1978 到 1989 年的城镇恩格尔系数数据在四川统计年鉴中缺损,经过小组成员的讨论后,我们决定采用 1990 年至 2001 年的数据。我们查阅了 1992 年到 2002 年的四川省统计年鉴、四川统计网上查找数据,得到了数据。年份恩格尔系数(EN)(%) 人均每年可支配收入(INCOME )食物指数(FINDEX)90 年为基期肉禽
7、支出占食品总支出的比例(MEAT)人均住房面积(HOUSE)(平方米)199053.81498.3710.2493935216.7199151.91714.491.054080.282126547199254.12002.971.192080.2817856347.2199352.12428.461.411450.2833298727.6199451.73312.541.9350190.2871104257.9199551.34004.792.3916980.2811005198.1199651.34426.212.5974240.2750884188.6199749.14787.862.69
8、09350.283547929199844.95159.972.580630.2534072269.4199943.8855102.467080.2450995299.9200041.485925.592.336260.25117410510.42200140.236406.562.4017180.23973546811.58(3)参数估计我们先对模型的稳定性进行检验,运用 eviews 回归,我们得到以下结果EN 检验ADF Test Statistic 1.168556 1% Critical Value*-4.32605% Critical Value-3.219510% Critica
9、l Value-2.7557HOUSE 检验ADF Test Statistic 2.674950 1% Critical Value*-4.32605% Critical Value-3.219510% Critical Value-2.7557MEAT 检验ADF Test Statistic-0.171096 1% Critical Value*-4.32605% Critical Value-3.219510% Critical Value-2.7557FINDEX 检验ADF Test Statistic-2.697509 1% Critical Value*-4.32605% Cr
10、itical Value-3.219510% Critical Value-2.7557INCOME 检验ADF Test Statistic-0.919051 1% Critical Value*-4.32605% Critical Value-3.219510% Critical Value-2.7557显然,这些变量都不平稳。由于我们的计量经济学知识有限,我们没有方法对它们进行协整。因此我们决定在下面的分析中忽略数据的非平稳性。对我们查到的这些数据运用 eviews 回归,我们得到以下结果Dependent Variable: ENMethod: Least SquaresDate: 1
11、2/19/04 Time: 15:05Sample: 1990 2001Included observations: 12VariableCoefficientStd. Errort-StatisticProb. C43.3898212.679803.4219630.0111INCOME-0.0058280.002664-2.1879570.0649FINDEX0.0726570.0299412.4266710.0456MEAT17.6449728.293370.6236430.5526HOUSE1.0502221.9615620.5354010.6090R-squared0.970574 M
12、ean dependent var48.81583Adjusted R-squared0.953759 S.D. dependent var4.871351S.E. of regression1.047521 Akaike info criterion3.225066Sum squared resid7.681099 Schwarz criterion3.427111Log likelihood-14.35040 F-statistic57.72114Durbin-Watson stat2.507658 Prob(F-statistic)0.000019三 模型检验1经济意义检验INCOME
13、人均收入系数 为负,表明随收入的上升恩格尔系数在下降,符合经济意义。 MEAT 肉禽支出占食品支出比例系数 为正,表明随肉禽消费比例增大,恩格尔系数上升,符合经济意义。HOUSE 人均住房面积系数为正,表明随住房面积扩大,家庭财富的增加,改善生活的支出增大,但恩格尔系数上升,人民生活没有改善,不符合经济意义。2统计推断检验从回归结果看,R-squared=0.970574 ,拟和优度很高,拟和效果好。3.计量经济学检验(1)多重共线检验A 、检验:F 值为 57.72,变量整体 对恩格尔系数的解释力较强,但是MEAT、HOUSE 的 T 值不显著,从学 过的知识我们推断这些变量间可能存在多重共
14、线性,为了检验我们推断的准确性,我们对变量进行多重共线的检验。通过检验我们得到以下结果:MEATINCOMEHOUSEFINDEXMEAT 1.000000-0.548043-0.643659-0.246646INCOME-0.548043 1.000000 0.964479 0.895163HOUSE-0.643659 0.964479 1.000000 0.756473FINDEX-0.246646 0.895163 0.756473 1.000000从结果可看出人均收入与人均住房、食物价格指数有很强的线性相关。B 、多重共线的修正:对 HOUSE 和 INCOME 进行 eviews 检
15、验得:HOUSE = 5.310068087 + 0.0008410560592*INCOME去掉 HOUSE 再对模型进行估计:Dependent Variable: ENMethod: Least SquaresDate: 12/19/04 Time: 15:57Sample: 1990 2001Included observations: 12VariableCoefficientStd. Errort-StatisticProb. C48.880447.1169006.8682210.0001INCOME-0.0044430.000605-7.3469600.0001FINDEX0.0
16、585760.0136584.2888620.0027MEAT21.1390726.274350.8045520.4443R-squared0.969369 Mean dependent var48.81583Adjusted R-squared0.957882 S.D. dependent var4.871351S.E. of regression0.999728 Akaike info criterion3.098534Sum squared resid7.995644 Schwarz criterion3.260170Log likelihood-14.59120 F-statistic
17、84.39096Durbin-Watson stat2.451550 Prob(F-statistic)0.000002结果拟和优度略微下降,而 MEAT 的 T 值依然不显著。因 为住房属于大值商品,人均收入的大小对人均住房的大小有很强的决定作用,所以两者之间存在很强的线性关系,而家庭财富对消费有着影响,不能简单的去掉人均住房面积,我们决定用耐用消费品每百人电视拥有量(TV)替代人均住房面积 HOUSE。同时,用求实人均收入(RINCOME)替代人均收入( INCOME)以避免人均收入与食品指数之间的线性相关。年份人均每年可支配收入(INCOME )元物价指数(90 年为基期)实际收入(RI
18、NCOME)1990 1498.3711498.371991 1714.491.054081626.5271992 2002.971.192081680.2311993 2428.461.411451720.5431994 3312.541.9350191711.891995 4004.792.3916981674.4551996 4426.212.5974241704.07719974787.862.6909351779.25519985159.972.580631999.5199955102.467082233.4120005925.592.336262536.35720016406.56
19、2.4017182667.491求实人均收入= 人均收入/物价指数。其中物价指数是以 90 年为基期,这样便于比较。年份每百人拥有电(TV)199014.69199116.72199218.03199319.75199422.09199523.88199624.17199725.37199826.69199926.82200027.26200127.87再对模型进行估计得:Dependent Variable: ENMethod: Least SquaresDate: 12/19/04 Time: 16:06Sample: 1990 2001Included observations: 12V
20、ariableCoefficientStd. Errort-StatisticProb. C56.578898.2103166.8911950.0001RINCOME-0.0076500.001684-4.5426230.0019MEAT53.1052524.728712.1475140.0640TV-0.3259960.109371-2.9806480.0176R-squared0.969316 Mean dependent var48.81583Adjusted R-squared0.957809 S.D. dependent var4.871351S.E. of regression1.
21、000593 Akaike info criterion3.100263Sum squared resid8.009483 Schwarz criterion3.261899Log likelihood-14.60158 F-statistic84.24055Durbin-Watson stat2.531862 Prob(F-statistic)0.000002从结果看可决系数为:0.969316,拟和优度很好,F 值 84.24055,在5%显 著水平下查 F 分布表 F(3,8)=4.07,84.240554.07,拒绝原假设,即变量整体对恩格尔系数有显著影响。再看各变量 T 值检验:在给
22、定显著性水平 5%下,查 T 分布表自由度 N-2=10 的临界值为 2.128,各变量系数分别为 6.89、-4.54、2.15、-2.98,绝对值均大于 2.128,拒绝原假设,即各变量对恩格尔系数均有显著影响。(2)异方差检验ARCH Test:F-statistic1.212419 Probability0.395692Obs*R-squared3.790013 Probability0.285050Test Equation:Dependent Variable: RESID Method: Least SquaresDate: 12/19/04 Time: 20:13Sample(
23、adjusted): 1993 2001Included observations: 9 after adjusting endpointsVariableCoefficientStd. Errort-StatisticProb. C0.8313670.3040172.7346030.0411RESID (-1)-0.3144020.325895-0.9647350.3790RESID (-2)-0.0546350.180230-0.3031400.7740RESID (-3)-0.3099080.181549-1.7070180.1485R-squared0.421113 Mean depe
24、ndent var0.352557Adjusted R-squared0.073780 S.D. dependent var0.489584S.E. of regression0.471178 Akaike info criterion1.633939Sum squared resid1.110042 Schwarz criterion1.721594Log likelihood-3.352725 F-statistic1.212419Durbin-Watson stat1.967502 Prob(F-statistic)0.395692从结果得 obs*R-squard=3.790013,又
25、临界值为 7.81,故接受原假设,表明模型随机误差项不存在异方差。(3)自相关检验A、检验模型 DW 值为 2.531862 给定显著性水平 0.05,查 Durbin-Watson表,n=12,k(解释变量个数) =3,得下界临界值 dl=0.658,上界临界值 du=1.864,因 为 DW 统计量为 2.531862 大于 4-du=2.136,小于 4-dl=3.342,落入了不能判定区域。B 、自相关的修正Cochrane-Orcutt 迭代法Dependent Variable: ENMethod: Least SquaresDate: 12/20/04 Time: 13:26Sa
26、mple(adjusted): 1991 2001Included observations: 11 after adjusting endpointsConvergence achieved after 5 iterationsVariableCoefficientStd. Errort-StatisticProb. C36.820688.8148754.1771080.0058RINCOME-0.0054290.001309-4.1472700.0060TV-0.3156580.064231-4.9144430.0027MEAT109.718425.045834.3807070.0047A
27、R(1)-0.5656980.235750-2.3995640.0533R-squared0.982333 Mean dependent var48.36273Adjusted R-squared0.970556 S.D. dependent var4.836635S.E. of regression0.829933 Akaike info criterion2.768012Sum squared resid4.132733 Schwarz criterion2.948873Log likelihood-10.22406 F-statistic83.40644Durbin-Watson sta
28、t2.382750 Prob(F-statistic)0.000022Inverted AR Roots -.57从结果看到:此时 DW=2.38275 依然不能判断,但比 2.531862 已有明显改善。拟和优度 0.982333 比之前的 0.969316 也有了较大改善。再使用广义差分法进行修正得: Dependent Variable: DENMethod: Least SquaresDate: 12/20/04 Time: 16:50Sample(adjusted): 1991 2001Included observations: 11 after adjusting endpoin
29、tsVariableCoefficientStd. Errort-StatisticProb. C50.9554214.257853.5738500.0091DTV-0.3890900.214141-1.8169860.1121DRINCOME-0.0086820.002416-3.5937980.0088DMEAT18.5573350.311560.3688480.7231R-squared0.936814 Mean dependent var35.17505Adjusted R-squared0.909734 S.D. dependent var3.789705S.E. of regres
30、sion1.138593 Akaike info criterion3.372751Sum squared resid9.074752 Schwarz criterion3.517440Log likelihood-14.55013 F-statistic34.59441Durbin-Watson stat2.239029 Prob(F-statistic)0.000144此时 DW=2.239029,虽依然无法判定是否存在自相关,但比2.382750 又更接近 4-du=2.136。接下来我们 使用对数变换,对数变换同时考虑 Cochrane-Orcutt 迭代的方法进行修正,依然重复上述结
31、果:更加接近,更加接近出现这种结果可能是由于样本容量太少。因为同样在 0.05 显著性水平和 3 个解释变量条件下,当样本容量由 12上升至 16 后,du 值由 1.864 变为 1.728,相应的 4-du 的值由 2.136 变为 2.272,修正后的 DW=2.239029 即落入不拒绝区域,则不存在自相关。四 结论及经济意义说明1 结论经过一番的检验修正,最后得出模型如下:EN = 56.5788879 - 0.007650222687*R + 53.10525244*M - 0.3259961383*TV(8.210316) (0.001684) (24.72871) (0.109
32、371)T= (6.891195) (-4.542623) (2.147514) (-2.980648) R =0.969316 , F=84.24055 , (R= RINCOME M=MEAT)2 经济意义说明求实人均收入(RINCOME )=人均可支配收入 /物价指数,代表着收入与物价对人民生活水平的共同影响,它与恩格尔系数负相关。实际收入越高消费指出越多元化,恩格尔系数下降。肉禽支出占食品支出的比例(MEAT)代表着人们食品选折空间的增大,食品 结构的多元化,它与恩格尔系数正相关。因为食品结构的多元化必然导致人们食品消费的增大。每百人拥有电视数量(TV)代表人 们家庭财富的增加,电视冰
33、箱洗衣机空调等耐用消费品的满足使得人们更注重生活享受、注重营养健康,从而减小恩格尔系数。从该模型的检验过程来看,设立模型时考虑的各个因素得到了一一映证,收入、家庭财富、食品结构确实对恩格尔系数有着重要影响。我们的认识和经济预期:经过我们对成都市恩格尔系数的影响因素分析,我们不难看出:虽然我们讨论的是城镇的恩格尔系数,可是恩格尔系数本身跟食品消费密切相关,而食品消费又受到食品工业的发展状况和农村经济的严重制约,这就意味着我们的讨论还必须跟食品工业和农村经济挂钩。首先, 食品在整个消 费品支出中的所占比重即”恩格尔系数”逐渐降低。但我国城镇居民的食品消费总量却呈上升趋势,在食品消费比重持续下降的同
34、时,城镇居民中,吃好、吃精、注重营养、追求方便的倾向越来越明显,食品消费不断由吃饱向吃好转变。基于以上认识,从食品工业的市场前景来看,食品工业极具发展潜力和极为广阔的市场前景没有根本性的改变。未来的工业生产仍将保持快速稳定增长。在生产和供应结构上,基于消费结构的变化趋势以及生产、供应结构与消费结构相适应的要求,食品工业的生产和供应结构将会发生大的改变,其未来发展趋势应该是:资源加工和综合利用程度将会显著提高,区域资源和生产结构的差异性、集中度和规模效益将显著提高,食品新资源、新产品、新技术将得到更快速的开发和应用。其次, 国内外的经验 都表明,尽管随着消费结构中恩格尔系数的下降,从最终需求来看
35、,对农产品的需求弹性是趋于下降的,但是对农产品的中间需求,也就是对加工制成食品的需求则是不断扩大的。农产品加工业作为农业的后向产业,直接关系到农产品中间需求的扩张。因此我们的启示是:在当前调整优化农业结构中,农产品加工业是一个非常重要的领域,积极发展农产品加工业具有重要的现实意义。农产品加工业的发展对于提高我国农业的整体水平和竞争力有十分重要的战略意义 五 存在的问题与不足一、收集的样本太少,我们查阅四川统计年鉴,在 90 年以前相应的数据有着明显的缺损与不同,如:90 年以后的食品支出是用货币衡量的,而 90 年以前的支出使用的是公斤,导致样本的不足。二、从前面的检验可以知道,我们的数据并不
36、平稳,也就是说,我们的对参数的检验、预测等是建立在假设数据的平稳上的,显然这是我们模型的一个很大的不足。很遗憾的是以我们现在的知识无法解决这个问题。三、由于经济行为的滞后性和某些解释变量没有被我们考虑进来,我们的模型还存在一定的自相关。经过不断的修改已经得到了一些改善,可是还是没有通过自相关检验,我们将继续对这个问题进行研究。四、我们知道, 现在离恩格尔系数提出时已有 140 多年了, 食物支出在消费结构中的意义远没有恩格尔时代重要。其他消费如穿、住、行、用, 特别是耐用消费品如汽车、住房的意义越来越显得重要。而且, 恩格尔系数之所以降低, 也是因为购买食物的负荷率降低的结果: 食物的相对价格
37、低廉化。而且,中国的特殊情况也使恩格尔系数失去实际意义。以食物支出的比率来统一衡量生活水平, 现在已有失客观。因为, 社会对每个家庭、每个阶层的吃没有统一标准, 食物支出的弹性很大, 贫富和个性化的差异性很大。佳肴美馍的享用和粗菜淡饭的充饥, 是大不一样的。更何况各个家庭重吃或重穿、重住、重教、重用的风格习性各异, 个性化越来越突出。许多低收入家庭都舍不得吃, 吃的很差, 尽量从牙缝里挤出点钱来派其他用场。低收入家庭的恩格尔系数甚至比中等收入家庭还低。譬如, 厦门大学校园里有来自四川、重庆的数百名民工, 他 们月基本工资 500 元, 每月自炊只花 150 元伙食费 , 恩格30%系数比城镇恩格尔系数 (2000 年是 37。1%) 还低。他们的伙食标准主要是填饱肚子。伙食品质优劣没个标准。