1、线性回归模型的应用一、数据来源与处理 数据均来源于中华人民共和国国家统计局网站公布的2008 年中国统计年鉴 。选取1999 年至 2007 年的相关数据,其中人均消费支出、人均年总收入、政府对农业的投入均采用当年年末新增值;商品零售价格指数、恩格尔系数均采用原值; 为避免数据本身过小造成误差增大,用年末累计参加农村养老保险人数除以当年农村人口数后,再乘以一千。利用SPSS16.0 软件进行数据统计处理。 二、模型变量的选择和说明 被解释变量:农村居民人均消费支出 (E); 解释变量:人均年总收入 (Y)、政府对农业的投入(C) 、商品零售价格指数(P)、农村恩格尔系数(D)、参加养老保险人数
2、占农村总人口的千分比(I)。 采用以下函数表达式表示各解释变量与被解释变量的关系:E=F(Y,C,P,D,I) 经简单测算和经验分析,发现农村居民人均消费支出除了与传统的人均年总收入成一元线性相关外,政府对农业的投入影响农民人均收入水平、商品零售价格指数影响消费者价格心理、农村恩格尔系数影响农村消费者消费行为、参加养老保险人数占农村总人口的千分比影响农村及其购买能力,这些因素在单独情况下,均与人均消费支出成一元线性相关。因此,猜想以上各被解释变量在综合作用情况下与解释变量成多元线性线性相关是完全可行、合理的。 三、线性回归模型形成的步骤 (1)相关性分析。线性回归方程拟引入一个因变量,即人均消
3、费 ;五个自变量,即人均收入、政府投入、CPI、农村恩格尔系数和养老保险投保率。经计算得加权平均值及方差如表 1。由表 2 看出,人均消费与五个因变量相关性均较大。其中,人均收入与人均消费相关性高达99%,政府投入次之,达 98.4%,恩格尔系数与 CPI 与人均消费的相关性分别达 83%和 80.6%,远高于养老保险参保率的 47.8%。结果验证了凯恩斯的消费函数观点,自变量农村人均收入与因变量人均消费的相关性非常强,两者相关性散点如图 1。在进行线性回归分析时采用的方法为全部引入 Enter 法。虽然只有养老保险参保率与因变量的相关性最低,但为全面考虑,不将其从回归方程中剔除,如表 3。表
4、 4 说明,相关系数 R=1,判定系数 R2=1,调整后的判定系数仍高达 0.99,回归估计的标准误差S=18.56672。说明回归效果一般。由表 5 看出,统计量 F=1.533 E3,相伴概率值 p0.001。说明多个自变量与因变量人均消费之间存在着线性回归关系。另外,Sum of Squares 一栏中分别代表回归平方和 2641696.843、残差平方和 1034.170 以及总平方和 2642731.013,df 为自由度。表 7 列出了人均消费的预测值、标准预测值、预测值标准差等指标的最小值、最大值、平均值、方差和个案数。 (3)多元线性回归的检验。拟合优度检验。测定多元线性回归的
5、拟合程度,使用多重相关系数 R2 ,它表示因变量与所有自变量全体之间线性相关程度,实际反映的是样本数据与预测数据间的相关程度。由表 4 可以看出 R2=1,说明回归平面拟合程度最高。 回归方程的显著性检验又称 F 检验,它利用方差分析的方法进行,是平均的回归平方和与平均的残差平方和之比。F 统计量服从第一自由度为 k、第二自由度为 n-k-1 的 F 分布。由表 5 看出,F 值为 1.533E3,数值较大,说明自变量造成的因变量的变动远远大于随即因素对因变量造成的影响,F 统计量较为显著,回归方程的拟合优度也较高。 回归系数的显著性检验,又称 t 检验。t 检验是检验各自变量对因变量的影响是
6、否显著 ,从而找出那些自变量对因变量的影响哪些是重要的,哪些是不重要的。由表 6 可以看出各变量的 t 值。其中,人均收入 t 值为 14.296,政府投入为 1.798,CPI 为-1.626, 恩格尔系数为-0.094,养老保险投保率为 0.156,其他因素为 1.218。四、总结从模型中可以看出,农村商品零售价格指数对农村人均消费的影响最大,其次是农村人均收入,紧随其后的是农村养老保险参保率和农村居民家庭恩格尔系数,最后是政府财政对农业的投入。值得思考的是:第一 ,尽管 2008 年以来推广的家电下乡等在一定程度上降低了农村零售商品价格,但价格改革的继续深化、工农业商品比价的合理调整仍有
7、很大的空间。农村消费决策的制定受价格因素的影响较大,商品的价格弹性和物美价廉的心理比城镇强烈。第二,2007 年城镇人均年总收入达人民币 14908.6 元,是农村同期数据的 2.57 倍,其中农村人均年总收入比城镇低收入户的人均年总收入还要低 1201.5 元。城乡收入差距的不断扩大使得城乡消费水平差距越拉越远,农民增收问题任重而道远。第三,2004 年以来,农村养老保险发展逐渐好转,但每年增速仅为 1%3%,2007 年甚至出现 2%的负增长,说明农村养老保险在我国的开展仍处于初级阶段。养老保险能为农民负担沉重的养老和医疗负担,减少后顾之忧,敢于在现期消费,降低农村养老保险投保的门槛,提高农村养老保险的普及率应是今后政府工作的重点。第四,自 2001 年以来,农村居民家庭恩格尔系数每隔一年就有 1%2%的小幅下降或上升,农村居民家庭恩格尔系数与城镇居民家庭恩格尔系数的比值一直保持在 1.25 左右,可以看出我国农民生活中食品支出比重过大,农村生活现代化程度还比较低。恩格尔系数过高也反映了农民收入的偏低,说明提高农民收入是解决这一问题的根本办法。第五,政府财政对农业的投入虽在一定程度上带动了农村的人均消费,但其作用没有前四个因素显著。如何使财政投入转化为农民真正可以自由支配的收入,应是今后政府努力思考的问题。