1、数据处理:4.3 模型建立设年末实有耕地面积,有效灌溉率,农用塑料薄膜使用量,农药使用量,农业机械总动力,农业从业人数,农业投资额分别为 ;农业产值为 。127,X Y在此我们假设上述七个变量都与农业产值有显著影响,在 SPSS 中用进入法对其做出预判。表 4-3 回归预判表非标准化系数 标准化系数 共线性统计模型 B标准误差 BatT显著性 允差 VIF(常数) 1.987E-15 .018 .000 1.000年末实有耕地面积 .225 .291 .225 .775 .464 .004 239.655有效灌溉率 .208 .116 .208 1.797 .115 .026 38.086农用
2、塑料薄膜使用量 -.396 .489 -.396 -.810 .445 .001 677.462农药使用量 -.426 .564 -.426 -.756 .475 .001 899.494农业机械总动力 .831 .282 .831 2.946 .022 .004 225.582农业从业人数 .024 .179 .024 .136 .895 .011 90.381农业投资额 .197 .140 .197 1.401 .204 .018 55.747因变量: 农业产值可以从表中得出回归方程: 12345670.25.08.960.2.8310.24.19YXXXX从显著性水平上看,小于 0.05
3、 的只有一个农业机械动力,显然不能够准确的表达出与农业产值之间的关系。根据表中的 值均大于 ,其中四个大于VIF了 100,这说明模型中存在严重的多重共线性。并且在相关系数表中(附表 1-2) ,我们也能够看出各个自变量之间相关系数较大,有较大的相关性。为了保证得到的回归模型能较好的反映真实意义,就要解决多重共线性问题。解决多重共线性我们一般使用逐步回归的方法。4.3.1 逐步回归将标准化后的数据输入 EVIEWS,首先找出与因变量拟合度最高自变量,的经过回归拟合可以得出 7 个变量的拟合优度,按降序排列如下表:表 4-4 拟合优度表变量 拟合优度5X0.98432530.97227240.9
4、720241X0.90698770.90303320.845016X0.684597拟合优度的大小也能在一定程度上表现出自变量与因变量的影响大小。这里 是农业机械总动力,说明农业机械总动力对农业产值有较大的影响。在近5X年来江苏省整体经济发展迅速,科技水平大大提高,使农业的机械化水平发展迅速,机械设备的使用极大促进了农业产值的提高。由表 得, 与 的拟合优度最高,故 作为基本方程。依次按拟4Y5XY5X合优度降序排列进入模型,检验新进入的变量是否显著并且拟合优度是否提高。拟合优度排第二的是变量 ,所以将 进入基础模型。33进入基本方程,结果如下图:3X图 4-1 变量判断图从图 的运行结果我们
5、可以看出, 的估计量对应的 大于413X0.894p,不显著,所以 不符合回归模型。 是农膜使用量,可以看出其对农0.53X3X业产值的影响不显著。农膜主要使用在经济作物的种植中,近年来有部分农户利用地膜覆盖技术和塑料大棚进行种植、栽培瓜果蔬菜,获得了可观的收益,但是普及率不是很高,是一个对农业产值的影响不是很大。所以我们不选择变量 ,再将 进入基本方程。3X4图 4-2 第一步逐步回归图由图 可以看出, 的估计量对应的 值大于 ,所以没有424X0.854p0.5显著性,所以 同样不符合回归模型,故删去变量 。 为农药使用量,所X以农药使用量对农业产值没有显著影响。再将 依次进入方程判断最优
6、拟合方程, , 不显著,1726,X 16显著, 也是具有显著性的,表明农业投资额,有效灌溉率对农业产值也7有显著影响,但是农业投资额对农业产值的影响大还是有效灌溉率对农业产值的影响大,还需要进一步比较。表 4-5 拟合优度表变量 系数 标准差 t 值 p 值 拟合优度常数 -1.57E-07 0.022013 -7.11E-06 1.00005X0.76519 0.057883 13.21969 0.00001 70.246876 0.057883 4.26518 0.00110.9937700常数 8.13E-10 0.03293 2.47E-08 1.00002X0.999922 0.0
7、818 1.221544 0.24532 50.901298 0.0818 11.01832 0.00000.986058由表 可得,但由于模型 的拟合优度为 0.993770,模型45Y5X7 Y2X的拟合优度为 0.986058,比较他们两个的拟合优度,发现模型 的拟5X 57合优度较大,故选则 作为基本方程。然后按照第一次逐步回归法的步57骤依次添加变量,并根据 值判断其显著性。p可以得出 为最终方程, 值分别为 , ,Y5X72p20.1720.p,均显著。经过逐步回归依次得到农业机械总动力,农业投资额,20.1p有效灌溉率对农业产值的影响较为显著。估计结果如下图:图 4-3 逐步回归
8、模型结果图从图 中可以得出系数:43,702571.59,0.194,0.2638,0.2638所以写出对应的估计方程为:。7257.1.YXX得出估计方程还要进行各项检验,只有通过检验才能说明我们得到的方程有效,才具有实际意义。4.3.2 F检验检验的原假设和备择假设如下:;01:0nH不全为零。1(,)i从图 中可以看出 检验 对应的 值小于 ,所以拒绝 ,43F-staicp.050H所以我们得出的估计方程存在显著的线性关系。4.3.3 t检验检验的原假设和备择假设为:;0:iH。1:0iH由图 可以看出变量 分别对应的 , ,432X572.107p2.0p均小于 ,拒绝原假设 。20
9、.1p0. 0同样可以看模型得出的 值, ,通t2573.6,.83,5.9tt过查找 分布表得,用 值与 进行比较,如果 ,则拒t 0.5(1) 0.2(1)i绝原假设所以回归系数显著。变量 对 有显著影响。X72Y4.3.4 异方差检验由于异方差的存在使得最小二乘估计量不再是最好线性无偏估计量,会导致模型的残差不再是同方差的,所以要对模型进行异方差检验。(1)图示法此方法是较为原始的一种检验异方差的方法,可以直观的看出残差平方的散点图是否与样本数据 或 有明显的关系,若随着 或 的变化而变化,那iXiYiXiY么就说明存在异方差性。这里我们可以看出残差平方的散点图呈不规则状,散乱分布,所以
10、我们得出的回归模型不存在异方差性。图 4-4 异方差散点图(2)怀特( )检验white可以看出模型中有三个解释变量,那么模型辅助回归可以写成: 22012341563712813923tttttttttttuxxxxx其原假设和备择假设分别为:, ;0:iH,9i中至少一个不为零。19,怀特检验的运行图如下:图 4-5 怀特检验图给定显著性水平 , 对应的 大于 , (错了0.5obs*R-quared0.587p.05要改正) )拒绝原假设,故不存在异方差。4.3.5 自相关检验误差存在自相关时,模型中的系数用最小二乘估计计算会不准确,往往会算出的系数的真实方差值和误差项的方差值会偏小。为
11、了检验得到的方程的准确性,我们进行自相关检验。检验的原假设和备择假设分别为:DW( 不存在自相关)0:Htu( 存在一阶自相关)1表 4-6 DW 检验运行结果图从表中得出, 值为 1.964452,通过查找 表可得,当 时,DWDWn=15,k3, ,所以 值在区间(1.75,2.25 )之间。这说明所建立的0.82Ld1.75U线性回归模型无自相关现象,不需要修正 值检验。4.3.6 残差检验图 4-7 残差分析图由于 对应的 大于 ,所以拒绝原假设。从残差分析图上也JB0.7684p0.5可以直观的看出残差直方图中间高,两边低,基本服从正态分布。所以我们估计的线性回归模型是有意义的。4.3.7 组内预测对样本内数据进行组内预测:图 4-8 组内预测图由图 可知,预测值和真实值几乎完全重合,且残差在零水平线上下波动,4-8说明模型总体上效果较好。