1、贵州民族大学实用回归分析论文(GuizhouMinzu University)论文题目:影响谷物的因素分析年级:2014 级班级:应用统计班小组成员:姓名:黄邦秀 学号:201410100318 序号:4姓名:王远 学号:201410100314 序号:26姓名:陈江倩 学号:201410100326 序号:11姓名:吴堂礼 学号:时间:2016.12.06目录摘要: .3关键词: .3一、问题的提出 .4二、多元线性回归模型的基假设 .4三、收集整理统计数据 .53.1 数据的收集 .53.2 确定理论回归模型的数学形式 .6四、模型参数的估计、模型的检验与修改 64.1 SPSS 软件运用
2、 .64.2 用 SPSS 软件,得到相关系数矩阵表 .84.3 回归方程的显著性检验 94.4 利用逐步回归法进行修正 .104.5 DW 检验法 11五、结果分析 .12六、建议 .12七、参考文献 .13影响谷物的因素分析摘要:在实际问题的研究中,经常需要研究某一些现象与影响它的某一最主要因素的关系,如影响谷物产量的因素非常多。本文采用多元线性回归分析方法,以 19942014年中国谷物产量及其重要因素的时间序列数据为样本,对影响中国谷物生产的多种因素进行了分析。分析结果表明,近年来我国谷物生产主要受到单产提高缓慢、播种面积波动大、农业基础设施投入不足、自然灾害频繁等重要因素的影响。为提
3、高谷物产量、促进谷物生产,首先应该提供一套促进谷物生产的政策措施,提高谷物种植效益,增加谷物收入是根本。在这个前提下,才有可能提高单产、稳定面积、加强基础设施建设、提高抗灾能力,增强我国谷物生产能力和生产稳定性。关键词:谷物产量 影响因素 多元线性回归分析一、问题的提出我国土地资源稀缺,人口多而粮食需求量大,因此粮食产量的稳定增长,直接影响着人民生活和社会的稳定与发展。粮食生产的不稳定性对国民经济的影响是不可忽略的,主要体现在:粮食生产不稳定会引发粮食供求关系的变动,尤其当国家粮食储备不足的时候,很容易导致粮价上涨 ,从而影响整个宏观经济。因此, 对关系国计民生的这个特殊农产品,我们不得不慎重
4、对待。因此,分析粮食产量波动的原因,并据此提出相应的对策,对保障粮食生产持续稳定发展,具有重要意义。二、多元线性回归模型的基假设(1)解释变量 x1,x2,x3,xp是确定性变量,不是随机变量,且要求 rank(k)=p+1n,表明设计矩阵 X中的自变量列之间不相关,样本量的个数大于解释变量的个数,X 是一满秩矩阵。(2)随机误差项具有零均值和等方差,即: njiEjii .,21,0),cov(,2这个假定常称为高斯-马尔柯夫条件。 ,即,假设观测值没有系统误差,i随机误差项 的平均值为零。随机误差项 的协方差为零,表明随机误差项在ii不同的样本之间是不相关的(在正态假定下即为独立的) ,不
5、存在序列相关,并且有相关的精度。(3)正态分布的假定条件为: 相 互 独 立 , n21i,n1i0 N对于多元线性回归的矩阵模式 ,这个条件便可表示为:Xyn2,0I由上述假定和多元正态分布的性质可知,随机向量 y 服从 n 维正态分布,回归模型 的期望向量XyXEyn2varI因此 n2,yIXN三、收集整理统计数据3.1 数据的收集选用了谷物产量 y(万吨) 、谷物零售价格指数 x1、受灾面积 x2(万公顷) ,化肥施用量 x3(万吨) ,乡村农林牧渔业从业人员数 x4(万人) ,谷物作物播种面积 x5(千公顷) ,农用机械总动力 x6(万千瓦) ,农村用电量 x7(亿千瓦) ,把这 7
6、 个指标的 19942014 年 21 年间的时间序列数据进行回归分析 ,来分析这些因素与谷物产量的关系。以谷物产量作为因变量, 其它 7 个指标作为解释变量进行回归分析。表 1-1 1994-2014 年度谷物产量影响因素表谷物产量(万吨)y价格指数x1受灾面积(万公顷)x2化肥施用量(万吨)x3乡村农林牧渔业从业人员数(万人)x4谷物作物播种面积(千公顷)x5农用机械总动力(万千瓦)x6农村用电量(亿千瓦 时)x71994 35450 110.2 3313.3 1513.4 31152.7 113462 16614.2 396.91995 38727.5 99.9 3471.3 1659.
7、8 31645.1 114047 19497.2 435.21996 40730.5 99.8 3188.7 1739.8 31685 112884 20912.5 4641997 37910.8 110.9 4436.5 1775.8 30351.5 108845 22950 508.91998 39151.2 109.3 4713.5 1930.6 30467.9 110933 24836 586.71999 40473.3 106.2 4208.6 1999.3 30870 111268 26575 658.82000 39408 114.1 5087.4 2141.5 31455.7
8、110123 28067 7122001 40754.9 121.3 4699.1 2357.1 32440.5 112205 28707 790.52002 44624.3 95.2 3847.4 2590.3 33336.4 113466 29388 884.52003 43529.3 108.6 5547.2 2805.1 34186.3 112314 30308.4 963.22004 44265.8 124.3 5133.3 2930.2 34037 110560 31816.6 1106.92005 45648.8 127.7 4882.9 3151.9 33258.2 11050
9、9 33802.5 1244.92006 44510.1 148.7 5504.3 3317.9 32690.3 109544 36118.1 1473.92007 46661.8 134.4 4582.1 3593.7 32334.5 110060 38546.9 1655.72008 50453.5 107.5 4698.9 3827.9 32260.4 112548 42015.6 1812.72009 49417.1 92.1 5342.9 3980.7 32677.9 112912 45207.7 1980.12010 51229.5 96.9 5014.5 4083.7 32626
10、.4 113787 48996.1 2042.22011 50838.6 96.4 4998.1 4124.3 32911.8 113161 52573.6 2173.22012 46217.5 90.1 5468.8 4146.4 32797.5 108463 55172.1 2421.3注:数据来源相应年度的中国统计年鉴 、 中国农村统计年鉴 、 中国农业发展报告 、 中华人民共和国年鉴 、 中国统计摘要3.2 确定理论回归模型的数学形式通过对中国谷物生产及影响因素的初步定性分析后假设,谷物产量与其它 7个指标之间存在多元线性关系,即谷物零售价格指数、受灾面积,化肥施用量,乡村农林牧渔业从
11、业人员数,谷物作物播种面积,农用机械总动力,农村用电量之间存在着线性关系,也即可以把谷物产量的线性回归模型初步设定为: 765321430 xxxxy 其中,y:谷物产量, x1 谷物零售价格指数、x2 受灾面积,x3 化肥施用量,x4乡村农林牧渔业从业人员数,x5 谷物作物播种面积, x6 农用机械总动力,x7 农村用电量,然后利用已有的数据进行模型拟合,以便发现这些因素之间存在的数量关系。可能有人会提出质疑,是否遗漏了其它重要的解释变量 ,的确像农业科技费用等这些因素对谷物产量有重要的影响,但考虑农业科技费用会导致严重的多重共线性(因为它们与谷物单产有极高的正相关性),又考虑到它代表对农业
12、的投入和科技进步,在选用指标中已有灌溉面积、农机总动力等性质相似的指标, 再加上分析工具的局限性,因此就舍弃了这几个指标。这也是线性相关分析的局限性之一四、模型参数的估计、模型的检验与修改4.1 SPSS 软件运用将收集到的数据运用 SPSS 软件进行运算,可以得到以上模型设定的参数估计值,结果如下表表 4-1 系数 a非标准化系数 标准系数模型 B 标准 误差 试用版 t Sig.(常量) 37259.895 24839.352 1.500 .157x1 -29.854 24.382 -.099 -1.224 .243x2 -1.606 .581 -.251 -2.765 .016x3 12
13、.870 2.025 2.843 6.354 .000x4 -.433 .291 -.100 -1.490 .160x5 .043 .188 .025 .228 .8231x6 .136 .147 .400 .926 .3712013 45263.7 101.5 5221.5 4253.8 32451 106080 57929.9 2610.82014 45705.8 98.6 4711.9 4339.4 31990.6 103891 60386.5 2993.4x7 -12.366 3.115 -2.192 -3.970 .002a. 因变量: y表 4-2 模型汇总 b模型 R R 方 调
14、整 R 方 标准 估计的误差 Durbin-Watson1 .987a .974 .960 906.04373 2.031a. 预测变量: (常量 ), x7, x1, x4, x2, x5, x6, x3。b. 因变量: y由表 4-2 得 所以回归方程拟合较好0.9742R表 4-3 Anovab模型 平方和 df 均方 F Sig.回归 3.953E8 7 5.647E7 68.795 .000a残差 1.067E7 13 820915.2401总计 4.060E8 20a. 预测变量: (常量 ), x7, x1, x4, x2, x5, x6, x3。b. 因变量: y由上表 4-1
15、 和表 4-2 数据可得所求回归方程 736.12.05430387.1260.854.29.375 xxxx , , ,0.2R.DW9.6F4.2 用 SPSS 软件,得到相关系数矩阵表由相关系数矩阵表得如下矩阵:相关矩阵 10.9.531-0.72.960.573.24-0.78 .061 53-.-8-.-1- .72.95 960.385-0.20.6.-0.86 .14.4.142 3-.-.95-.81.- .780.-.42.9-R从相关矩阵看出,y 与 x1,x2,x3,x4,x5,x6,x7 的相关系数 偏小,ryP 值 =0.232; 偏小,P 值=0.006; ,P 值
16、=0.000;5.ry2.8r3y偏小,P 值=0.002 ; 偏小 P 值=0.481 ; 偏小,P0.59ry4 -0.1ry5 -0.78ry6值=0.000; 偏小,P 值=0.000。x1 谷物零售价格指数、x2 受灾面积,.780ryx3 化肥施用量,x4 乡村农林牧渔业从业人员数, x5 谷物作物播种面积,x6 农用机械总动力,x7 农村用电量,说明 x1 谷物零售价格指数、 x2 受灾面积,x3化肥施用量,x4 乡村农林牧渔业从业人员数, x5 谷物作物播种面积,x6 农用机械总动力,x7 农村用电量对谷物产量无显著影响。自变量之间可能存在多重共线性,SPSS 软件同时可以计算
17、出相关系数显著性单侧和双侧检验的 P 值。4.3 回归方程的显著性检验F 检验表 4-4 Anovab模型 平方和 df 均方 F Sig.回归 3.953E8 7 5.647E7 68.795 .000a残差 1.067E7 13 820915.2401总计 4.060E8 20a. 预测变量: (常量 ), x7, x1, x4, x2, x5, x6, x3。b. 因变量: y,拒绝原假设,即作出 7 个自变量整体对因变量 y 显著影响05Px1 对应的 t,对应的 ;x2 对应的 t,对应-1.24t值 05243p值 -2.765t值的 ;x3 对应的 t,对应的 ;x4 对应05.
18、6p值 6t值 0.p值的 t,对应的 ;x5 对应的 t,对应的-9t值 10值 8t值;x6 对应的 t,对应的 ;x7 对应的823值 92t值 5371值t,对应的 ,所以 x1、x4、x5、x6 对 y 没有显著影-70t值 5p值响,只有 x2、x3、x7 通过系数的显著性检验。回归系数没有通过显著性检验的,将用逐步回归法重新建立回归方程。4.4 利用逐步回归法进行修正4-5 模型汇总模型 R R 方 调整 R 方 标准 估计的误差1 .896a .803 .793 2050.323522 .966b .934 .927 1220.785253 .974c .949 .940 11
19、03.98755a. 预测变量: (常量 ), x3。b. 预测变量: (常量), x3, x5。c. 预测变量: (常量), x3, x5, x7。4-6 Anovad模型 平方和 df 均方 F Sig.回归 3.261E8 1 3.261E8 77.577 .000a残差 7.987E7 19 4203826.5321总计 4.060E8 20回归 3.792E8 2 1.896E8 127.210 .000b残差 2.683E7 18 1490316.6272总计 4.060E8 20回归 3.853E8 3 1.284E8 105.371 .000c残差 2.072E7 17 121
20、8788.5163总计 4.060E8 20a. 预测变量: (常量 ), x3。b. 预测变量: (常量), x3, x5。c. 预测变量: (常量), x3, x5, x7。d. 因变量: y4-7 系数 a非标准化系数 标准系数模型 B 标准 误差 试用版 t Sig.(常量) 31827.796 1437.037 22.148 .0001x3 4.057 .461 .896 8.808 .000(常量) -45087.994 12920.482 -3.490 .003x3 4.738 .297 1.047 15.950 .0002x5 .675 .113 .392 5.966 .000
21、(常量) -25062.601 14716.130 -1.703 .107x3 7.331 1.189 1.620 6.165 .000x5 .468 .138 .272 3.401 .0033x7 -3.613 1.614 -.641 -2.238 .039a. 因变量: y从表 输出结果看到,逐步回归的最优子集为模型 3,回归方程为: 7613.548.01.760.25 xx由回归方程可以看出,对谷物产量有显著性影响的是 x3 化肥施用量、 x5 谷物作物播种面积、x7 农村用电量,回归方程中 2 个自变量的系数为正、1 个系数为负,即化肥施用量和谷物作物播种面积越大,每万吨谷物产量越大
22、;农村用电量越大,每万吨谷物产量越小。具体说,在 x5、x7 保持不变时,x3 每增加一个百分点,每万吨谷物产量平均增加 7.331 万吨,在 x3、x7 保持不变时,x5 每增加一个百分点,每万吨谷物产量平均增加 0.468 万吨,在 x3、x5 保持不变时,x7 每增加一个百分点,每万吨谷物产量平均减少 3.613 万吨。4.5 DW 检验法4-8 残差统计量 a极小值 极大值 均值 标准 偏差 N预测值 37091.8359 50786.3945 43855.8095 4389.04304 21残差 -2284.96460 1848.82971 .00000 1017.82623 21标
23、准 预测值 -1.541 1.579 .000 1.000 21标准 残差 -2.070 1.675 .000 .922 21a. 因变量: y模型汇总 d更改统计量模型 R 方更改 F 更改 df1 df2 Sig. F 更改 Durbin-Watson1 .803 77.577 1 19 .0002 .131 35.594 1 18 .0003 .015 5.010 1 17 .039 1.995d. 因变量: y由上表 4-2 可得,DW=1.995, , ,96.1,83.0ULd04.2Ud, ,所以误差项之间不存在自相关。17.34LdUUdDW4五、结果分析我们进行了一系列的检验
24、和修正后的结果如下: 7613.548.031.760.25 xxy,DW=1.995,.R.F从模型中可以看出:1、 x1、x2、x4、x6 不符合经济意义的检验,因为在实际上,谷物产量是随着x1 谷物零售价格指数的增长而增加;谷物产量是随着 x2 受灾面积增广而减少,谷物产量是随着 x4 乡村农林牧渔业从业人员数增加而增加, 谷物产量是随着 x6 农用机械总动力增加而减少,所以最新的模型的剔除了这 4 个在原模型的解释变量。2、 新的模型表明:化肥施用量每增加 1 万吨,谷物产量提高 7.331 万吨; x5谷物作物播种面积增广一个单位,谷物产量提高 0.468 万吨;x7 农村用电量增加
25、一个单位,谷物产量就会减少 3.613 万吨3、 可见,化肥使用量是影响谷物产量的显著性因素。但从经济意义上来说,施肥过度反而会导致谷物死亡,从而减产。4、 所以我们的模型所反映的经济意义不能包括现实中的每一种情况。六、建议我们知道农业是一个国民经济的基础,谷物生产是关系到一个国家生存与发展的一个永恒的主题,再加上我国的人口庞大的基本国情,告诉我们。谷物产量对我国具有特别的意义和重要性。因而谷物产量生产关系到我们上至国家,下至人民的一件大事,每个人都应该促进和稳定谷物产量提高上做出努力,而政府在此当中的则是起着关键性的作用。在此,我们建立的模型的基础上,就谷物产量的提高,提出了一些可供参考的政
26、策。1、通过模型和上面的分析可以看出,谷物播种面积对产量提高有着重要的作用,所以我们应该在合理的基础上有目的的,有规划的提高耕地面积。2、化肥使用量虽然对谷物增产有着积极作用,但物极必反,过度使用化肥必然在很大程度上降低土地肥力,抑制谷物的生产。所以在合理控制化肥量的同时,也要加大对化肥质的提高。总之,任何措施办法都应该在顺应自然的基础上,我们要保证谷物的稳定增长,就一定要注意走谷物生产的课持续发展之路。七、参考文献1何晓群,刘文卿.应用回归分析M.中国人民大学出版社,2015.3茆诗松,程依明.概率论与数理统计教程 M.高等教育出版社,2011.2九、附录y x1 x2 x3 x4 x5 x
27、6 x735450.00 110.20 3313.30 1513.40 31152.70 113462.00 16614.20 396.9038727.50 99.90 3471.30 1659.80 31645.10 114047.00 19497.20 435.2040730.50 99.80 3188.70 1739.80 31685.00 112884.00 20912.50 464.0037910.80 110.90 4436.50 1775.80 30351.50 108845.00 22950.00 508.9039151.20 109.30 4713.50 1930.60 30
28、467.90 110933.00 24836.00 586.7040473.30 106.20 4208.60 1999.30 30870.00 111268.00 26575.00 658.8039408.00 114.10 5087.40 2141.50 31455.70 110123.00 28067.00 712.0040754.90 121.30 4699.10 2357.10 32440.50 112205.00 28707.00 790.5044624.30 95.20 3847.40 2590.30 33336.40 113466.00 29388.00 884.5043529
29、.30 108.60 5547.20 2805.10 34186.30 112314.00 30308.40 963.2044265.80 124.30 5133.30 2930.20 34037.00 110560.00 31816.60 1106.9045648.80 127.70 4882.90 3151.90 33258.20 110509.00 33802.50 1244.9044510.10 148.70 5504.30 3317.90 32690.30 109544.00 36118.10 1473.9046661.80 134.40 4582.10 3593.70 32334.
30、50 110060.00 38546.90 1655.7050453.50 107.50 4698.90 3827.90 32260.40 112548.00 42015.60 1812.7049417.10 92.10 5342.90 3980.70 32677.90 112912.00 45207.70 1980.1051229.50 96.90 5014.50 4083.70 32626.40 113787.00 48996.10 2042.2050838.60 96.40 4998.10 4124.30 32911.80 113161.00 52573.60 2173.2046217.
31、50 90.10 5468.80 4146.40 32797.50 108463.00 55172.10 2421.3045263.70 101.50 5221.50 4253.80 32451.00 106080.00 57929.90 2610.8045705.80 98.60 4711.90 4339.40 31990.60 103891.00 60386.50 2993.40RES_1 ZRE_1 RES_2 ZRE_2 RES_3 ZRE_3-2284.96469 -2.06974 -2284.96469 -2.06974 -2284.96469 -2.06974-216.36815
32、 -.19599 -216.36815 -.19599 -216.36815 -.195991848.82966 1.67468 1848.82966 1.67468 1848.82966 1.67468818.96416 .74182 818.96416 .74182 818.96416 .74182227.71623 .20627 227.71623 .20627 227.71623 .206271149.77062 1.04147 1149.77062 1.04147 1149.77062 1.04147-229.61509 -.20799 -229.61509 -.20799 -229
33、.61509 -.20799-1154.77540 -1.04600 -1154.77540 -1.04600 -1154.77540 -1.04600754.02399 .68300 754.02399 .68300 754.02399 .68300-1091.90979 -.98906 -1091.90979 -.98906 -1091.90979 -.9890668.07069 .06166 68.07069 .06166 68.07069 .06166348.19429 .31540 348.19429 .31540 348.19429 .31540-728.17892 -.65959
34、 -728.17892 -.65959 -728.17892 -.65959-183.26470 -.16600 -183.26470 -.16600 -183.26470 -.166001293.50834 1.17167 1293.50834 1.17167 1293.50834 1.17167-428.75600 -.38837 -428.75600 -.38837 -428.75600 -.38837443.10673 .40137 443.10673 .40137 443.10673 .40137521.04426 .47197 521.04426 .47197 521.04426 .47197-1165.49385 -1.05571 -1165.49385 -1.05571 -1165.49385 -1.05571-1105.99133 -1.00182 -1105.99133 -1.00182 -1105.99133 -1.001821116.08896 1.01096 1116.08896 1.01096 1116.08896 1.01096