1、一、粮食生产模型 1、选择变量和模型的关系形式研究目的:研究我国近十年粮食产量与主要影响因素之间的定量关系。(1)确定模型应包含的变量被解释变量:粮食总产量(万吨) ,y解释变量:X1 农用化肥施用量(万公斤)X2 粮食播种面积(千公顷)X3 成灾面积(千公顷)X4 农业机械劳动力(万千瓦)X5 农业劳力(万人)变量选择依据:国家粮食政策对粮食生产的积极扶持作用,在样本区间内具有一致性;我国粮食统一平价收购, ,农民面临的是“无限的需求” 。因此,影响粮食产量的主要因素是:资本和劳动力农业生产的特点决定了资本主要是:土地和化肥考虑到我国的传统农业耕作方式有一定的变革,一方面从事非农产业的农民增
2、加;另一方面,农业机械化水平有所提高,表示劳动力的变量为:农机动力和农业劳动力。(2)确定模型的数学形式和参数范围被解释变量和解释变量之间的关系是投入产出关系,因此选用 C-D 生产函数,设定模型为:lnY=a0+a1lnX1+a2lnX2+u解释变量的个数从 25 个,可根据实际情况选择最有结果;偏回归系数为相应变量的产出弹性,理论值应介于 01 之间;截距 a0 为常熟虚拟变量,包含政策、气候等难以量化的影响因素;u 为随即扰动项,描述模型之外的因素对模型的干扰。2、采集样本数据本模型使用时间序列数据,数据来源于中国农村统计年鉴 (19841996) (见表2.10.1)其中:由于统计数据
3、没有粮食生产的专用数据,农用化肥施用量(万公斤) 、成灾面积(千公顷) 、农业机械总动力(万千瓦) 、农业劳力(万人)均为农业总体数据,尤其是农业劳力(万人)为农林牧副渔也总劳动力,只有几个年份有种植业、农业劳力数据,占农林牧副渔也劳力的比重为 0.80.85 之间。表 2.10.1obsY粮食总产量(万吨)X1农用化肥施用量(万公斤)X2粮食播种面积(千公顷)X3成灾面积(千公顷)X4农业机械劳动力(万千瓦)X5农业劳力(万人)1983 38728 1659.8 114047 16209.3 18022 31645.11984 40731 1739.8 112884 15264 19497
4、316851985 37911 1775.8 108845 22705.3 20913 30351.51986 39151 1930.6 110933 23656 22950 304671987 40298 1999.3 111268 20393.7 24836 308701988 39408 2141.5 110123 23944.7 26575 31455.71989 40755 2357.1 112205 24448.7 28067 32440.51990 44624 2590.3 113466 17819.3 28708 33330.41991 43529 2805.1 112314
5、27814 29389 34186.31992 44266 2930.2 110560 25894.7 30308 340371993 45649 3151.9 110509 23133 31817 33258.21994 44510 3317.9 109544 31383 33802 32690.31995 46662 3593.7 110060 22267 36118 32334.51996 50454 3827.9 112548 21234 38546.9 32260.4将原始数据格式转换为文本文件格式,并保存为:f:sqlzn2101.txt(记住样本区间、各列对应的变量名称)3872
6、8 1659.8 114047 16209.3 18022 31645.140731 1739.8 112884 15264 19497 3168537911 1775.8 108845 22705.3 20913 30351.539151 1930.6 110933 23656 22950 3046740298 1999.3 111268 20393.7 24836 3087039408 2141.5 110123 23944.7 26575 31455.740755 2357.1 112205 24448.7 28067 32440.544624 2590.3 113466 17819.3
7、 28708 33330.443529 2805.1 112314 27814 29389 34186.344266 2930.2 110560 25894.7 30308 3403745649 3151.9 110509 23133 31817 33258.244510 3317.9 109544 31383 33802 32690.346662 3593.7 110060 22267 36118 32334.550454 3827.9 112548 21234 38546.9 32260.4进入 TSP 窗口,进行如下操作:Create a 1983 1996Read(o) F:sq lz
8、n2101.txt y x1 x2 x3 x4 x5write(o) F:sq lzn2101.txt y x1 x2 x3 x4 x5save F:sq lzn2101.txtload F:sq lzn2101.txt3、参数估计结果及统计检验(1)ls lny c lnx23 lnx5 lnx123 lnx423把化肥施用量改为单位面积化肥施用量、农机劳力改为单位面积农机劳力,能够在一定程度上避免可能的多重共线性。用 OLS 法估计,得到如下回归方程:Create a 1983 1996Read(o) F:sq lzn2101.txt y x1 x2 x3 x4 x5write(o) F:
9、sq lzn2101.txt y x1 x2 x3 x4 x5save F:sq lzn2101.txtload F:sq lzn2101.txtgenr lny=log(y)genr lnx23=log(x2-x3)(不受灾的面积)genr lnx5=log(x5)genr lnx123=log(x1/(x2-x3) (单位面积化肥施用量)genr lnx423=log(x4/(x2-x3) (单位面积农机劳力)smpl 1983 1995ls lny c lnx23 lnx5 lnx123 lnx423LS / Dependent Variable is LNYDate: 10-26-20
10、04 / Time: 19:24SMPL range: 1983 - 1995Number of observations: 13VARIABLE COEFFICIENT STD. ERROR T-STAT. 2-TAIL SIG.C 3.5739166 1.8837160 1.8972694 0.094LNX23 0.6440529 0.1129913 5.7000232 0.000LNX5 0.0910628 0.1710340 0.5324249 0.609LNX123 0.3694410 0.0756865 4.8811988 0.001LNX423 -0.1025739 0.0852
11、775 -1.2028254 0.263R-squared 0.971896 Mean of dependent var 10.64357Adjusted R-squared 0.957844 S.D. of dependent var 0.069927S.E. of regression 0.014357 Sum of squared resid 0.001649Durbin-Watson stat 2.301112 F-statistic 69.16506Log likelihood 39.87505经济意义检验:LNX423 的回归系数为负数,经济含义上不成立。 (?)K=4,n=13,
12、查 tFDW 等统计量的临界值,进行统计检验;根据经济意义和 t 检验结果,依次分别剔除变量 LNX5、LNX423,用 OLS 法估计,得到如下回归方程:(2) ls lny c lnx23 lnx5 lnx123 LS / Dependent Variable is LNYVARIABLE COEFFICIENT STD. ERROR T-STAT. 2-TAIL SIG.C 2.2729083 1.5800455 1.4385081 0.184LNX23 0.6861866 0.1100585 6.2347414 0.000LNX5 0.1528628 0.1671345 0.91460
13、95 0.384LNX123 0.2854699 0.0299538 9.5303370 0.000R-squared 0.966814 Mean of dependent var 10.64357Adjusted R-squared 0.955752 S.D. of dependent var 0.069927S.E. of regression 0.014709 Sum of squared resid 0.001947Durbin-Watson stat 1.837561 F-statistic 87.39905经济意义检验:LNX23 、LNX5、 LNX423 的回归系数之和为 1.
14、112,约等于 1,符合理论和经验期望值,模型可以通过经济意义检验。 (?)K=3,n=13,查 tFDW 等统计量的临界值,进行统计检验;LNX5 不能通过显著项检验,其原因可能是数据代表性差,用农林牧渔总劳力代替粮食生产劳力会产生很大的偏差。若能得到较准确的样本数据,LNX5 应该能够通过显著性检验。因此,在比较粗略的情况下,该模型可以使用。模型的经济意义可解释如下:?(3)ls lny c lnx23 lnx123 lnx423LS / Dependent Variable is LNYVARIABLE COEFFICIENT STD. ERROR T-STAT. 2-TAIL SIG.
15、C 4.3376020 1.1714570 3.7027410 0.005LNX23 0.6656238 0.1011921 6.5778227 0.000LNX123 0.3917628 0.0604535 6.4803981 0.000LNX423 -0.1162134 0.0780338 -1.4892708 0.171R-squared 0.970900 Mean of dependent var 10.64357Adjusted R-squared 0.961201 S.D. of dependent var 0.069927S.E. of regression 0.013774 S
16、um of squared resid 0.001707Durbin-Watson stat 2.285084 F-statistic 100.0945经济意义检验:LNX23 、LNX123、 LNX423 的回归系数之和为 0.950,约等于 1,符合理论和经验期望值;但 LNX423 的回归系数为负数,经济含义上不成立。模型不能通过经济意义检验。 (?)K=3,n=13,查 tFDW 等统计量的临界值,进行统计检验;LNX423 不能通过显著项检验,其原因可能是由于新增添的农机动力多数不用于农业生产,因此与产量的相关性不搞因此,该模型不可以使用。为何?()ls lny c lnx23 l
17、nx123 LS / Dependent Variable is LNYDate: 10-26-2004 / Time: 19:29SMPL range: 1983 - 1995Number of observations: 13VARIABLE COEFFICIENT STD. ERROR T-STAT. 2-TAIL SIG.C 3.3628247 1.0290081 3.2680255 0.008LNX23 0.7363263 0.0946502 7.7794512 0.000LNX123 0.3060546 0.0196035 15.612280 0.000R-squared 0.96
18、3729 Mean of dependent var 10.64357Adjusted R-squared 0.956475 S.D. of dependent var 0.069927S.E. of regression 0.014589 Sum of squared resid 0.002128Durbin-Watson stat 1.804932 F-statistic 132.8523经济意义检验:LNX23 、LNX5、 LNX423 的回归系数之和为 1.043,约等于 1,符合理论和经验期望值,模型可以通过经济意义检验。 (?)K=2,n=13,查 tFDW 等统计量的临界值,进
19、行统计检验;均能够通过显著性检验。型具有相当好的统计性质,拟和优度高,该模型可以使用。模型的经济意义可解释如下:?(5) 模型 ls lny c lnx23 lnx123 的拟和检验fit flnygenr fy=exp(flny)genr ycjy=(y-fy)/y(相对误差)show lny flny y fy ycjyobs LNY FLNY Y FY YCJY1983 10.56432 10.57633 38728.00 39196.05 -0.0120851984 10.61475 10.58978 40731.00 39726.74 0.0246561985 10.54300 10
20、.54222 37911.00 37881.43 0.0007801986 10.57518 10.57344 39151.00 39082.91 0.0017391987 10.60406 10.60152 40298.00 40195.91 0.0025331988 10.58172 10.59972 39408.00 40123.60 -0.0181591989 10.61533 10.63688 40755.00 41642.84 -0.0217851990 10.70603 10.70280 44624.00 44480.43 0.0032171991 10.68118 10.673
21、87 43529.00 43211.93 0.0072841992 10.69797 10.68807 44266.00 43829.68 0.0098571993 10.72874 10.72395 45649.00 45430.89 0.0047781994 10.70347 10.69170 44510.00 43989.35 0.0116971995 10.75069 10.76614 46662.00 47388.92 -0.015578可见,模拟相对误差较小。4、预测及分析查得 1996 年数据,并输入。Smpl 1996 1996Forcst fflnygenr ffy=exp(
22、fflny)genr ycjy1=(y-ffy)/y(相对误差)show lny fflny y ffy ycjy1obs LNY FFLNY Y FFY YCJY11996 10.82882 10.80239 50454.00 49137.87 0.026086预测的相对误差为 2.61%,在容许的范围内(一般为 5%)因此,模型 ls lny c lnx23 lnx123 是可以应用的。考虑:为何没有进行异方差检验、异常值检验、多重共线性检验?模型稳定性检验?怎样检验?5、批处理程序(1):在 TSP 状态下编辑输入:edit F:sqlzn2101.txt 回车1: load F:sql
23、zn2101.txt2: genr lny=log(y)3: genr lnx23=log(x2-x3)4: genr lnx5=log(x5)5: genr lnx123=log(x1/(x2-x3) 6: genr lnx423=log(x4/(x2-x3) 7: smpl 1983 19958: ls(p) lny c lnx23 lnx5 lnx123 lnx4239: ls(p) lny c lnx23 lnx5 lnx123 10:ls(p) lny c lnx23 lnx123 lnx42311:ls(p) lny c lnx23 lnx123 12:fit flny13:gen
24、r fy=exp(flny)14:genr ycjy=(y-fy)/y15:show lny flny y fy ycjy16:Smpl 1996 199617:Forcst fflny18:genr ffy=exp(fflny)19:genr ycjy1=(y-ffy)/y20:show lny fflny y ffy ycjy121:smpl 1983 199522:ls(p) lny c lnx23 lnx5 lnx123 23:Smpl 1996 199624:Forcst ffflny25:genr fffy=exp(ffflny)26:genr ycjy2=(y-fffy)/y27
25、:show y ffy fffy ycjy1 ycjy2(2):在 TXT 状态下编辑打开一个文本文件,依次输入下列命令:load F:sqlzn2101.txtgenr lny=log(y)genr lnx23=log(x2-x3)genr lnx5=log(x5)genr lnx123=log(x1/(x2-x3) genr lnx423=log(x4/(x2-x3) smpl 1983 1995ls(p) lny c lnx23 lnx5 lnx123 lnx423ls(p) lny c lnx23 lnx5 lnx123 ls(p) lny c lnx23 lnx123 lnx423l
26、s(p) lny c lnx23 lnx123 fit flnygenr fy=exp(flny)genr ycjy=(y-fy)/yshow lny flny y fy ycjySmpl 1996 1996Forcst fflnygenr ffy=exp(fflny)genr ycjy1=(y-ffy)/yshow lny fflny y ffy ycjy1smpl 1983 1995ls(p) lny c lnx23 lnx5 lnx123 Smpl 1996 1996Forcst ffflnygenr fffy=exp(ffflny)genr ycjy2=(y-fffy)/yshow y ffy fffy ycjy1 ycjy2保存批处理文件:save f:sqlzn2101b.txt运行批处理文件:run f:sqlzn2101b.txtobs Y FFY FFFY YCJY1 YCJY21996 50454.00 49137.87 48631.39 0.026086 0.036124