1、 1实验5 自相关性的检验和修正 在经济系统中,经济变量前后期之间很可能有 关联,使得随机误差项不能满足无自相关的假定。本案例将探讨随机误差项不满足无自相关的古典假定时的参数估计问题。着重讨论自相关模型的图形法检验、 DW 检验、 LM 检验等,并使用科克伦 奥克特迭代法对自相关修正。 表 1 1985-2003 年农村居民人均收入和消费 单位:元 年年 份份 全全 年年 人人 均均 纯纯 收收入入 (现现 价价 ) 全全 年年 人人 均均 消消 费费 性性 支支 出出 (现现 价价 ) 消消 费费 价价 格格 指指数数 (1985=100) 人人 均均 实实 际际 纯纯收收 入入 (1985
2、可可 比比 价价 ) 人人 均均 实实 际际 消消费费 性性 支支 出出(1985 可可 比比价价 ) 1985.00 397.60 317.42 100.00 397.60 317.40 1986.00 423.80 357.00 106.10 399.43 336.48 1987.00 462.60 398.30 112.70 410.47 353.42 1988.00 544.90 476.70 132.40 411.56 360.05 1989.00 601.50 535.40 157.90 380.94 339.08 1990.00 686.30 584.63 165.10 415.
3、69 354.11 1991.00 708.60 619.80 168.90 419.54 366.96 1992.00 784.00 659.80 176.80 443.44 373.19 1993.00 921.60 769.70 201.00 458.51 382.94 1994.00 1221.00 1016.81 248.00 492.34 410.00 1995.00 1577.70 1310.36 291.40 541.42 449.69 1996.00 1923.10 1572.10 314.40 611.67 500.03 1997.00 2090.10 1617.15 32
4、2.30 648.50 501.77 1998.00 2162.00 1590.33 319.10 677.53 498.28 1999.00 2214.30 1577.42 314.30 704.52 501.75 2000.00 2253.40 1670.00 314.00 717.64 531.85 2001.00 2366.40 1741.00 316.50 747.68 550.08 2002.00 2475.60 1834.00 315.20 785.41 581.85 2003.00 2622.24 1943.30 320.20 818.86 606.81 1. 建立 Workf
5、ile 和对象,录入变量 1985 年可比价格计的人均纯收入 X 和人均消费支出人口数 Y 如图 1。 2图 1 2. 参数估计、检验模型的自相关 使用普通最小二乘法估计消费模型得 图 2 根据图 2,知估计结果如下 106.7574 0.5998 ttYX=+(6.1) 22(12.2237) (0.0214)(8.7337) (28.0367)0.9788 0.9776 786.0569 17 0.7705tRRF dfDW= =3(1) DW 检验 对样本量为 19、一个解释变量的模型、 5%显著水平,查 DW 统计表可知,dL=1.18, dU= 1.40,模型中 DW=11111,1
6、11,11,krrrkrkjjkjkkjjkjkkkkjkkkkjkjk =,1,1,() tktkkktkttuuuu += ,11110L()=+=pjjLBjTrTTQ1226其中: rj是残差序列的 j 阶自相关系数, T 是观测值的个数, p 是设定的滞后阶数 。 p 阶滞后的 Q-统计量的原假设是 H0:序列不存在 p 阶自相关;备选假设H1:序列存在 p 阶自相关。 如果 Q-统计量在某一滞后阶数显著不为零, 则说明序列存在某种程度上的序列相关。在实际的检验中,通常会计算出不同滞后阶数的 Q-统计量、自相关系数和偏自相关系数。如果,各阶 Q-统计量都没有超过由设定的显著性水平决定
7、的临界值,则接受原假设,即不存在序列相关,并且此时,各阶的自相关和偏自相关系数都接近于 0。 反之,如果,在某一滞后阶数 p, Q-统计量超过设定的显著性水平的临界值(或者说 Q-统计量对应的 P 值很小,小于给定的显著性水平) ,则拒绝原假设,说明残差序列存在 p 阶自相关。 由于 Q-统计量的 P 值要根据自由度 p 来估算,因此,一个较大的样本容量是保证 Q-统计量有效的重要因素。 本例 1 阶的自相关系数和偏自相关系数都超出了虚线,说明存在 1 阶序列相关。 1 阶滞后的 Q-统计量的 P 值很小,拒绝原假设,残差序列存在一阶序列相关。 (4) LM 检验 在估计窗口选择 View/R
8、esidual Tests/Serial Correalation LM Test(见图 6) 。 图 6 7点击后会自动弹出一个设定滞后期( Lag Specification)对话框(如图 7) 。 图 7 对话框中的 Lags to 用于输入序列自相关的最大滞后阶数, Eviews 会给出一个默认的滞后阶数,图 5 显示的是 2,本实验使用默认的滞后阶数。单击 OK 按钮,出现图 8 所示自相关检验结果。 图 8 8图 8 的 LM 检验的结果分为两部分,上部分显示 LM 检验结果,下部分显示LM 检验辅助回归方程的结果。根据 LM 检验结果的 p-值判断拒绝残差序列不存在自相关的原假设
9、,所以 LM 检验结果也说明 (6.1)式存在自相关。 3. 自相关问题的修正 为解决自相关问题, 选用 科克伦奥克特迭代法 。 由式 6.1 可得残差序列 e,在 EViews 中,每次回归的残差存放在 resid 序列中,为了对残差进行回归分析,需生成命名为 e 的残差序列。点击工作文件窗口工具栏中的 Genr,在弹出的对话框中输入 eresid= ,点击 OK 得到残差序列 e。 图 9 使用 et进行滞后一期的自回归 :点击 EViews 主窗口的 Quick/ Esitimate Equation,在方程输入窗口输入 e e (-1),得到如下回归分析结果 tttvee +=)1(1
10、)1()1(9图 10 因此,可得回归方程 te= 0.496086et-1(6.2) 由式 6.2可知 =0.496086,对原模型进行广义差分,得到广义差分方程 tttttvXXYY +=)496086.0()496086.01(496086.01211 (6.3) 对式 6.3的广义差分方程进行回归, 点击 EViews主窗口的 Quick/ Esitimate Equation,在方程输入窗口输入 Y-0.496086*Y (-1) c X-0.496086*X (-1),如图11。 10图 11 回车后可得方程输出结果图 12。 图 12 11由图 12 可得回归方程为 *60.43
11、839 0.583281ttYX=+ (6.4) 22(8.9638) (0.0294)(6.7425) (19.8331)0.9609 0.9585 393.3522 16 1.39759tRRF dfDW= =式中,*10.496086tt tYY Y= ,*10.496086tt tX XX= 。 由于使用了广义差分数据,样本容量减少了 1 个,为 18 个。查 5%显著水平的 DW 统计表可知 dL= 1.16, dU= 1.39,模型中 DW = 1.3979 dU,说明广义差分模型中已无自相关,不必再进行迭代。 同时可见,可决系数 R2、t、 F 统计量也均达到理想水平。 对比式
12、6.1 和式 6.4 ,很明显普通最小二乘法低估了回归系数2 的标准误差。 原模型中2( ) 0.0214Se = ,广义差分模型中为2( ) 0.0294Se = 。 经广义差分后样本容量会减少 1 个,为了保证样本数不减少,可以使用 普莱斯温斯腾变换 补充第一个观测值,方法是*2111XX =和*2111YY =。在本例中即为211 0.496086X 和211 0.496086Y 。由于要补充因差分而损失的第一个观测值, 所以在 EViews 中就不能采用前述方法直接在命令栏输入 Y 和 X 的广义差分函数表达式,而是要生成 X 和 Y 的差分序列 XN 与 YN (这里 ,我们以 XN
13、 代替书上的*X ,YN 代替*Y )。点击工作文件窗口工具栏中的 Genr,在弹出的对话框中输入 0.496086* ( 1)YN Y Y= ,点击 OK 得到广义差分序列 YN ,同样的方法得到广义差分序列 XN 。 此时的 XN 和 YN 都缺少第一个观测值,需采用 普莱斯温斯腾变换 补充进去,根据*2111XX =和*2111YY =,计算得1345.2255XN = ,1275.58997YN = ,双击工作文件窗口的 XN 打开序列显示窗口,点击 Edit+/-按钮,将1345.2255XN = 补充到 1985 年对应的栏目中,得到 XN 的 19 个观测值的12序列。同样的方法
14、可得到 YN 的 19 个观测值序列。 在方程输入窗口输入 yn c xn 得到普莱斯温斯腾变换的广义差分模型为 59.49956 0.58889ttYN XN=+ (6.5) 22(9.1291) (0.0297)(6.5177) (19.8071)0.9585 0.9560 392.3237 17 1.3455tRRF dfDW= =对比式 6.4 和式 6.6可发现, 两者的参数估计值和各检验统计量的差别很微小,说明在本例中使用普莱斯温斯腾变换与直接使用科克伦奥克特两步法的估计结果无显著差异,这是因为本例中的样本还不算太小。如果实际应用中样本较小,则两者的差异会较大。通常对于小样本,应采用普莱斯温斯腾变换补充第一个观测值。 由式 6.3有 159.49956118.07481 0.496086 =(6.7) 由此,我们得到最终的中国农村居民消费模型为 118.0748 0.58889 ttYX=+ (6.8) 由式 6.5 的中国农村居民消费模 型可知,中国农村居民的边际消费倾向为0.58889,即中国农民收入每增加 1 元,消费支出将平均增加 0.58889 元。