1、异方差案例:地区 农业总产值 农作物种植面积 地区 农业总产值 农作物种植面积北京市 92.7 312.5 湖北省 921.6 7155.9天津市 95.3 504.3 湖南省 874.0 7886.2河北省 1135.7 8695.4 广东省 960.0 4808.0山西省 290.5 3741.5 广西 623.1 6368.2内蒙古自治区 411.5 5924.0 海南省 170.9 826.9辽宁省 611.3 3723.3 重庆市 333.0 3435.3吉林省 486.2 4904.0 四川省 987.7 9387.5黑龙江省 620.2 9888.4 贵州省 317.7 4695
2、.0上海市 109.3 404.4 云南省 516.9 5890.0江苏省 1242.4 7669.0 西藏 26.6 231.2浙江省 592.6 2778.4 陕西省 413.7 4099.8安徽省 842.0 9200.4 甘肃省 331.4 3668.9福建省 525.8 2519.3 青海省 34.2 473.3江西省 491.1 5182.8 宁夏 71.3 1158.3山东省 1891.7 10638.6 新疆 515.0 3592.3河南省 1602.9 13789.7取 2004 年全国 31 个省市自治区农作物种植业产值 Yt(亿元)和农作物播种面积 Xt(万亩)数据研究二
3、者之间的关系。得估计的线性模型如下,= 25.09 + 0.113 XttY(9.56) R2 = 0.76, F = 91.37, T = 31(一)异方差的检验1、图示法:05010150205010150XY-60-4-2020460851015202530Y Residual图 1 农业总产值 Yt 和播种面积 Xt 图 2 残差图无论是从 Yt 和 Xt 观测值的散点图(见图 1)还是模型的残差图(见图 2)都可以发现数据中存在异方差。2、用 Goldfeld-Quandt 方法检验是否存在异方差。首先以 Xt 为基准对成对样本数据( Yt,X t)按取值大小排序。去掉中间 7 个数
4、据,按 Xt 取值大小分成样本容量各为 11 的两个子样本。用两个子样本各自回归得结果如下,= 35.14+ 0.1244 Xt , (t = 1, , 12) tY(4.96) R2 = 0.71 F = 24.64, ESS =138421.2, = -241.18+ 0.1421Xt , (t = 20, , 29) t(3.0) R2 = 0.53 F = 11.48, ESS =996129.4统计量:F = = 7.196,)1/(.38496因为 F = 11.2 F0.05 (10, 10) = 2.98,所以存在异方差。3、用 Glejser 方法检验是否存在异方差。用回归后
5、残差的绝对值 对 Xt 的不同次幂作回归得如下回归式:tette0281.(6.694) R2=0.131ttX496.(7.339) R2=0.2250.137tt Ee(1.95) R2=0.12经比较可以发现,随机误差项存在形如第二个方程形式的异方差。4、用 White 方法检验是否存在异方差。LM 统计量为 5.79,5显著性水平下 ,10显著性水平下 ,而91.520.605.421.04.6055.795.991,这表明在 5的显著性水平下,结论显示接受原假设,但 10显著性水平下拒绝原假设,认为存在异方差。(二)异方差修正1、广义最小二乘估计根据 Glejser 检验可知, 异方
6、差的形式与 Xt 相似。据此对原模型进行变化得:ttXe496.2ttXY* ttt* t0*对新模型应用 OLS 估计得:*19.0625.3tt XY(12.46) R2=0.46把系数带回原模型得: tt XY19.0625.3该估计方程的参数为消除了异方差的估计,具有有效性。2取对数消除异方差(1)对 Yt 和 Xt 同取对数得两个新变量 LnYt 和 LnXt(见图 3) 。用 LnYt 对 LnXt 回归,得= -1.0405+ 0.8670 LnXt . tLn(13.05) R2 = 0.85, F = 170.2, (t = 1, , 31)3456785678910LNXLNY-1.2-0.8-0.40.0.40.851015202530LNY Residual图 3 Ln Yt 和 Ln Xt 图 4 残差图 Goldfeld-Quandt 检验异方差。去掉中间7个观测值,仍按X t大小分成两个T = 7的子样本,并回归(结果略)得SSE 1 = 1.17,SSE 2 = 0.65,经Goldfeld-Quandt检验,有2.894726F = = 0.337 2.89470因为 0.56 小于 F0.05 (10,10) = 2.98,所以取对数后,模型中不存在递增型异方差(残差见图 4) 。