1、1实验四 异方差问题及其修正案例:中国农村居民人均消费函数 P116数据:地区人均消费支出Y从事农业经营的收入 X1 其他收入 X2北京 5724.50 958.3 7317.2 天津 3341.10 1738.9 4489.0 河北 2495.30 1607.1 2194.7 山西 2253.30 1188.2 1992.7 内蒙古 2772.00 2560.8 781.1 辽宁 3066.90 2026.1 2064.3 吉林 2700.70 2623.2 1017.9 黑龙江 2618.20 2622.9 929.5 上海 8006.00 532.0 8606.7 江苏 4135.20
2、1497.9 4315.3 浙江 6057.20 1403.1 5931.7 安徽 2420.90 1472.8 1496.3 福建 3591.40 1691.4 3143.4 江西 2676.60 1609.2 1850.3 山东 3143.80 1948.2 2420.1 河南 2229.30 1844.6 1416.4 湖北 2732.50 1934.6 1484.8 湖南 3013.30 1342.6 2047.0 广东 3886.00 1313.9 3765.9 广西 2413.90 1596.9 1173.6 海南 2232.20 2213.2 1042.3 重庆 2205.20
3、1234.1 1639.7 四川 2395.00 1405.0 1597.4 贵州 1627.10 961.4 1023.2 云南 2195.60 1570.3 680.2 西藏 2002.20 1399.1 1035.9 陕西 2181.00 1070.4 1189.8 甘肃 1855.50 1167.9 966.2 青海 2179.00 1274.3 1084.1 宁夏 2247.00 1535.7 1224.4 新疆 2032.40 2267.4 469.9 建立模型: 210lnllnXY一、模型的 OLS 估计(1)录入数据打开 EViews6,点“File ”“New”“Workf
4、ile”2选择 “Unstructured/Undated”,在 Observations 后输入 31,如下所示:点“ok” 。在命令行输入:DATA Y X1 X2,回车将数据复制粘贴到 Group 中的表格中:对变量取对数:在命令行输入命令:GENR lny=log(y) 回车GENR lnx1=log(x1) 回车3GENR lnx2=log(x2) 回车(2)估计回归方程在命令行输入命令:LS lny C lnx1 lnx2, 回车或者在主菜单中点“Quick”“Estimate Equation”,在 Specification 中输入 lny C lnx1 lnx2,点“确定”
5、。得到如下估计结果:写出回归方程:21475.052.06.3 LnXnYLn(3.14 ) (1.38 ) (9.25)=0.7798 F=49.60 D.W.=1.78102R6.2二、模型的异方差检验1、 图示检验法(1) 作散点图:LnX2LnY在命令行输入命令:scat lnx2 lny 回车47.27.68.08.48.9.26.06.46.87.27.68.08.48.9.2LOG(X2)LOG(Y)(2)作散点图:LnX2 ie首先生成残差的平方序列,在命令行输入命令:GENR E2=resid2 回车作散点图: SCAT lnx2 E2 回车.0.04.08.12.16.20
6、.246.06.46.87.27.68.08.48.9.2LNX2E2(3)作散点图:LnY 2ie在命令行输入命令: SCAT LNY E2 回车5.0.04.08.12.16.20.247.27.68.08.48. 9.2LNYE22、 模型的 G-Q 检验原假设 :同方差0H备择假设 :异方差1(1)首先将样本按 LnX2 由小到大的顺序排列,在命令行输入命令:SORT LnX2 回车(2)去除掉中间的 7 个样本(n/4=7.75,为了使剩下的样本能被平均分成两份,去掉7 个) ,将剩余的 24 样本平均分为两份,每一份 12 个样本。(3)取前面的 12 个样本,在命令行输入命令:
7、SMPL 1 12 回车估计子样本 1: LS lnY C lnX1 lnX2 回车得到子样本 1 的输出结果:6写出回归结果: 123.140.98.35LnYLnXRSS1=0.0702(4)取最后面的 12 个样本,在命令行输入命令: SMPL 20 31 回车估计子样本 2: LS lnY C lnX1 lnX2 回车得到子样本 2 的输出结果:7写出回归结果: 123.94060LnYLnXRSS1=0.1912(5)计算 G-Q 检验的 F 统计量:已知子样本 1 的残差平方和为 0.0702,子样本 2 的残差平方和为 0.1912,相应的 F 统计量为:2.73 20.97RS
8、F 统计量的自由度 ,给定=0.05,查 F 统91273121 kcnv计量的临界值, , ,由于 F=2.732.44,因此在 10%的显著性水平下拒绝原假设。3、 模型的 Park 检验帕克检验常用 22()()iviijijVarfXe或者: 2i ijiLneLn因此,本题中用 作为被解释变量,对 做回归,然后检验方程的显著性。i 2i首先将样本恢复成全部样本: SMPL 1 31 回车;在命令行输入命令: LS LOG(E2) C LNX2 回车;得到下面的输出结果:模型的 F 统计量为 0.055292,相伴概率 P=0.81575=0.05,模型整体不显著。在模型中加入 LNX
9、2 的平方项,重新估计模型。输入命令:LS LOG(E2) C LNX2 LNX22 回车;8得到如下结果:模型的 F 统计量为 3.5502,P 值为 0.0423,小于显著性水平(0.05) ,因此模型整体显著,且变量 LNX2 和 LNX22 的 t 统计量的 P 值均小于 (0.05) ,变量均显著。表明原来的模型中存在异方差,且异方差的形式为: ()exp(2)iVarLn2293.165.71.0)LnX4、 模型的戈里瑟检验戈里瑟检验通过检验如下方程或者 2()ijiiefXv|()ijiiefv是否显著成立来判断模型是否存在异方差。首先,以 为被解释变量,LNX2 为解释变量估
10、计模型:2i输入命令: LS E2 C LNX2 回车;得到如下结果:9模型的 F 统计量为 2.1888,P 值为 0.1498,大于显著性水平(0.05) ,因此,模型不显著。在模型中加入 LNX2 的平方项,重新估计模型。输入命令: LS E2 C LNX2 LNX22 回车;得到如下结果:模型的 F 统计量为 10.1629,P 值为 0.00048,小于显著性水平(0.05) ,因此模型整体显著,且变量 LNX2 和 LNX22 的 t 统计量的 P 值均小于 (0.05) ,变量均显著。表明原来的模型中存在异方差,且异方差的形式为: ()2iVarE22.4860.70.43LnX
11、n5、 模型的 White 检验首先采用 OLS 估计模型,在弹出的 Equation 窗口,点 ViewResidual TestsHeteroskedasticity Tests10在弹出的窗口选择“White” ,点“OK” 。得到如下输出结果:11从表中可得到怀特检验的统计量: =20.55085,相伴概率 P=0.0010,给定2nR=0.05, P,因此拒绝同方差的原假设。三、模型的修正1、 加权最小二乘法(WLS)(1) 以戈里瑟检验的结果获取权重首先,生成权重数据:genr w1=1/sqr(2.428590-0.646690*lnx2+0.043161*lnx22)或者,重新
12、执行估计模型的命令:LS E2 C LNX2 LNX22 回车然后在 Equation 窗口,点击 “Forecast”,将预测值保存为 E2f1,这也是模型对 E2 的拟合值,然后生成权重:GENR W1=1/SQR(E2f1);采用加权最小二乘法估计模型:方法 1:直接输入命令 LS(W=W1) LNY C LNX1 LNX2方法 2:在主菜单中点“Quick”“Estimate Equation”,在 Specification 中输入 LnY C LNX1 LNX2,然后点击“Options ”,在弹出的对话框里选择“Weighted LS/TSLS”,然后在“Weight:”后输入权
13、变量名称:w1,点“确定” 。12得到如下输出:写出修正后的结果:122.4180.370.48LnYLnXn13(3.047) (3.577) (8.374)=0.7274 F=37.36 D.W.=1.47862R20.79(2)以帕克检验的结果获取权重首先,生成权重数据: genr w2=1/sqr(exp(93.19586-25.97629*lnx2+1.701071*lnx22)或者,重新执行估计模型的命令:LS log(E2) C LNX2 LNX22 回车然后在 Equation 窗口,点击 “Forecast”,将 E2 预测值保存为 E2f2,这也是模型对 E2的拟合值,然后
14、生成权重:GENR W2=1/SQR(E2f2);采用加权最小二乘法估计模型:方法 1:直接输入命令 LS(W=W2) LNY C LNX1 LNX2方法 2:在主菜单中点“Quick”“Estimate Equation”,在 Specification 中输入 LnY C LNX1 LNX2,然后点击“Options ”,在弹出的对话框里选择“Weighted LS/TSLS”,然后在“Weight:”后输入权变量名称:w2,点“确定” 。得到如下输出:写出修正后的结果:122.380.70.487LnYLnXn(3.231) (3.817) (9.607)14=0.7827 F=50.4
15、3 D.W.=1.71612R20.76(2) 直接用最小二乘估计的残差得到权重生成权重数据: genr w3=1/sqr(e2)估计模型: LS(W=W3) LNY C LNX1 LNX2得到如下输出:写出修正后的结果:123.260.590.4679LnYLnXn(19.165 )(6.082 ) (47.831 )=0.9896 F=1325.76 D.W.=1.52292R2.82、 异方差稳健标准误法在主菜单中点“Quick”“Estimate Equation”,在 Specification 中输入 LnY C LNX1 LNX2,然后点击“Options” ,在弹出的对话框里选择“Heteroskedasticity consistent coefficient”,点“确定” 。15得到如下输出:写出估计结果:123.260.50.475LnYLnXn(2.597)(0.9384) (8.3221 )=0.7799 F=49.6012 D.W.=1.15472R2.