1、时间 地点 实验题目 异方差的诊断与修正 一、实验目的与要求:要求目的:1、用图示法初步判断是否存在异方差,再用 White 检验异方差;2、用加权最小二乘法修正异方差。二、实验内容根据 1998 年我国重要制造业的销售利润与销售收入数据,运用 EV 软件,做回归分析,用图示法,White 检验模型是否存在异方差,如果存在异方差,运用加权最小二乘法修正异方差。三、实验过程:(实践过程、实践所有参数与指标、理论依据说明等)(一)模型设定为了研究我国重要制造业的销售利润与销售收入是否有关,假定销售利润与销售收入之间满足线性约束,则理论模型设定为:= + +iY12iX其中, 表示销售利润, 表示销
2、售收入。由 1998 年我国重要制造业的销售收入与销售iYi利润的数据,如图 1:1988 年我国重要制造业销售收入与销售利润的数据 (单位:亿元)行业名称 销售利润 Y 销售收入 X食品加工业 187.25 3180.44食品制造业 111.42 1119.88饮料制造业 205.42 1489.89烟草加工业 183.87 1328.59纺织业 316.79 3862.9服装制造业 157.7 1779.1皮革羽绒制品 81.73 1081.77木材加工业 35.67 443.74家具制造业 31.06 226.78造纸及纸制品 134.4 1124.94印刷业 90.12 499.83文
3、教体育用品 54.4 504.44石油加工业 194.45 2363.8化学原料制品 502.61 4195.22医药制造业 238.71 1264.1化学纤维制造 81.57 779.46橡胶制品业 77.84 692.08塑料制品业 144.34 1345非金属矿制业 339.26 2866.14黑色金属冶炼 367.47 3868.28有色金属冶炼 144.29 1535.16金属制品业 201.42 1948.12普通机械制造 354.69 2351.68专用设备制造 238.16 1714.73交通运输设备 511.94 4011.53电子机械制造 409.83 3286.15电子通
4、信设备 508.15 4499.19仪器仪表设备 72.46 663.68(二)参数估计1、双击“Eviews” ,进入主页。输入数据:点击主菜单中的 File/Open /EV WorkfileExcel异方差数据 2.xls ;2、在 EV 主页界面的窗口,输入“ls y c x” ,按“Enter” 。出现 OLS 回归结果,如图 2: 估计样本回归函数Dependent Variable: YMethod: Least SquaresDate: 10/19/05 Time: 15:27Sample: 1 28Included observations: 28Variable Coeff
5、icient Std. Error t-Statistic Prob. C 12.03564 19.51779 0.616650 0.5428X 0.104393 0.008441 12.36670 0.0000R-squared 0.854696 Mean dependent var 213.4650Adjusted R-squared 0.849107 S.D. dependent var 146.4895S.E. of regression 56.90368 Akaike info criterion 10.98935Sum squared resid 84188.74 Schwarz
6、criterion 11.08450Log likelihood -151.8508 F-statistic 152.9353Durbin-Watson stat 1.212795 Prob(F-statistic) 0.000000估计结果为: = 12.03564 + 0.104393iY iX(19.51779) (0.008441)t=(0.616650) (12.36670)=0.854696 =0.849107 S.E.=56.89947 DW=1.212859 F=152.93532R2R这说明在其他因素不变的情况下,销售收入每增长 1 元,销售利润平均增长 0.104393 元
7、。=0.854696 , 拟合程度较好。在给定 =0.0 时,t=12.36670 =2.056 ,拒)26(05.t绝原假设,说明销售收入对销售利润有显著性影响。F=152.9353 = 4.23 ,)6,21(F05.表明方程整体显著。(三)检验模型的异方差(一)图形法1、在“Workfile”页面:选中 x,y 序列,点击鼠标右键,点击 Openas GroupYes2、在“Group”页面:点击 ViewGraphScatterSimple Scatter, 得到 X,Y 的散点图(图 3 所示):01020304050601020304050XY3、在“Workfile”页面:点击
8、Generate,输入“e2=resid2”OK4、选中 x,e2 序列,点击鼠标右键,Openas GroupYes5、在“Group”页面:点击 ViewGraphScatterSimple Scatter, 得到 X,e2 的散点图(图 4 所示):05010150202501020304050XE26、判断由图 3 可以看出,被解释变量 Y 随着解释变量 X 的增大而逐渐分散,离散程度越来越大;同样,由图 4 可以看出,残差平方 对解释变量 X 的散点图主要分布在图形中的下三角部2ie分,大致看出残差平方 随 的变动呈增大趋势。因此,模型很可能存在异方差。但是2ii否确实存在异方差还应
9、该通过更近一步的检验。 (二)White 检验1、 在“Equation”页面:点击 ViewResidual TestsWhite 检验(no cross),(本例为一元函数,没有交叉乘积项)得到检验结果,如图 5:White检验结果White Heteroskedasticity Test:F-statistic 3.607218 Probability 0.042036Obs*R-squared 6.270612 Probability 0.043486Test Equation:Dependent Variable: RESID2Method: Least SquaresDate: 1
10、0/19/05 Time: 15:29Sample: 1 28Included observations: 28Variable Coefficient Std. Error t-Statistic Prob. C -3279.779 2857.117 -1.147933 0.2619X 5.670634 3.109363 1.823728 0.0802X2 -0.000871 0.000653 -1.334000 0.1942R-squared 0.223950 Mean dependent var 3006.741Adjusted R-squared 0.161866 S.D. depen
11、dent var 5144.470S.E. of regression 4709.744 Akaike info criterion 19.85361Sum squared resid 5.55E+08 Schwarz criterion 19.99635Log likelihood -274.9506 F-statistic 3.607218Durbin-Watson stat 1.479908 Prob(F-statistic) 0.0420362、因为本例为一元函数,没有交叉乘积项,则辅助函数为 = + + + 2t01tx2tt从上表可以看出,n =6.270612 ,有 White
12、检验知,在 =0,05 下,查 分布表,得2R临界值 (2)=5.99147。比较计算的 统计量与临界值,因为 n = 6.270612 5.022R(2)=5.99147 ,所以拒绝原假设,不拒绝备择假设,这表明模型存在异方差。.(四)异方差的修正在运用加权最小二乘法估计过程中,分别选用了权数 =1/ , =1/ , =1/t1tXt22tt3。tX1、在“Workfile”页面:点击“Generate” ,输入“w1=1/x”OK ;同样的输入“w2=1/x2”“w3=1/sqr(x)”;2、在“Equation”页面:点击“Estimate Equation”,输入“y c x”,点击“
13、weighted”,输入“w1”,出现如图 6:用权数 的结果t1Dependent Variable: YMethod: Least SquaresDate: 10/22/10 Time: 00:13Sample: 1 28Included observations: 28Weighting series: W1Variable Coefficient Std. Error t-Statistic Prob. C 5.988351 6.403392 0.935184 0.3583X 0.108606 0.008155 13.31734 0.0000Weighted StatisticsR-s
14、quared 0.032543 Mean dependent var 123.4060Adjusted R-squared -0.004667 S.D. dependent var 31.99659S.E. of regression 32.07117 Akaike info criterion 9.842541Sum squared resid 26742.56 Schwarz criterion 9.937699Log likelihood -135.7956 F-statistic 177.3515Durbin-Watson stat 1.465148 Prob(F-statistic)
15、 0.000000Unweighted StatisticsR-squared 0.853095 Mean dependent var 213.4650Adjusted R-squared 0.847445 S.D. dependent var 146.4895S.E. of regression 57.21632 Sum squared resid 85116.40Durbin-Watson stat 1.2614693、在“Equation”页面:点击“Estimate Equation”,输入“y c x”,点击“weighted”,输入“w2”,出现如图7:用权数 的结果t2Depen
16、dent Variable: YMethod: Least SquaresDate: 10/22/10 Time: 00:16Sample: 1 28Included observations: 28Weighting series: W2Variable Coefficient Std. Error t-Statistic Prob. C 6.496703 3.486526 1.863374 0.0737X 0.106892 0.010991 9.725260 0.0000Weighted StatisticsR-squared 0.922715 Mean dependent var 67.
17、92129Adjusted R-squared 0.919743 S.D. dependent var 75.51929S.E. of regression 21.39439 Akaike info criterion 9.032884Sum squared resid 11900.72 Schwarz criterion 9.128041Log likelihood -124.4604 F-statistic 94.58068Durbin-Watson stat 1.905670 Prob(F-statistic) 0.000000Unweighted StatisticsR-squared
18、 0.854182 Mean dependent var 213.4650Adjusted R-squared 0.848573 S.D. dependent var 146.4895S.E. of regression 57.00434 Sum squared resid 84486.88Durbin-Watson stat 1.2422124、在“Equation”页面:点击“Estimate Equation”,输入“y c x”,点击“weighted”,输入“w3”,出现如图8:用权数 的结果t3Dependent Variable: YMethod: Least SquaresDa
19、te: 10/22/10 Time: 00:17Sample: 1 28Included observations: 28Weighting series: W3Variable Coefficient Std. Error t-Statistic Prob. C 8.640341 11.18733 0.772333 0.4469X 0.106153 0.007746 13.70473 0.0000Weighted StatisticsR-squared 0.611552 Mean dependent var 165.8420Adjusted R-squared 0.596612 S.D. d
20、ependent var 67.13044S.E. of regression 42.63646 Akaike info criterion 10.41205Sum squared resid 47264.56 Schwarz criterion 10.50720Log likelihood -143.7686 F-statistic 187.8197Durbin-Watson stat 1.275429 Prob(F-statistic) 0.000000Unweighted StatisticsR-squared 0.854453 Mean dependent var 213.4650Ad
21、justed R-squared 0.848855 S.D. dependent var 146.4895S.E. of regression 56.95121 Sum squared resid 84329.44Durbin-Watson stat 1.233545经估计检验,发现用权数 , 的结果,其可决系数反而减小;只有用权数 的效果t1t3 t2最好,可决系数增大。 用权数 的结果t2Dependent Variable: YMethod: Least SquaresDate: 10/22/10 Time: 00:16Sample: 1 28Included observations:
22、 28Weighting series: W2Variable Coefficient Std. Error t-Statistic Prob. C 6.496703 3.486526 1.863374 0.0737X 0.106892 0.010991 9.725260 0.0000Weighted StatisticsR-squared 0.922715 Mean dependent var 67.92129Adjusted R-squared 0.919743 S.D. dependent var 75.51929S.E. of regression 21.39439 Akaike in
23、fo criterion 9.032884Sum squared resid 11900.72 Schwarz criterion 9.128041Log likelihood -124.4604 F-statistic 94.58068Durbin-Watson stat 1.905670 Prob(F-statistic) 0.000000Unweighted StatisticsR-squared 0.854182 Mean dependent var 213.4650Adjusted R-squared 0.848573 S.D. dependent var 146.4895S.E.
24、of regression 57.00434 Sum squared resid 84486.88Durbin-Watson stat 1.242212用权数 的估计结果为: = 6.496703 + 0.106892t2iYiX(1.863374) (9.725260)=0.922715 DW=1.905670 F=94.580682R括号中的数据为 t 统计量值。由上可以看出,运用加权最小二乘法消除了异方差后,参数 的 t 检验显著,可决系数提2高了不少,F 检验也显著,并说明销售收入每增长 1 元,销售利润平均增长 0.106892 元。四、实践结果报告: 1、用图示法初步判断是否存在异
25、方差:被解释变量 Y 随着解释变量 X 的增大而逐渐分散,离散程度越来越大;同样的,残差平方 对解释变量 X 的散点图主要分布在图形中的下三2ie角部分,大致看出残差平方 随 的变动呈增大趋势。因此,模型很可能存在异方差。2iiX但是否确实存在异方差还应该通过更近一步的检验。再用 White 检验异方差:因为 n = 6.270612 (2)=5.99147 ,所以拒绝原假2R5.0设,不拒绝备择假设,这表明模型存在异方差。2、用加权最小二乘法修正异方差:发现用权数 的效果最好,则估计结果为: t2= 6.496703 + 0.106892iY iX(1.863374) (9.725260)=
26、0.922715 DW=1.905670 F=94.580682R括号中的数据为 t 统计量值。由上可以看出, =0.922715,拟合程度较好。在给定 =0.0 时,t=9.725260 2 =2.056 ,拒绝原假设,说明销售收入对销售利润有显著性影响。)6(025.tF=94.58068 = 4.23 , 表明方程整体显著。)6,21(F05.运用加权最小二乘法后,参数 的 t 检验显著,可决系数提高了不少,F 检验也显著,并2说明销售收入每增长 1 元,销售利润平均增长 0.106892 元。3、再用 White 检验修正后的模型是否还存在异方差:White检验结果White Hete
27、roskedasticity Test:F-statistic 3.144597 Probability 0.060509Obs*R-squared 5.628058 Probability 0.059963Test Equation:Dependent Variable: STD_RESID2Method: Least SquaresDate: 10/22/10 Time: 00:17Sample: 1 28Included observations: 28Variable Coefficient Std. Error t-Statistic Prob. C 1927.346 675.224
28、6 2.854378 0.0085X -1.456613 0.734838 -1.982223 0.0585X2 0.000245 0.000154 1.586342 0.1252R-squared 0.201002 Mean dependent var 425.0258Adjusted R-squared 0.137082 S.D. dependent var 1198.210S.E. of regression 1113.057 Akaike info criterion 16.96857Sum squared resid 30972414 Schwarz criterion 17.11130Log likelihood -234.5599 F-statistic 3.144597Durbin-Watson stat 2.559506 Prob(F-statistic) 0.060509由上看出,n = 5.628058 ,由 White 检验知,在 =0,05 下,查 分布表,得临界值:2R2(2)=5.99147。5.0比较计算的 统计量与临界值,因为 n = 5.628058 (2)=5.99147 ,所以接2R5.0受原假设,这说明修正后的模型不存在异方差。教师评阅意见: