1、 1第五章练习题及参考解答5.1 设消费函数为iiii uXY321式中, 为消费支出; 为个人可支配收入; 为个人的流动资产; 为随机误差iYiX2 i iu项,并且 (其中 为常数) 。试回答以下问题:2)(,0)(iiiuVarE2(1)选用适当的变换修正异方差,要求写出变换过程;(2)写出修正异方差后的参数估计量的表达式。【练习题 5.1 参考解答】(1)因为 ,所以取 ,用 乘给定模型两端,得2()iifX21iiWX2i31222i iiiYu上述模型的随机误差项的方差为一固定常数,即22()()i iiuVararuX(2)根据加权最小二乘法,可得修正异方差后的参数估计式为*12
2、3YX2*323232*2iii iiiiii iiWyxWyxx*2*232233 33iii iiiiii iiyxyxx其中2232*23, ,i i iWXXWY*2233ii ii ixxy25.2 对于第三章练习题 3.3 家庭书刊消费与家庭收入及户主受教育年数关系的分析,进一步作以下分析:1)判断模型 是否存在异方差性。123iiiYXTu2。如果模型存在异方差性,应怎样去估计其参数?3)对比分析的结果,你对第三章练习题 3.3 的结论有什么评价?【练习题 5.2 参考解答】建议学生自己独立完成5.3 表 5.8 是 2007 年我国各地区农村居民家庭人均纯收入与家庭人均生活消费
3、支出的数据表 5.8 各地区农村居民家庭人均纯收入与家庭人均生活消费支出的数据地 区 家庭人均纯收 入 家庭生活消费 支出 地 区 家庭人均纯收 入 家庭生活消费 支出北 京 9439.63 6399.27 湖 北 3997.48 3090天 津 7010.06 3538.31 湖 南 3904.2 3377.38河 北 4293.43 2786.77 广 东 5624.04 4202.32山 西 3665.66 2682.57 广 西 3224.05 2747.47内蒙古 3953.1 3256.15 海 南 3791.37 2556.56辽 宁 4773.43 3368.16 重 庆 35
4、09.29 2526.7吉 林 4191.34 3065.44 四 川 3546.69 2747.27黑龙江 4132.29 3117.44 贵 州 2373.99 1913.71上 海 10144.62 8844.88 云 南 2634.09 2637.18江 苏 6561.01 4786.15 西 藏 2788.2 2217.62浙 江 8265.15 6801.6 陕 西 2644.69 2559.59安 徽 3556.27 2754.04 甘 肃 2328.92 2017.21福 建 5467.08 4053.47 青 海 2683.78 2446.5江 西 4044.7 2994.4
5、9 宁 夏 3180.84 2528.76山 东 4985.34 3621.57 新 疆 3182.97 2350.58河 南 3851.6 2676.41数据来源: 中国统计年鉴 2008 (1)试根据上述数据建立 2007 年我国农村居民家庭人均消费支出对人均纯收入的线性回归模型。(2)选用适当方法检验模型是否在异方差,并说明存在异方差的理由。(3)如果存在异方差,用适当方法加以修正。【练习题 5.3 参考解答】解: (1)建立样本回归函数。179.6+0.15YX3(0.08709)(15.74411)20.8956, F=247.869R(2)利用 White 方法检验异方差,则 Wh
6、ite 检验结果见下表:Heteroskedasticity Test: WhiteF-statistic 7.194463 Prob. F(2,28) 0.0030Obs*R-squared 10.52295 Prob. Chi-Square(2) 0.0052Scaled explained SS 30.08105 Prob. Chi-Square(2) 0.0000由上述结果可知,该模型存在异方差。分析该模型存在异方差的理由是,从数据可以看出,一是截面数据;二是各省市经济发展不平衡,使得一些省市农村居民收入高出其它省市很多,如上海市、北京市、天津市和浙江省等。而有的省就很低,如甘肃省、贵
7、州省、云南省和陕西省等。(3)用加权最小二乘法修正异方差,分别选择权数 ,经211,2,3wwXX过试算,认为用权数 的效果最好。结果如下:3w结果为4278.40.561(3)(7).,.92YXRF5.4 表 5.9 的数据是 2011 年各地区建筑业总产值(X )和建筑业企业利润总额(Y ) 。表 5.9 各地区建筑业总产值(X)和建筑业企业利润总额(Y)(单位:亿元)地 区 建筑业总产值X 建筑业企业利润总额Y地 区 建筑业总产值X 建筑业企业利润总额Y北 京 6046.22 216.78 湖 北 5586.45 231.46 天 津 2986.45 79.54 湖 南 3915.02
8、 124.77 河 北 3972.66 127.00 广 东 5774.01 251.69 山 西 2324.91 49.22 广 西 1553.07 26.24 内蒙古 1394.68 105.37 海 南 255.47 6.44 辽 宁 6217.52 224.31 重 庆 3328.83 155.34 吉 林 1626.65 89.03 四 川 5256.65 177.19 黑龙江 2029.16 58.92 贵 州 824.72 14.39 上 海 4586.2.8 166.69 云 南 1868.40 61.88 江 苏 15122.85 595.87 西 藏 124.47 5.75
9、 浙 江 14907.42 411.57 陕 西 3216.63 104.38 安 徽 3597.26 127.12 甘 肃 925.84 29.33 福 建 3692.62 126.47 青 海 319.42 8.35 江 西 2095.47 62.37 宁 夏 427.92 11.25 山 东 6482.90 291.77 新 疆 1320.37 27.60 河 南 5279.36 200.09 数据来源:国家统计局网站根据样本资料建立回归模型,分析建筑业企业利润总额与建筑业总产值的关系,并判断模型是否存在异方差,如果有异方差,选用最简单的方法加以修正。【练习题 5.4 参考解答】建议学生
10、自己独立完成5.5 为研究居民收入与交通通讯消费支出的关系,取得了 2005 年中国各省市区城镇居民人均年可支配收入(X)与人均年交通通讯消费支出(Y )的数据:表 5.10 2005 年中国各省市区城镇居民人均可支配收入与交通通讯消费支出(单位:元)地区 人均年可支配收入(X)人均年交通通讯消费支出(Y)地区 人均年可支配收入(X)人均年交通通讯消费支出(Y)北京 17652.95 1943.48 湖北 8785.94 649.87天津 12638.55 988.01 湖南 9523.97 801.27河北 9107.09 772.34 广东 14769.94 2333.05山西 8913.
11、91 604.35 广西 9286.7 703.395内蒙 9136.79 755.51 海南 8123.94 728.29辽宁 9107.55 744.02 重庆 10243.46 929.92吉林 8690.62 733.5 四川 8385.96 827.66黑龙江 8272.51 596.97 贵州 8151.13 625.44上海 18645.03 1983.72 云南 9265.9 930.59江苏 12318.57 1050.88 西藏 9431.18 1309.95浙江 16293.77 2097.41 陕西 8272.02 630.16安徽 8470.68 676.86 甘肃
12、8086.82 638.63福建 12321.31 1048.71 青海 8057.85 691.25江西 8619.66 567.52 宁夏 8093.64 705.69山东 10744.79 902.32 新疆 7990.15 757.09河南 8667.97 636.571.作人均交通通讯消费支出对人均可支配收入的线性回归,并检验模型是否存在什么问题。2.用两种以上的方法检验模型是否存在异方差性。【练习题 5.5 参考解答】1.回归结果2.检验异方差性1)Goldfeld-Quanadt 检验将样本数据 X 递增排序: “Procs/Sort Series/输入”X”/Ascending
13、/ok,去掉中间 7 个数据, 分为”1-12”和”20-31”两个样本分别回归样本区间 1-12 的回归21503.4ie210753ie6F 统计量: 2107532.65.4ie,查 F 分布表0.50.5(,)98,表明不存在异方差.262.2)White 检验:点 Wiew/Residual Tests/white heteroskedasticity(no cross terms)结果为220.51.493().91nR由于 ,同时 p 值为 0.4642,表明无异方差性. 55.6 表 5.11 为 1978 年2011 年四川省农村人均纯收入、人均生活费支出、商品零售价格指数的
14、数据。表 5.11 四川省农村人均纯收入、人均生活费支出、商品零售价格指数时间农村人均纯收入X/元农村人均生活消费支出Y/元商品零售价格指数 时间农村人均纯收入X/元农村人均生活消费支出Y/元商品零售价格指数1978 127.10 120.30 100.0 1995 1158.29 1061.15 356.1 1979 155.90 142.10 102.0 1996 1453.42 1349.88 377.8 1980 187.90 159.50 108.1 1997 1680.69 1440.48 380.8 1981 221.00 184.00 110.7 1998 1789.17 14
15、40.77 370.9 1982 256.00 208.23 112.8 1999 1843.47 1426.06 359.8 1983 258.40 231.12 114.5 2000 1903.60 1489.55 354.4 1984 286.80 251.83 117.7 2001 1986.99 1497.52 351.6 1985 315.07 276.25 128.1 2002 2107.66 1591.35 347.0 1986 337.94 310.92 135.8 2003 2229.86 1747.02 346.7 1987 369.46 348.32 145.7 200
16、4 2580.28 2010.88 356.4 1988 448.85 426.47 172.7 2005 2802.78 2274.17 359.4 1989 494.07 473.59 203.4 2006 3002.38 2395.04 362.9 1990 557.76 509.16 207.7 2007 3546.69 2747.27 376.7 71991 590.21 552.39 213.7 2008 4121.21 3127.94 398.9 1992 634.31 569.46 225.2 2009 4462.05 4141.40 100.4 1993 698.27 647
17、.43 254.9 2010 5139.52 3897.53 103.3 1994 946.33 904.28 310.2 2011 6128.55 4103.92 105.2 资料来源:中经网统计数据库1) 如果不考虑价格变动因素,建立回归模型并检验是否存在异方差,如果存在异方差,选用适当方法进行修正。2)如果考虑价格变动因素,对异方差性的修正应该怎样进行?3)对比以上两个回归模型,你有什么体会?【练习题 5.6 参考解答】建议学生自己独立完成5.7 检验异方差性的基本思想,是检验随机误差项的方差与某解释变量 X 的变动是否相关。统计学中的 Spearman 等级相关系数也可以度量变量间的相
18、关性,是否能够利用Spearman 等级相关系数去检验随机误差项的方差(可用残差的绝对值代表)与解释变量 X 是否存在异方差性呢?如果可以,用 Spearman 等级相关系数检验本章案例中是否存在异方差,并将其检验结果与其他检验方法相比较。【练习题 5.7 参考解答】Spearman 检验计算公式为 216()isdrn其中, 为第 i 个现象的两种不同特性样本的等级之差,n 为观测现象的等级个数。id设模型为 ,用 Spearman 检验检验异方差的步骤如下12iiYXu1) 做 Y 对 X 的回归,得到残差 e 。2) 求残差 e 的绝对值 ,将 X 按递升或递降划分等级并与 对应的等级相
19、减,即得e到 。id3) 将 和 n 代入计算 ,根据相关系数的变动范围,可初步判断是否存在异方差。i sr4)在 ( 为总体等级相关系数)成立下,并且 , 的显著性可通过0:H 8nsr如下服从自由度为 的 t 分布的统计量得到检验,即2821srnt。给定显著性水平 ,查 t 分布表,得临界值 ,若 ,则拒绝原假2()t2()tn设,说明序列存在异方差。否则接受原假设,说明不存在异方差。由本章案例回归估计后得到残差序列 ,取 的绝对值 并得到其等级数。同样,将ieiie解释变量 取等级数。计算对应的 的等级数与 的等级数之差 ,将其平方得到 。Xi Xid2id具体计算结果见下表。等级相关
20、系数检验 的计算结果2ide |e| |e|的等级 X X的等级 d d21422.6203 1422.6203 1 1013.3 1 0 0-218.5335 218.5335 15 315 16 -1 1943.5060 943.5060 2 103 19 -17 289-631.4731 631.4731 8 463.7 7 1 1-390.0064 390.0064 13 379.3 11 2 4-606.3668 606.3668 10 518.4 4 6 36-41.9105 41.9105 21 302.6 17 4 16-55.4119 55.4119 20 371 12 8
21、64-481.1432 481.1432 11 419.9 9 2 4-163.5539 163.5539 17 345.9 14 3 9816.4974 816.4974 3 709.2 2 1 1-436.3170 436.3170 12 339.9 15 -3 9-639.1758 639.1758 7 508.5 5 2 4-204.6151 204.6151 16 438.6 8 8 64-365.7835 365.7835 14 620.1 3 11 121624.0576 624.0576 9 149.8 18 -9 81-76.8522 76.8522 19 346.7 13
22、6 36-700.1820 700.1820 4 488.4 6 -2 4653.4999 653.4999 6 82.9 21 -15 225679.2629 679.2629 5 88.9 20 -15 225-128.1187 128.1187 18 402.4 10 8 64将表中计算的 代入公式,计算得 。根据相关系数的规则,可判断 与2id0.981srie解释变量 高度相关,所以,初步认为模型存在异方差。进一步,将有关数据代入计算得X,给定显著性水平 ,查 t 分布表得临界值 。比较 t31.47t.50.25(19).3t值与临界值,显然, ,所以,拒绝原假设,表明该模型确0.231.47(19).3tt实存在异方差。检验结果与其他检验方法一致。