1、第二章 一元线性回归2.14 解答:(1)散点图为:(2)x 与 y 之间大致呈线性关系。(3)设回归方程为 01x=127()niixy01031yx7yx可 得 回 归 方 程 为(4)22ni=1()-i2n01i=1()-2iyx=2223 ( ( +7) ) ( -( +7) ) ( 0-( 1+73) )( -( 4) ) ( ( 15) )169036/11306.(5)由于211(,)xNL:112/xxt服从自由度为 n-2 的 t 分布。因而1/2()|()1xLPtn也即: =1/21/2( )xxpttLL可得 1 1195%33 的 置 信 度 为 的 置 信 区 间
2、 为 ( 7-.5, 7+2.5)即为:(2.49,11.5) 200()(,xNnL:00221()1()xxtnLnL服从自由度为 n-2 的 t 分布。因而0/2|()11()xPtnnL即2 20/0/()1()( 1x xpt tnL 可得 195%7.,5的 置 信 度 为 的 置 信 区 间 为 ( )2(6)x 与 y 的决定系数221()490/6.817niiiiyr(7)ANOVAx平方和 df 均方 F 显著性(组合) 9.000 2 4.500 9.000 .100加权的 8.167 1 8.167 16.333 .056组间线性项偏差 .833 1 .833 1.6
3、67 .326组内 1.000 2 .500总数 10.000 4由于 ,拒绝 ,说明回归方程显著,x 与 y 有显著的线性关系。(13)F0H(8) 其中112/xxLt 22211()nni iiey 703.613/2.5t/236t接受原假设 认为 显著不为 0,因变量 y 对自变量 x 的一元线性回归成立。01:,H1(9)相关系数 121()()nii xyiniiiixyLr= 700.9463小于表中 的相应值同时大于表中 的相应值, x 与 y 有显著的线性关系.r1%5%(10) 序号 xyye1 1 10 6 42 2 10 13 -33 3 20 20 04 4 20
4、27 -75 5 40 34 6残差图为:从图上看,残差是围绕 e=0 随机波动,从而模型的基本假定是满足的。(11)当广告费 =4.2 万元时,销售收入0x028.4y万 元 , 95%置 信 度 为 的 置 信 区 间,即(17.1,39.7)y2近 似 为2.15 解答:(1) 散点图为:4(2)x 与 y 之间大致呈线性关系。(3)设回归方程为 01x=12(26371)0.364584()niixy01.8503672.1yxyx可 得 回 归 方 程 为(4) 22ni=1()-i2n01i=1()-2iyx5=0.23050.4801(5) 由于211(,)xNL:112/xxt
5、服从自由度为 n-2 的 t 分布。因而1/2()|()1xLPtn也即: =1/21/2( )xxpttLL可得 195%的 置 信 度 为 的 置 信 区 间 为0.481/27600.481/29760( 0.36-. , .3+.6)即为:(0.0028,0.0044) 200()(,xNnL:00221()1()xxtnLnL服从自由度为 n-2 的 t 分布。因而0/2|()11()xPtnnL即2 20/0/()1()( 1x xpt tnL 6可得 195%0.3567,. 的 置 信 度 为 的 置 信 区 间 为 ( )(6)x 与 y 的决定系数 =0.908221()n
6、iiiiyr.81(7) ANOVAx平方和 df 均方 F 显著性(组合) 1231497.500 7 175928.214 5.302 .168加权的 1168713.036 1 1168713.036 35.222 .027组间线性项偏差 62784.464 6 10464.077 .315 .885组内 66362.500 2 33181.250总数 1297860.000 9由于 ,拒绝 ,说明回归方程显著,x 与 y 有显著的线性关系。(19)F0H(8) 其中112/xxLt 22211()nni iiey 0.369780.54241/2.5t/28t接受原假设 认为 显著不为
7、 0,因变量 y 对自变量 x 的一元线性回归成立。01:,H1(9) 相关系数 121()()nii xyiniiiixyLr7= 46530.94812978.2小于表中 的相应值同时大于表中 的相应值, x 与 y 有显著的线性关系.r%(10)序号 xyye1 825 35 3.0768 0.42322 215 1 0.8808 0.11923 1070 4 3.9588 0.04124 550 2 2.0868 -0.08685 480 1 1.8348 -0.83486 920 3 3.4188 -0.41887 1350 4.5 4.9688 -0.46688 325 1.5 1
8、.2768 0.22329 670 3 2.5188 0.481210 1215 5 4.4808 0.5192从图上看,残差是围绕 e=0 随机波动,从而模型的基本假定是满足的。(11) 0 013.7x新 保 单 时 , 需 要 加 班 的 时 间 为 y小 时 。(12) ,/20()1y tnh的 置 信 概 率 为 -的 置 信 区 间 精 确 为即为(2.7,4.7)近似置信区间为: ,即(2.74,4.66)02y(13)可得置信水平为 为 ,即为1-的 置 信 区 间 0/20()ytnh8(3.33,4.07).2.16 (1)散点图为:可以用直线回归描述 y 与 x 之间的
9、关系.(2)回归方程为: 1269314(3) 9从图上可看出,检验误差项服从正态分布。第三章 多元线性回归3.11 解:(1)用 SPSS 算出 y,x1,x2,x3 相关系数矩阵:相关性y x1 x2 x3y 1.000 .556 .731 .724x1 .556 1.000 .113 .398x2 .731 .113 1.000 .547Pearson 相关性x3 .724 .398 .547 1.000y . .048 .008 .009x1 .048 . .378 .127x2 .008 .378 . .051x3 .009 .127 .051 .10y 10 10 10 10x1
10、10 10 10 10x2 10 10 10 10Nx3 10 10 10 10所以 =r(1.0000.5560.7310.7240.5561.0000.1130.3980.7310.1131.0000.5470.7240.3980.5471.000)(2) 所以三元线性回归方程为 347.120.7154.328 xxy(3)由于决定系数R方=0.708 R=0.898较大所以认为拟合度较高(4)Anovab模型 平方和 df 均方 F Sig.回归 13655.370 3 4551.790 8.283 .015a1残差 3297.130 6 549.522系数 a非标准化系数标准系数 B
11、 的 95.0% 置信区间 相关性 共线性统计量模型B 标准 误差 试用版 t Sig. 下限 上限 零阶 偏 部分 容差 VIF(常量) -348.280176.459 -1.974 .096 -780.06083.500x1 3.754 1.933 .385 1.942 .100 -.977 8.485 .556 .621 .350 .825 1.211x2 7.101 2.880 .535 2.465 .049 .053 14.149 .731 .709 .444 .687 1.4551x3 12.447 10.569 .277 1.178 .284 -13.41538.310 .724
12、 .433 .212 .586 1.708a. 因变量: y模型汇总更改统计量模型R R 方 调整 R 方标准 估计的误差 R 方更改 F 更改 df1 df2 Sig. F 更改1 .898a .806 .708 23.44188 .806 8.283 3 6 .015a. 预测变量: (常量), x3, x1, x2。11总计 16952.500 9a. 预测变量: (常量), x3, x1, x2。b. 因变量: y因为 F=8.283 P=0.0150.05 所以认为回归方程在整体上拟合的好(5)系数 a非标准化系数 标准系数B 的 95.0% 置信区间 相关性 共线性统计量模型B 标
13、准 误差 试用版 t Sig. 下限 上限 零阶 偏 部分 容差 VIF(常量)-348.280 176.459 -1.974 .096 -780.060 83.500x1 3.754 1.933 .385 1.942 .100 -.977 8.485 .556 .621 .350 .825 1.211x2 7.101 2.880 .535 2.465 .049 .053 14.149 .731 .709 .444 .687 1.4551x3 12.447 10.569 .277 1.178 .284 -13.415 38.310 .724 .433 .212 .586 1.708a. 因变量
14、: y(6)可以看到 P 值最大的是 x3 为 0.284,所以 x3 的回归系数没有通过显著检验,应去除。去除 x3 后作 F 检验,得:Anovab模型 平方和 df 均方 F Sig.回归 12893.199 2 6446.600 11.117 .007a残差 4059.301 7 579.9001总计 16952.500 9a. 预测变量: (常量), x2, x1。b. 因变量: y由表知通过 F 检验继续做回归系数检验系数 a12非标准化系数 标准系数 B 的 95.0% 置信区间 相关性共线性统计量模型B 标准 误差 试用版 t Sig. 下限 上限 零阶 偏 部分 容差 VIF
15、(常量) -459.624 153.058 -3.003 .020 -821.547 -97.700x1 4.676 1.816 .479 2.575 .037 .381 8.970 .556 .697 .476 .987 1.0131x2 8.971 2.468 .676 3.634 .008 3.134 14.808 .731 .808 .672 .987 1.013a. 因变量: y此时,我们发现 x1,x2 的显著性大大提高。(7)x1:(-0.997,8.485) x2:(0.053,14.149) x3:(-13.415,38.310)(8) * 327.053.18.0 xxy(
16、9) 残差统计量 a极小值 极大值 均值 标准 偏差 N预测值 175.4748 292.5545 231.5000 38.95206 10标准 预测值 -1.438 1.567 .000 1.000 10预测值的标准误差 10.466 20.191 14.526 3.127 10调整的预测值 188.3515 318.1067 240.1835 49.83914 10残差 -25.19759 33.22549 .00000 19.14022 10标准 残差 -1.075 1.417 .000 .816 10Student 化 残差 -2.116 1.754 -.123 1.188 10已删除
17、的残差 -97.61523 50.88274 -8.68348 43.43220 10Student 化 已删除的残差 -3.832 2.294 -.255 1.658 10Mahal。 距离 .894 5.777 2.700 1.555 10Cook 的距离 .000 3.216 .486 .976 10居中杠杆值 .099 .642 .300 .173 10a. 因变量: y所以置信区间为(175.4748,292.5545)(10)由于 x3 的回归系数显著性检验未通过,所以居民非商品支出对货运总量影响不大,但是回归方程整体对数据拟合较好3.12 解:在固定第二产业增加值,考虑第三产业增
18、加值影响的情况下,第一产业每增加一个单位,GDP 就增加 0.607 个单位。在固定第一产业增加值,考虑第三产业增加值影响的情况下,第二产业每增加一个单位,GDP 就增加 1.709 个单位。13第四章 违背基本假设的情况4.9 解:系数 a非标准化系数 标准系数模型B 标准 误差 试用版 t Sig.(常量) -.831 .442 -1.882 .0651x .004 .000 .839 11.030 .000a. 因变量: y由 SPSS 计算得: =-0.831+0.004xy残差散点图为:(2)由残差散点图可知存在异方差性再用等级相关系数分析:14相关系数x t相关系数 1.000 .
19、318*Sig.(双侧) . .021xN 53 53相关系数 .318* 1.000Sig.(双侧) .021 .Spearman 的 rhotN 53 53*. 在置信度(双测)为 0.05 时,相关性是显著的。P=0.021 所以方差与自变量的相关性是显著的。(3)模型描述因变量 y自变量 1 x源 x权重幂值 1.500模型: MOD_1.M=1.5 时可以建立最优权函数,此时得到:ANOVA平方和 df 均方 F Sig.回归 .006 1 .006 98.604 .000残差 .003 51 .000总计 .009 52系数未标准化系数 标准化系数B 标准误 试用版 标准误 t S
20、ig.(常数) -.683 .298 -2.296 .026x .004 .000 .812 .082 9.930 .000所以: -0.683+0.004xy15(4)系数 a非标准化系数 标准系数模型B 标准 误差 试用版 t Sig.(常量) .582 .130 4.481 .0001x .001 .000 .805 9.699 .000a. 因变量: yy4.13 解:(1)系数 a非标准化系数 标准系数模型B 标准 误差 试用版 t Sig.(常量) -1.435 .242 -5.930 .0001x .176 .002 .999 107.928 .00016系数 a模型 非标准化系
21、数 标准系数t Sig.B 标准 误差 试用版1 (常量) -1.435 .242 -5.930 .000x .176 .002 .999 107.928 .000a. 因变量: y=-1.435+0.176x(2) 模型汇总 b模型R R 方 调整 R 方标准 估计的误差 Durbin-Watson1 .999a .998 .998 .09744 .663a. 预测变量: (常量), x。b. 因变量: yDW=0.663 查 DW 分布表知: =0.95Ld所以 DW ,故误差项存在正相关。Ld残差图为:17随 t 的变化逐次变化并不频繁的改变符号,说明误差项存在正相关。e(3) =1-0
22、.5*DW=0.6685 计算得:Y x7.39 44.907.65 45.806.84 40.698.00 48.507.79 46.858.26 49.457.96 48.478.28 50.047.90 48.038.49 51.177.88 47.268.77 52.338.93 52.699.32 54.959.29 55.549.48 56.779.38 55.839.67 58.009.90 59.22模型汇总 b模型R R 方 调整 R 方标准 估计的误差 Durbin-Watson1 .996a .993 .993 .07395 1.344a. 预测变量: (常量), xx。
23、b. 因变量: yy系数 a非标准化系数 标准系数模型B 标准 误差 试用版 t Sig.1 (常量) -.303 .180 -1.684 .11018xx .173 .004 .996 49.011 .000a. 因变量: yy得回归方程 =-0.303+0.173xy即: =-0.303+0.6685 +0.173( 0.6685 )t 1t tx1tx(4)模型汇总 b模型R R 方 调整 R 方标准 估计的误差 Durbin-Watson1 .978a .957 .955 .07449 1.480a. 预测变量: (常量), x3。b. 因变量: y3系数 a非标准化系数 标准系数模型
24、B 标准 误差 试用版 t Sig.(常量) .033 .026 1.273 .2201x3 .161 .008 .978 19.528 .000a. 因变量: y3 =0.033+0.161tytx即: =0.033+ +0.161( - )t1tyt1(5)差分法的 DW 值最大为 1.48 消除相关性最彻底,但是迭代法的 值最小为0.07395,拟合的较好。4.14 解:(1)模型汇总 b模型R R 方 调整 R 方标准 估计的误差 Durbin-Watson1 .541a .293 .264 329.69302 .745a. 预测变量: (常量), x2, x1。19模型汇总 b模型R
25、 R 方 调整 R 方标准 估计的误差 Durbin-Watson1 .541a .293 .264 329.69302 .745a. 预测变量: (常量), x2, x1。b. 因变量: y系数 a非标准化系数 标准系数模型B 标准 误差 试用版 t Sig.(常量) -574.062 349.271 -1.644 .107x1 191.098 73.309 .345 2.607 .0121x2 2.045 .911 .297 2.246 .029a. 因变量: y回归方程为: =-574.062+191.098x1+2.045x2DW=0.745Dl 所以误差项存在正相关残差图为:20(2
26、) =1-0.5*DW=0.6275模型汇总 b模型R R 方 调整 R 方标准 估计的误差 Durbin-Watson1 .688a .474 .452 257.67064 1.716a. 预测变量: (常量), x22, x12。b. 因变量: y2系数 a非标准化系数 标准系数模型B 标准 误差 试用版 t Sig.(常量) -179.668 90.337 -1.989 .052x12 211.770 47.778 .522 4.432 .0001x22 1.434 .628 .269 2.283 .027a. 因变量: y2此时得方程: =-179.668+211.77x1+1.434
27、x2ty所以回归方程为: )2675.0(43.1)6275.01(.2675.08.179 1?1 tttttt xxxxy(3)模型汇总 b模型R R 方 调整 R 方标准 估计的误差 Durbin-Watson1 .715a .511 .490 283.79102 2.042a. 预测变量: (常量), x23, x13。b. 因变量: y321系数 a非标准化系数 标准系数模型B 标准 误差 试用版 t Sig.(常量) 7.698 39.754 .194 .847x13 209.891 44.143 .544 4.755 .0001x23 1.399 .583 .274 2.400
28、.020a. 因变量: y3此时得方程: 239.18.2096.7 xyt 所以回归方程为: )(.)( 1tttt x第五章 自变量选择与逐步回归5.9 后退法:输出结果系数 a非标准化系数 标准系数模型B 标准 误差 试用版 t Sig.(常量) 1438.120 2252.472 .638 .533农业 x1 -.626 .168 -1.098 -3.720 .002工业 x2 -.328 .207 -1.352 -1.587 .135建筑业 x3 -.383 .555 -.251 -.691 .501人口 x4 -.004 .025 -.014 -.161 .875最终消费 x5 .
29、672 .130 3.710 5.178 .0001受灾面积 x6 -.006 .008 -.015 -.695 .499(常量) 1079.754 299.759 3.602 .003农业 x1 -.642 .130 -1.126 -4.925 .000工业 x2 -.303 .131 -1.249 -2.314 .035建筑业 x3 -.402 .525 -.263 -.765 .456最终消费 x5 .658 .095 3.636 6.905 .0002受灾面积 x6 -.006 .007 -.017 -.849 .409(常量) 1083.150 295.816 3.662 .002农
30、业 x1 -.624 .127 -1.095 -4.931 .000工业 x2 -.373 .093 -1.535 -3.998 .001最终消费 x5 .657 .094 3.627 6.981 .0003受灾面积 x6 -.005 .007 -.015 -.758 .46022(常量) 874.604 106.869 8.184 .000农业 x1 -.611 .124 -1.073 -4.936 .000工业 x2 -.353 .088 -1.454 -3.994 .0014最终消费 x5 .637 .089 3.516 7.142 .000a. 因变量: 财政收入 yAnovae模型
31、平方和 df 均方 F Sig.回归 1.365E8 6 2.274E7 602.127 .000a残差 528793.319 14 37770.9511总计 1.370E8 20回归 1.365E8 5 2.729E7 772.734 .000b残差 529767.852 15 35317.8572总计 1.370E8 20回归 1.364E8 4 3.411E7 991.468 .000c残差 550440.103 16 34402.5063总计 1.370E8 20回归 1.364E8 3 4.547E7 1355.753 .000d残差 570180.931 17 33540.0554
32、总计 1.370E8 20a. 预测变量: (常量 ), 受灾面积 x6, 建筑业 x3, 人口 x4, 农业 x1, 最终消费 x5, 工业 x2。b. 预测变量: (常量), 受灾面积 x6, 建筑业 x3, 农业 x1, 最终消费 x5, 工业 x2。c. 预测变量: (常量 ), 受灾面积 x6, 农业 x1, 最终消费 x5, 工业 x2。d. 预测变量: (常量), 农业 x1, 最终消费 x5, 工业 x2。e. 因变量: 财政收入 y模型汇总更改统计量模型R R 方 调整 R 方标准 估计的误差 R 方更改 F 更改 df1 df2Sig. F 更改1 .998a .996 .
33、994 194.34750 .996 602.127 6 14 .0002 .998b .996 .995 187.93046 .000 .026 1 14 .8753 .998c .996 .995 185.47913 .000 .585 1 15 .4564 .998d .996 .995 183.13944 .000 .574 1 16 .460a. 预测变量: (常量 ), 受灾面积 x6, 建筑业 x3, 人口 x4, 农业 x1, 最终消费 x5, 工业 x2。b. 预测变量: (常量), 受灾面积 x6, 建筑业 x3, 农业 x1, 最终消费 x5, 工业 x2。c. 预测变量
34、: (常量 ), 受灾面积 x6, 农业 x1, 最终消费 x5, 工业 x2。23模型汇总模型R R 方 调整 R 方标准 估计的误差更改统计量R 方更改 F 更改 df1 df2Sig. F 更改1 .998a .996 .994 194.34750 .996 602.127 6 14 .0002 .998b .996 .995 187.93046 .000 .026 1 14 .8753 .998c .996 .995 185.47913 .000 .585 1 15 .4564 .998d .996 .995 183.13944 .000 .574 1 16 .460a. 预测变量:
35、(常量 ), 受灾面积 x6, 建筑业 x3, 人口 x4, 农业 x1, 最终消费 x5, 工业 x2。b. 预测变量: (常量), 受灾面积 x6, 建筑业 x3, 农业 x1, 最终消费 x5, 工业 x2。c. 预测变量: (常量 ), 受灾面积 x6, 农业 x1, 最终消费 x5, 工业 x2。d. 预测变量: (常量), 农业 x1, 最终消费 x5, 工业 x2。回归方程为: 125874.60.0.35.67yxx逐步回归法:输出结果Anovad模型 平方和 df 均方 F Sig.回归 1.354E8 1 1.354E8 1659.441 .000a残差 1550688.6
36、54 19 81615.1921总计 1.370E8 20回归 1.359E8 2 6.794E7 1106.637 .000b残差 1105088.003 18 61393.7782总计 1.370E8 20模型汇总更改统计量模型R R 方 调整 R 方标准 估计的误差 R 方更改 F 更改 df1 df2Sig. F 更改1 .994a .989 .988 285.68373 .989 1659.441 1 19 .0002 .996b .992 .991 247.77768 .003 7.258 1 18 .0153 .998c .996 .995 183.13944 .004 15.9
37、48 1 17 .001a. 预测变量: (常量 ), 最终消费 x5。b. 预测变量: (常量), 最终消费 x5, 农业 x1。c. 预测变量: (常量 ), 最终消费 x5, 农业 x1, 工业 x2。24回归 1.364E8 3 4.547E7 1355.753 .000c残差 570180.931 17 33540.0553总计 1.370E8 20a. 预测变量: (常量 ), 最终消费 x5。b. 预测变量: (常量), 最终消费 x5, 农业 x1。c. 预测变量: (常量 ), 最终消费 x5, 农业 x1, 工业 x2。d. 因变量: 财政收入 y系数 a非标准化系数 标准
38、系数 相关性模型B 标准 误差 试用版 t Sig. 零阶 偏 部分(常量) 710.372 90.891 7.816 .0001最终消费 x5.180 .004 .994 40.736 .000 .994 .994 .994(常量) 1011.912 136.901 7.392 .000最终消费 x5.311 .049 1.718 6.374 .000 .994 .832 .1352农业x1-.414 .154 -.726 -2.694 .015 .987 -.536 -.057(常量) 874.604 106.869 8.184 .000最终消费 x5.637 .089 3.516 7.1
39、42 .000 .994 .866 .112农业x1-.611 .124 -1.073 -4.936 .000 .987 -.767 -.0773工业x2-.353 .088 -1.454 -3.994 .001 .992 -.696 -.062a. 因变量: 财政收入 y回归方程为: 125874.60.30.5.637xx5.10(1)模型汇总模型R R 方 调整 R 方标准 估计的误差1 .908a .824 .736 625.88326252 .000b .000 .000 1217.15945a. 预测变量: (常量 ), x6, x3, x2, x4, x5。b. 预测变量: (常
40、量)Anovac模型 平方和 df 均方 F Sig.回归 1.830E7 5 3660971.683 9.346 .002a残差 3917298.522 10 391729.8521总计 2.222E7 15回归 .000 0 .000 . .b残差 2.222E7 15 1481477.1292总计 2.222E7 15a. 预测变量: (常量 ), x6, x3, x2, x4, x5。b. 预测变量: (常量)c. 因变量: y系数 a非标准化系数 标准系数模型B 标准 误差 试用版 t Sig.(常量) 5922.827 2504.315 2.365 .040x2 4.864 2.5
41、07 .677 1.940 .081x3 2.374 .842 .782 2.818 .018x4 -817.901 187.279 -1.156 -4.367 .001x5 14.539 147.078 .050 .099 .9231x6 -846.867 291.634 -.899 -2.904 .0162 (常量) 7542.938 304.290 24.789 .000a. 因变量: y回归方程为: 23456592.874.6.7481.90.3984.7xxx(2)后退法:输出结果模型汇总模型R R 方 调整 R 方标准 估计的误差1 .908a .824 .736 625.883
42、262 .907b .824 .759 597.0477626a. 预测变量: (常量 ), x6, x3, x2, x4, x5。b. 预测变量: (常量), x6, x3, x2, x4。Anovac模型 平方和 df 均方 F Sig.回归 1.830E7 5 3660971.683 9.346 .002a残差 3917298.522 10 391729.8521总计 2.222E7 15回归 1.830E7 4 4575257.669 12.835 .000b残差 3921126.262 11 356466.0242总计 2.222E7 15a. 预测变量: (常量 ), x6, x3
43、, x2, x4, x5。b. 预测变量: (常量), x6, x3, x2, x4。c. 因变量: y系数 a非标准化系数 标准系数模型B 标准 误差 试用版 t Sig.(常量) 5922.827 2504.315 2.365 .040x2 4.864 2.507 .677 1.940 .081x3 2.374 .842 .782 2.818 .018x4 -817.901 187.279 -1.156 -4.367 .001x5 14.539 147.078 .050 .099 .9231x6 -846.867 291.634 -.899 -2.904 .016(常量) 6007.320
44、 2245.481 2.675 .022x2 5.068 1.360 .706 3.727 .003x3 2.308 .486 .760 4.750 .001x4 -824.261 167.776 -1.165 -4.913 .0002x6 -862.699 232.489 -.916 -3.711 .003a. 因变量: y 2346607.35.68.082.612.9xxx(3)逐步回归模型汇总27模型R R 方 调整 R 方标准 估计的误差1 .498a .248 .194 1092.832062 .697b .485 .406 937.950383 .811c .657 .572 7
45、96.60909a. 预测变量: (常量 ), x3。b. 预测变量: (常量), x3, x5。c. 预测变量: (常量 ), x3, x5, x4。Anovad模型 平方和 df 均方 F Sig.回归 5502210.090 1 5502210.090 4.607 .050a残差 1.672E7 14 1194281.9181总计 2.222E7 15回归 1.079E7 2 5392697.554 6.130 .013b残差 1.144E7 13 879750.9102总计 2.222E7 15回归 1.461E7 3 4869041.506 7.673 .004c残差 7615032
46、.418 12 634586.0353总计 2.222E7 15a. 预测变量: (常量 ), x3。b. 预测变量: (常量), x3, x5。c. 预测变量: (常量 ), x3, x5, x4。d. 因变量: y系数 a非标准化系数 标准系数模型B 标准 误差 试用版 t Sig.(常量) 5161.259 1142.744 4.517 .0001x3 1.511 .704 .498 2.146 .050(常量) 472.298 2150.138 .220 .830x3 3.188 .913 1.050 3.492 .0042x5 212.325 86.643 .737 2.451 .0
47、29(常量) 1412.807 1865.912 .757 .464x3 3.440 .782 1.133 4.398 .0013x5 348.729 92.220 1.210 3.782 .00328x4 -415.136 169.163 -.587 -2.454 .030a. 因变量: y 354142.807.48.7291.36xxx(4)两种方法得到的模型是不同的,回退法剔除了 x5,保留了 x6, x3, x2, x4 作为最终模型。而逐步回归法只引入了 x3。说明了方法对自变量重要性的认可不同的,这与自变量的相关性有关联。相比之下,后退法首先做全模型的回归,每一个变量都有机会展示
48、自己的作用,所得结果更有说服力第六章 多重共线性的情形及其处理6.6解:由下表我们可以看出系数 a非标准化系数 标准系数 共线性统计量模型B 标准 误差 试用版 t Sig. 容差 VIF(常量) -6381.575 2736.958 -2.332 .035x1 -.593 .279 -1.040 -2.127 .052 .003 318.536x2 .549 .199 2.260 2.753 .016 .001 897.470x3 -.756 .911 -.495 -.830 .420 .002 472.951x4 .080 .031 .281 2.590 .021 .064 15.706x5 .006 .006 .038 .918 .374 .434 2.3051x6 -.010 .014 -.027 -.750 .466 .574 1.742a. 因变量: y方差扩大因子最大的为VIF2=897.470,故首先应剔除变量x2.将剩下变量继续进行回归得下表:系数 a非标准化系数 标准系数 共线性统计量