1、实 验 报 告实验课程 应用回归分析 第 5 次实验 实验日期 2012.11.8 指导教师 王振羽 班级 基地班 学号 1007402072 姓名 张艺璇 成绩 一、实验目的掌握用统计软件对线性回归模型的各种诊断.二、实验内容在合成异戊橡胶性能的研究中,安排了 28 种不同的试验条件,测出各条件下橡胶的特性粘度 、低分子含量 与门尼粘度 y 的数据。(数据在“ 回归人大数据 12-学1x2x生.xls 的” 中 ),利用统计软件完成以下内容:(1) 写出 y 关于 x1, x2 的回归方程;(2) 写出各点的残差、学生化残差;(3) 用残差图方法、等级相关系数法判断二元线性回归模型是否合适,
2、并判断方差是否齐性;(4) 若这 28 次试验是依次进行的,试用游程检验去检验观测值是否独立,并用 DW统计量检验数据间有无一阶自相关;(5) 用 P-P 图或其它正态性检验方法检验模型是否服从正态分布;(6) 仿照书上 p.122 异常值实例分析的方法对这里的数据进行异常值分析。三、实验结果与分析(包括运行结果及其数据分析、解释等)(1) 写出 y 关于 x1, x2 的回归方程;(2) 写出各点的残差、学生化残差;系数 a非标准化系数 标准系数模型 B 标准 误差 试用版 t Sig.(常量) 29.886 12.961 2.306 .030x1 7.345 1.137 .657 6.46
3、0 .0001x2 -.565 .166 -.346 -3.398 .002a. 因变量: y-故回 归 方程 为 : =29.886+7.34510.5652各点的残差(RES_1 ) 、学生化残差(SRE_1)如下表所示:i x1 x2 y RES_1 SRE_11 8.18 28.8 75.0 1.29549 0.153042 6.10 33.1 57.5 1.50217 0.178183 3.89 20.0 63.0 15.83660 2.491964 5.95 25.4 37.5 -21.74483 -2.688265 5.54 36.8 47.0 -2.79481 -0.33230
4、6 10.80 14.4 88.0 -13.08189 -1.661747 9.07 4.7 97.0 3.14707 0.419058 8.80 29.5 57.5 -20.36323 -2.428609 4.03 57.3 20.5 -6.62552 -0.8120310 8.30 26.5 79.5 3.61507 0.4285711 8.36 35.6 73.0 1.81383 0.2159712 8.91 39.1 85.0 11.75066 1.4436413 6.70 33.0 54.0 -6.46146 -0.7596314 4.88 55.3 32.0 -2.49855 -0
5、.3021615 8.32 34.5 72.0 0.48639 0.0577316 3.95 63.4 24.0 0.90724 0.1140917 9.42 31.3 89.0 7.59931 0.9260018 8.90 38.3 81.0 7.37229 0.9019319 6.22 39.4 56.5 3.17884 0.3726720 8.45 30.9 81.5 6.99830 0.8295421 4.06 59.9 22.5 -3.37746 -0.4174722 7.75 33.8 75.5 7.77784 0.9140823 7.24 39.9 60.0 -0.53094 -
6、0.0624424 5.57 51.8 41.0 -0.54350 -0.0649925 6.85 37.6 55.5 -3.46527 -0.4055726 3.40 55.9 28.0 4.71130 0.5840527 3.98 56.6 25.0 -2.15361 -0.2636728 7.19 31.6 70.5 5.64867 0.66343(3) 用残差图方法、等级相关系数法判断二元线性回归模型是否合适,并判断方差是否齐性;绘制残差图如下:从残差图看出,误差项具有明显异方差性,误差随 的增加呈现出增加的态势。2计算等级相关系数得:相关系数abs x2相关系数 1.000 -.43
7、7*Sig.(双侧) . .020absN 28 28相关系数 -.437* 1.000Sig.(双侧) .020 .Spearman 的 rhox2N 28 28*. 在置信度(双测)为 0.05 时,相关性是显著的。,认为残差绝对值与 显著相关,存在异方差。=0.437,值 =0.020 2故由以上数据得:二元线性回归模型并不合适。(4) 若这 28 次试验是依次进行的,试用游程检验去检验观测值是否独立,并用 DW统计量检验数据间有无一阶自相关;游程检验结果如下:游程检验x1 x2 y检验值 a 7.02 35.1 58.8案例 = 检验值 14 14 14案例总数 28 28 28Run
8、s 数 15 17 17Z .000 .578 .578渐近显著性(双侧) 1.000 .563 .563a. 中值其中三者的P 值均大于0.05 ,故得结论:观测值是独立的自相关 DW 检验如下:模型汇总 b模型 R R 方 调整 R 方标准 估计的误差 Durbin-Watson1 .931a .866 .856 8.7014 2.225a. 预测变量: (常量), x2, x1。b. 因变量: y得DW=2.225. 查表得, ,则 ,则无一阶自相关。=1.26,=1.560时,分布呈正偏态, Sk0曲线比较陡峭,Ku3 ,同时 D4=1.810651,从而第 30714.npchch个数据是异常值,是由自变量异常引起的。