1、3.11 研究货运总量 y(万吨)与工业总产值 (亿元)、农业总产值 (亿元)、居民非1x2x商品支出 (亿元)的关系。数据如表 3-9 所示。3x(1 ) 计算出 y, , , 的相关系数矩阵。1x23所以 y, , , 的相关系数矩阵为:1x23 1547.0398.724.0.1398.56. 2(2 ) 求 y 关于 , , 的三元线性回归方程。1x23编号 1 2 3 4 5 6 7 8 9 10货运总量 y(万吨) 160 260 210 265 240 220 275 160 275 250工业总产值 x1(亿元) 70 75 65 74 72 68 78 66 70 65农业总
2、产值 x2(亿元) 35 40 40 42 38 45 42 36 44 42居民非商品支出x3(亿元) 1.0 2.4 2.0 3.0 1.2 1.5 4.0 2.0 3.2 3.0由系数表可以知道,y 关于 , , 的三元线性回归方程为:1x2380.47.0.754.3321x(3 ) 对所求得的方程作拟合优度检验。由模型汇总可知,样本的决定系数为 0.806,所以可以认为回归方程为样本观测值的拟合程度较好,即回归方程的显著性较高。(4 ) 对回归方程作显著性检验。对方差分析表可以知道 p 值为 0.015 时,就拒绝原假设,认为在显著性水平 0.05 下,y 与74.05.F, , 有
3、显著的线性关系,即回归方程是显著的。1x23(5 ) 对每一个回归系数作显著性检验。由系数表可以知道, , 的 P 值分别为 0.1 和 0.049 说明回归系数较显著, 的 P 值1x2 3x为 0.2840.05 说明 的回归系数不显著,应该予以剔除。3(6 ) 如果有的回归系数没通过显著性检验,将其剔除,重新建立回归方程,作回归方程的显著性检验和回归系数的显著性检验。由系数表可以知道,重新建立的回归方程: 624.5971.86.421xy由方差分析表可知,P 值为 0.07 说明自变量 , 对因变量 y 产生的线性影响较显著。1x2由系数表可知,此时各个回归系数的 P 值均很小,说明回
4、归系数的显著性较高。(7 ) 求出每一个回归系数的置信水平为 95%的置信区间。由上表可知, 的系数的 95%的置信区间为(0.381,8.970)1x的系数的 95%的置信区间为(3.134,14.808)2(8 ) 求标准化回归方程。由系数表可知,标准化后的回归方程为 62110*4.67.049. xy(9 ) 求当 =75, =42, =3.1 时的 ,给定置信水平为 95%,用 SPSS 软件计算精01x0203x0确置信区间,手工计算近似预测区间。由上表可知, =267.8 的置信水平为 95%的置信区间为(260.05895,334.12038)0y0的置信水平为 95%的近似区间估计为(241.63377,298.54556)0E(10 )结合回归方程对问题作一些基本分析。对于前面的分析,虽然 R 方的值蛮大的,但这并不能说明回归方程显著,此时还需要通过对回归方程以及回归方程系数进行检验。当一个回归方程通过显著性检验之后,并不能说明这个方程中所以自变量都对因变量 y 有显著影响,因此还需对回归系数进行检验。