1、 回归分析的应用第 0 页 共 11 页1、问题的提出请使用回归分析解释最后一列和前八列的关系。7.30 8.00 7.10 7.70 7.20 7.20 7.00 7.60 -1.507.80 8.70 7.20 8.40 7.50 8.10 7.30 7.10 -2.577.20 7.40 7.10 7.50 7.20 7.10 7.00 7.00 0.397.30 8.40 7.20 7.90 7.50 8.50 7.30 7.10 -2.457.70 7.80 7.20 8.40 7.60 7.40 7.10 7.10 -0.357.30 7.60 7.20 8.10 7.30 7.2
2、0 7.00 7.00 -0.048.30 8.30 7.70 8.50 7.80 7.80 7.20 7.80 -1.709.60 9.80 9.30 9.80 8.80 9.90 9.40 10.00 -5.999.10 8.80 8.60 9.10 7.80 9.30 8.50 8.50 -3.779.50 9.70 9.00 9.60 8.90 9.80 9.20 10.00 -5.937.80 8.50 8.30 9.10 8.00 9.50 7.60 7.90 -3.228.60 8.90 7.80 9.00 8.00 8.70 7.80 7.80 -3.158.50 9.10 8
3、.10 9.30 8.00 8.30 7.80 8.50 -4.079.20 9.10 8.00 9.40 8.50 9.60 8.60 8.90 -4.458.20 9.20 7.90 9.10 7.80 8.30 7.50 8.20 -3.927.00 7.50 7.10 7.40 7.10 7.10 7.00 7.70 -0.549.70 9.90 9.10 9.70 9.00 10.00 9.60 9.90 -5.849.80 9.90 9.50 9.80 9.00 10.00 9.70 9.90 -5.908.60 9.40 8.20 9.50 8.70 9.80 8.30 9.50
4、 -5.488.80 9.00 7.90 8.50 8.10 9.30 8.00 9.80 -4.869.30 9.80 9.30 9.80 8.70 10.00 9.30 9.30 -5.547.50 7.90 7.20 8.10 7.30 7.70 7.10 7.20 -0.889.00 9.30 7.80 9.10 8.20 9.40 8.10 8.50 -3.948.90 9.70 8.90 9.50 8.60 9.70 9.40 9.20 -5.949.90 10.00 9.70 9.90 9.40 10.00 9.90 9.90 -5.897.20 7.20 7.00 7.90 7
5、.10 7.10 7.00 7.30 0.607.00 7.10 7.00 7.20 7.00 7.00 7.00 7.00 0.867.30 7.50 7.10 7.60 7.30 7.90 7.10 7.60 -0.309.00 9.00 8.10 9.10 7.80 9.30 7.70 7.10 -2.337.50 8.50 7.20 8.50 8.00 8.90 7.20 7.60 -2.829.10 9.70 8.60 9.60 9.10 9.90 9.50 7.60 -4.307.60 8.00 7.20 8.90 7.40 7.60 7.10 7.20 -1.087.70 8.3
6、0 7.40 8.40 7.50 8.30 7.40 8.50 -2.957.70 7.90 7.30 8.70 7.40 7.70 7.30 8.30 -1.658.10 8.40 7.90 8.90 7.90 8.60 7.70 7.00 -1.98回归分析的应用第 1 页 共 11 页8.50 9.60 8.70 9.20 8.40 9.30 8.30 8.70 -4.929.80 9.80 9.70 9.90 8.90 9.90 9.80 9.90 -6.169.20 9.20 8.10 9.60 8.40 9.60 8.80 9.20 -4.999.90 9.90 9.70 9.90
7、 9.10 10.00 9.70 9.80 -5.748.90 8.70 7.90 9.00 8.40 9.70 8.40 7.50 -2.809.90 10.00 9.20 9.90 9.00 10.00 9.30 8.00 -3.457.50 8.50 7.50 8.20 7.50 8.70 7.90 9.40 -4.778.90 9.60 8.80 9.30 8.40 9.90 9.20 9.10 -5.717.70 8.70 7.40 8.50 7.70 8.30 7.30 7.10 -2.727.30 8.00 7.10 7.70 7.20 7.20 7.00 7.60 -1.507
8、.80 8.70 7.20 8.40 7.50 8.10 7.30 7.10 -2.577.20 7.40 7.10 7.50 7.20 7.10 7.00 7.00 0.397.30 8.40 7.20 7.90 7.50 8.50 7.30 7.10 -2.457.70 7.80 7.20 8.40 7.60 7.40 7.10 7.10 -0.357.30 7.60 7.20 8.10 7.30 7.20 7.00 7.00 -0.048.30 8.30 7.70 8.50 7.80 7.80 7.20 7.80 -1.709.60 9.80 9.30 9.80 8.80 9.90 9.
9、40 10.00 -5.999.10 8.80 8.60 9.10 7.80 9.30 8.50 8.50 -3.779.50 9.70 9.00 9.60 8.90 9.80 9.20 10.00 -5.937.80 8.50 8.30 9.10 8.00 9.50 7.60 7.90 -3.228.60 8.90 7.80 9.00 8.00 8.70 7.80 7.80 -3.158.50 9.10 8.10 9.30 8.00 8.30 7.80 8.50 -4.079.20 9.10 8.00 9.40 8.50 9.60 8.60 8.90 -4.457.30 8.00 7.10
10、7.70 7.20 7.20 7.00 7.60 -1.507.30 8.00 7.10 7.70 7.20 7.20 7.00 7.60 -1.502、模型的准备多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法。并通过计算机对相关的数据进行分析得到相应的结果。本文通过建立多元统计分析方法中的多元回归分析模型并使用SPSS软件来分析数据得到多元回归方程。2.1 多元回归分析原理与模型回归分析是一种处理变量的统计相关关系的一种数理统计方法。回归分析的基本思想是: 虽然自变量和因变量之间没有严格的、确定性的函数关系, 但可以设法找出最能代表它们之间关系的数学表达形式。回归分析的应用第
11、 2 页 共 11 页回归分析主要解决以下几个方面的问题:(1)、确定几个特定的变量之间是否存在相关关系, 如果存在的话, 找出它们之间合适的数学表达式;(2)、根据一个或几个变量的值, 预测或控制另一个变量的取值, 并且可以知道这种预测或控制能达到什么样的精确度;(3)、进行因素分析。例如在对于共同影响一个变量的许多变量( 因素)之间, 找出哪些是重要因素, 哪些是次要因素 , 这些因素之间又有什么关系等等。多元回归分析是研究多个变量之间关系的回归分析方法, 按因变量和自变量的数量对应关系可划分为一个因变量对多个自变量的回归分析(简称为“ 一对多”回归分析)及多个因变量对多个自变量的回归分析
12、(简称为“ 多对多 ”回归分析), 按回归模型类型可划分为线性回归分析和非线性回归分析。设随机变量 y 与 m 个自变量 存在线性关系:(1) (1)式称为回归方程 , 式中 为回归系数, 为随机误差。现在解决用 估计 y 的均值 的问题, 即且假定 , , 是与无关的待定常数。设有 n 组样本观测数据 :其中 表示 在第 i 次的观测值, 于是有:ijxj回归分析的应用第 3 页 共 11 页(2)其中 为 m+1个待定参数, 为 n 个相互独立的且服从同一正态分布 的随机变量 , (2)式称为多元( 元) 线性回归的数学模型。(2)式亦可写成矩阵形式, 设,则(2)式变为 :(3)(3)式
13、称为多元线性回归模型的矩阵形式。用最小二乘法估计参数( , , ),使残差平方和 01m(4 )2).(210112 iiinini xxySE达到最小,根据微积分中求极值的原理,SSE 分别对 , , 求偏微商,经01m整理后用矩阵形式表示为 )(XyT(5)直接用矩阵运算求解为 回归分析的应用第 4 页 共 11 页yXbT1)((6) 从而得多元线性经验回归方程 (7)mxxy.210回归方程建立后要对回归模型进行检验,一般包括一级检验和二级检验。一级检验又称统计学检验,主要是利用统计学的抽样理论来检验样本回归方程的可靠性,具体分为拟合优度评价和显著性检验;二级检验又称经济计量学检验,它
14、是对线性回归模型的假定条件能否得到满足进行检验,包括残差正态性检验和序列相关检验等。 对被解释变量进行方差分析,得到方差分析表,见表1。方差来源 离差平方和 自由度 均方差 F 值解释变量 niySR12)(K-1 MSR=SSR/(K-1) F=MSR/MSE剩余变量 niiySE12)(N-K MSE=SSE/(N-K)总变量 niiyST12)(表1 回归模型方差分析表 其中 SST=SSR+SSE,SST 称为总离差平方和,反映被解释变量的总变动; SSR 称为回归平方和,反映了被解释变量的总变动中能够被回归方程解释的部分;SSE 称为残差平方和,反映了被解释变量的总变动中由随机因素引
15、起的变动,即不能被回归方程解释的部分。 回归方程的拟合优度评价可用决定系数来衡量,反映因变量 y 的全部变异中能够通过回归关系被自变量解释的比例。即解释变差占总变差的比重: (8)STER12对回归方程整体显著性进行检验可建立如下假设: 回归分析的应用第 5 页 共 11 页,即回归方程整体不显著; 0.:210mH不全等于0(j=1,2.m),即回归方程整体显著。 j由表1中的 F 统计量及其对应的显著水平 p 来进行检验。若 p 小于要求的显著水平,则拒绝原假设,可以认为回归方程总体显著;反之不能拒绝原假设,应认为回归方程总体不显著。对回归系数的显著性检验可以建立假设: (j=1,2.m)
16、, 即第 j 个回归系数不显著; 0:jH(j=1,2.m),即第 j 个回归系数显著; 1j构造 t 统计量 : (9)nijijjj xt12)(其中 (10)2)(1nynii由计算出的 t 统计量及其对应的显著水平 p 来进行检验。若 p 小于要求的显著水平,则拒绝原假设,可以认为第 j 个回归系数显著;若 p 大于要求的显著水平则不能拒绝原假设,应认为第 j 个回归系数不显著。2.2 SPSS简介SPSS( Statistical Package for the Social Science) 社 会 科 学 统 计 软 件包 是 世 界 最 著 名 的 统 计 分 析 软 件 之
17、一 。 该 软 件 包 理 论 严 谨 , 各 种 统 计 分 析 功 能 齐全 , 其 内 容 覆 盖 了 从 描 述 统 计 、 探 索 性 数 据 分 析 到 多 元 分 析 的 几 乎 所 有 统 计 分 析 功能 , 目 前 已 经 在 国 内 逐 渐 流 行 起 来 。 SPSS 的 基 木 功 能 包 括 数 据 管 理 、 统 计 分 析 、图 表 分 析 、 输 出 管 理 等 等 。 SPSS 统 计 分 析 过 程 包 括 描 述 性 统 计 、 均 值 比 较 、 一 般线 性 模 型 、 相 关 分 析 、 回 归 分 析 、 对 数 线 性 模 型 、 聚 类 分
18、析 、 数 据 简 化 、 生 存 分 析 、时 间 序 列 分 析 、 多 重 响 应 等 几 大 类 。 每 类 中 又 分 好 几 个 统 计 过 程 , 比 如 回 归 分 析中 又 分 线 性 回 归 分 析 、 曲 线 估 计 、 Logistic 回 归 、 Probit 回 归 、 加 权 估 计 、 两阶 段 最 小 二 乘 法 、 非 线 性 回 归 等 多 个 统 计 过 程 , 而 且 每 个 过 程 中 又 允 许 用 户 选 择回归分析的应用第 6 页 共 11 页不 同 的 方 法 及 参 数 。SPSS 软 件 多 元 线 性 回 归 操 作 步 骤 如 下 :
19、( 1) 多 元 线 性 回 归 所 用 命 令 语 句 与 一 元 线 性 回 归 相 同 , 同 样 可 以 通 过 单 击 主 菜单 Analyze / Regression / Linear, 进 入 设 置 对 话 框 如 图 1 所 示 。 从 左 边 变量 表 列 中 把 因 变 量 选 入 到 因 变 量 ( Dependent) 框 中 , 把 自 变 量 选 入 到 自 变 量( Independent) 框 中 。图 1( 2) 点 击 Method 后 面 的 下 拉 框 , 在 Method 框 中 选 择 一 种 回 归 分 析 的 方SPSS 提 供 下 列 几
20、种 变 量 进 入 回 归 方 程 的 方 法 :Enter 选 项 , 强 行 进 入 法 , 即 所 选 择 的 自 变 量 全 部 进 入 回 归 模 型 , 该 选 项 是 默 认方 式 。Remove 选 项 , 消 去 法 , 建 立 回 归 方 程 时 , 根 据 设 定 的 条 件 剔 除 部 分 自 变 量 。Forward 选 项 , 向 前 选 择 法 , 根 据 在 Option 对 话 框 中 所 设 定 的 判 据 , 从 无 自 变量 开 始 , 在 拟 合 过 程 中 , 对 被 选 择 的 自 变 量 进 行 方 差 分 析 , 每 次 加 入 一 个 F 值
21、 最大 的 变 量 , 直 到 所 有 符 合 判 据 的 变 量 都 进 入 模 型 为 止 。 第 一 个 引 入 回 归 模 型 的 变 量应 该 与 因 变 量 相 关 程 度 最 大 。回归分析的应用第 7 页 共 11 页Backward 选 项 , 向 后 剔 除 法 , 根 据 在 Option 对 话 框 中 所 设 定 的 判 据 , 先 建 立全 模 型 , 然 后 根 据 设 置 的 判 据 , 每 次 剔 除 一 个 使 方 差 分 析 中 的 F 值 最 小 的 自 变 量 ,直 到 回 归 方 程 中 不 再 含 有 不 符 合 判 据 的 自 变 量 为 止 。
22、Stepwise 选 项 , 逐 步 进 入 法 , 是 向 前 选 择 法 和 向 后 剔 除 法 的 结 合 。 根 据 在Option 对 话 框 中 所 设 定 的 判 据 , 首 先 根 据 方 差 分 析 结 果 选 择 符 合 判 据 的 自 变 量 且 对因 变 量 贡 献 最 大 的 进 入 回 归 方 程 。 根 据 向 前 选 择 法 则 进 入 自 变 量 ; 然 后 根 据 向 后 剔除 法 , 将 模 型 中 F 值 最 小 的 且 符 合 剔 除 判 据 的 变 量 剔 除 模 型 , 重 复 进 行 直 到 回 归 方程 中 的 自 变 量 均 符 合 进 入
23、模 型 的 判 据 , 模 型 外 的 自 变 量 都 不 符 合 进 入 模 型 的 判 据 为止 。这 里 我 们 采 用 系 统 默 认 的 强 行 进 入 法 , 其 他 选 项 均 采 用 系 统 默 认 的 设 置 。( 3) 点 击 OK, 得 到 上 面 定 义 模 型 的 输 出 结 果 。3、模型的建立和求解在 SPSS 回归分析中,首先对 SPSS Data Editor 中录入变量值,然后选择菜单栏中的 Analyze-Regression-Linear 后出现以下界面图 2,然后在 Dependent 中转入因变量y,在 Indepents(s)中转入 x 向量组。为
24、了获得相应有分析数据,我们可以在Statistics 面板中选择相应,如下图 3 是本次分析所使用的操作,按继续返回原来界面,再选择 OK 键就分析完毕。结果图表如 4 所示。回归分析的应用第 8 页 共 11 页图 2图 3回归分析的应用第 9 页 共 11 页Variables Entered/RemovedbModel Variables EnteredVariables Removed Method1 x8, x4, x6, x3, x2, x1, x5, x7a . Entera. All requested variables entered.b. Dependent Variab
25、le: yModel SummarybModel R R Square Adjusted R SquareStd. Error of the Estimate Durbin-Watson1 .993a .986 .984 .26182 2.081a. Predictors: (Constant), x8, x4, x6, x3, x2, x1, x5, x7b. Dependent Variable: yANOVAbModel Sum of Squares df Mean Square F Sig.Regression 248.190 8 31.024 452.557 .000aResidua
26、l 3.496 51 .0691Total 251.686 59a. Predictors: (Constant), x8, x4, x6, x3, x2, x1, x5, x7b. Dependent Variable: yCoefficientsaUnstandardized CoefficientsStandardized CoefficientsModel B Std. Error Beta t Sig.(Constant) 15.675 .586 26.733 .000x1 .724 .130 .322 5.578 .000x2 -1.939 .134 -.775 -14.521 .
27、000x3 .352 .144 .143 2.454 .018x4 -.350 .147 -.131 -2.384 .021x5 .803 .207 .252 3.883 .000x6 -.566 .090 -.290 -6.259 .000x7 -.235 .157 -.109 -1.493 .1421x8 -.884 .060 -.445 -14.850 .000a. Dependent Variable: y回归分析的应用第 10 页 共 11 页Residuals StatisticsaMinimum Maximum Mean Std. Deviation NPredicted Val
28、ue -6.1254 .7499 -3.1090 2.05100 60Residual -.38010 1.00983 .00000 .24343 60Std. Predicted Value -1.471 1.881 .000 1.000 60Std. Residual -1.452 3.857 .000 .930 60a. Dependent Variable: y图 44 总结参 考 文 献1 姜启源 谢金星 叶 俊编数学模型(第三版)M北京:高等教育出版社,20052 何晓群 刘文卿 应用回归分析(第三版)M北京:中国人民大学出版社,20112 庞皓 计量经济学 (第二版) M.北京;科学出版社;20103 卢文岱 SPSS for Windows 统计分析(第三版)M北京:电子工业出版社,回归分析的应用第 11 页 共 11 页2006