1、第十一章 简单线性回归分析 二、线性回归的假设检验回归方程有统计学意义吗? 假设检验包括两个方面: 1. 回归模型是否成立(model test):方差分析 2. 总体回归系数是否为零(parameter test): t检验。 X Y 1584 . 0 1353 . 0 + - =总变异的分解: Y Y - Y Y - Y Y - Y P X Y Y 图103 Y的总变异分解示意图总变异的分解: - + - = - 2 2 2 ) ( ) ( ) ( Y Y Y Y Y Y 残差 回归 总 SS SS SS + = 1 - = n 总 n 1 = 回归 n 2 - = n 残差 n 残差 回
2、归 总 n n n + =残差 SS 总 SS 回归 SS 图114 回归效果示意图回归模型的假设检验: 0 H :总体回归方程不成立或总体中自变量 X 对 因变量Y 没有贡献 1 H :总体回归方程成立或总体中自变量 X 对因 变量Y 有贡献 a =0.05残差 回归 残差 残差 回归 回归 MS MS SS SS F = = n n / /对例 101 的回归方程 X Y 1584 . 0 1353 . 0 + - = 进行方差分 析,结果如表 102 所示(假设检验步骤略)。 表102 简单线性回归模型方差分析表 变异来源 S df MS F P 回 归 0.0530 1 0.0530
3、41.376 0.001 残 差 0.0282 22 0.0013 总 变 异 0.0812 23 由表 102 首行末列可见,P0.0001,按a =0.05 水准, 可认为 NO 浓度与车流量之间的回归方程具有统计学 意义。回归系数的假设检验: 0 H : b 0 1 H : b 0 a =0.05b S b t 0 - = 2 n u =- ( ) - = 2 . X X S S X Y b 2 . - = n S S X Y 残差 残差的标准差接上例,经计算得(假设检验步骤略): X Y S . =0.0358, b S =0.0246, |t | F =6.432, 2 n u =-
4、 2 由统计量t得P 0.0001,按a =0.05水准,拒绝 0 H ,故可认为该回归系数具有统计学意义。 注意:对于服从双变量正态分布的同样一组资料,若 同时做了相关分析和回归分析,则相关系数的t 检验 与回归系数的t 检验等价,且 b r t t = 。总体回归系数的区间估计: /2, b bt S au 0.15842.0740.0246=(0.1074,0.2095)车流量对NO浓度的影响有多大? 总 回归 SS SS R = 2 决定系数 % 27 . 65 6527 . 0 0812 . 0 0530 . 0 2 = = = = 总 回归 SS SS R线性回归分析的前提条件:LINE 1. 线性(linear):反应变量与自变量的呈线性变化趋势。 2. 独立性(independence):任意两个观察值相互独立, 一个个体的取值不受其他个体的影响。前提条件(续): 3. 正态性(normal distribution):在给定值X时,Y的 取值服从正态分布 4. 等方差性(equal variance): 对应于不同的X 值,Y 值的总体变异相同 。1 m 2 m 3 m X=3时 Y的分布 X=1时 Y的分布 X=2时 Y的分布 回归线 Y X 2 3 1 图1-2 回归模型前提假设立体示意图THE END 谢!