1、第三节 多元线性回归,一. 多元线性回归模型 回归参数的估计 回归方程的显著性检验 回归系数的显著性检验 多元线性回归的预测,多元线性回归模型,多元线性回归模型 (概念要点),一个因变量与两个及两个以上自变量之间的回归 描述因变量 y 如何依赖于自变量 x1 , x2 , xp 和误差项 的方程称为多元线性回归模型 涉及 p 个自变量的多元线性回归模型可表示为,b0 ,b1,b2 ,bp是参数 是被称为误差项的随机变量y 是x1,,x2 , ,xp 的线性函数加上误差项 说明了包含在y里面但不能被p个自变量的线性关系所解释的变异性,多元线性回归模型 (概念要点), 对于 n 组实际观察数据(y
2、i ; xi1,,xi2 , ,xip ),(i=1,2,n),多元线性回归模型可表示为,多元线性回归模型 (基本假定),自变量 x1,x2,xp是确定性变量,不是随机变量 随机误差项的期望值为0,且方差2 都相同 误差项是一个服从正态分布的随机变量,即N(0,2),且相互独立,多元线性回归方程 (概念要点),描述 y 的平均值或期望值如何依赖于 x1, x1 ,xp的方程称为多元线性回归方程 多元线性回归方程的形式为E( y ) = 0+ 1 x1 + 2 x2 + p xp,b1,b2,bp称为偏回归系数bi 表示假定其他变量不变,当 xi 每变动一个单位时,y 的平均平均变动值,多元线性
3、回归方方程的直观解释,多元线性回归的估计(经验)方程,总体回归参数 是未知的,利用样本数据去估计,用样本统计量 代替回归方程中的 未知参数 即得到估计的回归方程,是 估计值是 y 的估计值,参数的最小二乘估计,参数的最小二乘法 (要点),根据最小二乘法的要求,可得求解各回归参数 的标准方程如下,使因变量的观察值与估计值之间的离差平方和达到最小来求得 。即,回归方程的显著性检验,多重样本决定系数 (多重判定系数 R2 ),回归平方和占总离差平方和的比例,反映回归直线的拟合程度 取值范围在 0 , 1 之间R2 1,说明回归方程拟合的越好; R20,说明回归方程拟合的越差 等于多重相关系数的平方,
4、即R2=(R)2,修正的多重样本决定系数 (修正的多重判定系数 R2 ),由于增加自变量将影响到因变量中被估计的回归方程所解释的变异性的数量,为避免高估这一影响,需要用自变量的数目去修正R2的值 用n表示观察值的数目,p表示自变量的数目,修正的多元判定系数的计算公式可表示为,回归方程的显著性检验 (线性关系的检验 ),检验因变量与所有的自变量和之间的是否存在一个显著的线性关系,也被称为总体的显著性检验 检验方法是将回归离差平方和(SSR)同剩余离差平方和(SSE)加以比较,应用 F 检验来分析二者之间的差别是否显著 如果是显著的,因变量与自变量之间存在线性关系 如果不显著,因变量与自变量之间不
5、存在线性关系,回归方程的显著性检验 (步骤),提出假设 H0:12p=0 线性关系不显著 H1:1,2,p至少有一个不等于0,2. 计算检验统计量F,3. 确定显著性水平和分子自由度p、分母自由度n-p-1找出临界值F 4. 作出决策:若FF ,拒绝H0;若FF,接受H0,回归系数的显著性检验 (要点),如果F检验已经表明了回归模型总体上是显著的,那么回归系数的检验就是用来确定每一个单个的自变量 xi 对因变量 y 的影响是否显著 对每一个自变量都要单独进行检验 应用 t 检验 在多元线性回归中,回归方程的显著性检验不再等价于回归系数的显著性检验,回归系数的显著性检验 (步骤),提出假设 H0
6、: bi = 0 (自变量 xi 与 因变量 y 没有线性关系) H1: bi 0 (自变量 xi 与 因变量 y有线性关系) 计算检验的统计量 t,确定显著性水平,并进行决策 tt,拒绝H0; tt,接受H0,一个二元线性回归的例子,【例】一家百货公司在10个地区设有经销分公司。公司认为商品销售额与该地区的人口数和年人均收入有关,并希望建立它们之间的数量关系式,以预测销售额。有关数据如下表。试确定销售额对人口数和年人均收入的线性回归方程,并分析回归方程的拟合程度,对线性关系和回归系数进行显著性检验(=0.05)。,一个二元线性回归的例子 (Excel 输出的结果),一个二元线性回归的例子 (
7、计算机输出结果解释),销售额与人口数和年人均收入的二元回归方程为,多重判定系数R2= 0.9373;调整后的R2= 0.9194回归方程的显著性检验 F = 52.3498 FF0.05(2,7)=4.74,回归方程显著回归系数的显著性检验 t= 9.3548t=0.3646,; t2 = 4.7962 t=2.3646;两个回归系数均显著,一个含有四个变量的回归,第三节 可化为线性回归的 曲线回归,基本概念 非线性模型及其线性化方法,非线性回归,1. 因变量 y 与 x 之间不是线性关系 2. 可通过变量代换转换成线性关系 用最小二乘法求出参数的估计值 并非所有的非线性模型都可以化为线性模型
8、,几种常见的非线性模型, 指数函数,线性化方法 两端取对数得:lny = ln + x 令:y = lny,则有y = ln + x,基本形式:,图像,几种常见的非线性模型, 幂函数,线性化方法 两端取对数得:lg y = lg + lg x 令:y = lgy,x= lg x,则y = lg + x,基本形式:,图像,几种常见的非线性模型, 双曲线函数,线性化方法 令:y = 1/y,x= 1/x, 则有y = + x,基本形式:,图像,几种常见的非线性模型, 对数函数,线性化方法 x= lgx , 则有y = + x,基本形式:,图像,几种常见的非线性模型, S 型曲线,线性化方法 令:y
9、 = 1/y,x= e-x, 则有y = + x,基本形式:,图像,非线性回归 (实例),【例】为研究生产率与废品率之间的关系,记录数据如下表。试拟合适当的模型。,非线性回归 (实例),生产率与废品率的散点图,非线性回归 (实例),用线性模型:y =01x+ ,有y = 2.671+0.0018x 用指数模型:y = x ,有y =4.05(1.0002)x 比较直线的残差平方和5.3371指数模型的残差平方和6.11。直线模型略好于指数模型,本章小结,相关系数与相关分析 一元线性回归模型、回归方程与估计的回归方程 多元线性回归模型、回归方程与估计的回归方程 回归方程与回归系数的显著性检验 非线性回归的线性化 5. 用Excel 进行回归分析,结 束,