1、1,计量经济学,北京交通大学经济管理学院,2,3 多元线性回归分析,3.1 多元线性回归模型的形式与参数估计 3.2 多元线性回归模型的检验 3.3 多元线性回归模型的预测 3.4 自变量的筛选 3.5 案例分析,3,要求,1.理解多元回归分析的含义。 2.多元线性回归的假设条件; 3.理解多元线性回归的参数估计方法及参数估计量的性质; 4.掌握多元线性回归的假设检验; 5.掌握多元线性回归的预测; 6.掌握逐步回归的基本思想; 7.掌握多元线性回归的应用。,4,3.1多元线性回归模型的形式与参数估计,多元线性回归模型与一元线性回归模型基本类似,只不过自变量由一个增加到两个以上,因变量与多个自
2、变量之间存在线性关系。 假定被解释变量与多个解释变量之间具有线性关系,是自变量的多元线性函数,称为多元线性回归模型。即,3.1 多元线性回归模型的形式与参数估计,多元线性回归分析仍是根据观测样本数据估计模型中的各个参数,对估计参数及回归方程进行统计检验,从而利用回归模型进行经济预测和分析。多元线性回归模型包含多个自变量,多个自变量同时对因变量发生作用,若要考察其中一个自变量对的影响就必须假设其它自变量保持不变来进行分析。因此多元线性回归模型中的回归系数为偏回归系数,即反映了当模型中的其它变量不变时,其中一个自变量对因变量的均值的影响。,6,多元线性回归的基本假定,多元线性回归模型的基本假设有:
3、假定1 零均值假定; 假定2 同方差假定(误差项的方差为同一常数) ; 假定3 无自相关性; 假定4 随机误差项与自变量不相关 ; 假定5 随机误差项服从均值为零,方差为的正态分布; 假定6 自变量之间不存在多重共线性.,7,3.1.3 多元线性回归模型的参数估计,向量 的OLS估计量 随机误差项方差的估计量,8,3.1.3 多元线性回归模型的参数估计,随机误差项方差的估计量 估计参数的统计性质 线性性 无偏性 最小方差性,9,3.2 多元线性回归模型的检验,3.2.1拟合优度检验,10,3.2 多元线性回归模型的检验,3.2.2方程显著性检验 回归方程的显著性检验的基本步骤为: 第一步,作出
4、假设。 原假设: 备择假设H1:不同时为0 第二步,在原假设成立的条件下,计算统计量F。,11,3.2 多元线性回归模型的检验,3.2.2方程显著性检验第三步,将计算统计量与临界值进行比较,进行统计决策。,12,3.2 多元线性回归模型的检验,3.2.3 参数显著性检验 对回归系数进行t显著性检验,13,3.3 多元线性回归模型的预测,点预测对于给定置信水平,预测值Y的置信区间为,14,3.3 多元线性回归模型的预测,对一系列的自变量X的值可构造Y0的一系列的置信区间,这些置信区间构成一个Y0的置信带。单个值的预测置信带通常在平均值预测的置信带的外面。这些置信带的形状都呈喇叭型。在X的值接近X
5、的均值时,置信带较窄;随着X的取值迅速远离X的均值,置信带迅速变宽,X的取值在样本区间之外时,置信带则很宽。这表明我们利用样本回归方程进行预测时,在外推预测时要十分小心。,15,案例分析,例3-1 某交通运输装备公司在十八个地区开有分店,现欲准备在一新地区开一分店。现有十八个地区的销售额数据及所在地区的人口数、人均收入数据,如下表3-1所示。为预测新开地区分店的销售额情况,试建立该公司分店销售额与所在地区人口数、人均收入的回归模型。,16,案例分析,表3-1 某公司分店经营 相关数据表,17,3.4 自变量的选择,自变量的选择是多元线性回归经常碰到的问题。在选择时,一方面希望尽可能不漏掉重要的
6、解释变量,同时又尽可能减少解释变量的个数,使模型做到精简。在确定解释变量时,首先列出所有可能的解释变量,再根据不同解释变量的组合,选择合适的模型。由于每个变量都可能被选择或被排除在外,因此拟合的模型总数为2p个(p为解释变量个数)。若解释变量个数很大时,工作量会迅速增加,使用上述方法就不太现实了。此时需要有效的变量选择方法,主要有向前法、向后法和逐步回归法。,18,3.4 自变量的选择,向前法。事先给定一个挑选自变量进入模型的标准。开始时,模型中除常数项外没有自变量,然后,按照自变量对因变量Y的贡献大小由大到小依次挑选进入方程。每选入一个变量进入方程,则重新计算方程外各自变量(在扣除了已选入变
7、量的影响后)对Y的贡献。直至方程外变量均达不到入选取标准,没有自变量可被引入方程为止。该种方法只考虑选入变量,一旦某变量进入模型,就不再考虑剔除。,19,3.4 自变量的选择,向后法。与向前法相反,事先给定一个剔除自变量的标准。开始全部自变量都在方程之中,然后,按照自变量对因变量的贡献大小由小到大依次剔除。每剔除一个变量,则重新计算未被剔除的各自变量对因变量的贡献。直至方程中所有变量均符合选入标准,没有自变量被剔除为止。该种方法只考虑剔除,自变量一旦被剔除,则不再考虑进入模型。,20,3.4 自变量的选择,逐步回归法。该方法的主要思路是在考虑的全部自变量中按其对因变量的作用大小, 显著程度大小
8、或者说贡献大小, 由大到小地逐个引入回归方程, 而对那些对作用不显著的变量可能始终不被引人回归方程。另外, 已被引入回归方程的变量在引入新变量后也可能失去重要性, 而需要从回归方程中剔除出去。引入一个变量或者从回归方程中剔除一个变量都称为逐步回归的一步, 每一步都要进行检验, 以保证在引入新变量前回归方程中只含有对影响显著的变量, 而不显著的变量已被剔除。,21,3.4 自变量的选择,逐步回归法。逐步回归是逐步筛选自变量的回归方法,筛选过程是有进有出。开始时,将因变量与每一自变量作一元回归,挑出与Y相关最密切或F检验最显著的一元线性回归方程。然后再引入第二个变量,原则是它比别的变量进入模型有更
9、大的F检验值。同时对原来的第一个变量作检验,看新变量引入后老变量还是否显著,若不显著则予以剔除。如此继续下去,每次都引入一个在剩余变量中进入模型有最大F检验值的变量,每次引入后又对原来已引入的变量逐一检验以决定是否剔除。这样直到再无新变量可以引入,同时再无旧变量可以剔除为止,最终建立起回归方程,22,3.5 案例分析,为研究所属医院所需要的人力资源,某地区卫生局对所管辖的15家医院进行了调查,获得了如下数据。共计六个变量,y为月均使用的人(小时)数;x1为日平均病人数;x2为月平均光透视人数;x3为月平均所占用的床位(天数);x4为当地人口数(千人);x5为平均每个病人住院天数。试建立y关于x1,x5的多元回归方程,分析它们之间的关系。数据如下表3-2所示。,23,3.5 案例分析,表3-2 所属医院相关数据表,24,思考与练习,简述多元线性回归模型的基本假设。 试述多元线性回归模型的参数估计方法。 如何评价多元线性回归模型的效果? 试述多元线性回归模型的预测方法。 多元线性回归模型与一元线性回归模型有哪些区别? 试列举可运用多元回归分析的实际问题。,