1、1,第三章 多元线性回归模型,2,教学目的、要求: 通过第三章的学习,要求学生了解多元线性回归模型产生的背景;掌握多元线性回归模型的古典假定;用普通最小二乘法对二元线性模型的参数估计,参数的解释;参数最小二乘估计的统计性质;理解多元可决系数(判定系数)、修正的可决系数(判定系数)的概念及其关系;掌握用F检验法对总体模型的显著性进行检验;用t检验法对单个系数的显著性检验;能够用本章所学过的知识解决一些实际问题(多元线性模型的预测)。 本章教学内容:第一节 多元线性回归模型及古典假定第二节 多元线性回归模型的估计第三节 多元线性回归模型的检验第四节 多元线性回归模型的预测第五节 实例,3,本章重点
2、、难点:*多元回归模型的矩阵表达式,与非矩阵表达式的区别与联系;*多元回归模型古典假设的矩阵表达式,与一元情形的比较;*采用离差形式的多元(二元)回归模型参数估计方法;*多元回归模型随机扰动项方差的估计;*多元回归模型参数最小二乘估计量的性质;*多重可决系数和修正可决系数;*多元回归模型的方程显著性检验、参数显著性检验;*在多元回归模型中依据p-值进行的判断;*多元回归模型的预测及其矩阵表达式;*Eviews结果中各变量间的关系,回归结果的经济意义分析。,4,第一节 多元线性回归模型及古典假定,问题的提出,例:对一国的货币需求量(Y)的影响因素(X)有:经济总量、利率、物价水平等;,例:对汽车
3、需求量(Y)的影响因素(X)有: 收入水平、汽车价格、汽油价格等 ;,一个被解释变量(因变量)与多个解释变量之间的线性关系用回归模型设定,称为“多元线性回归模型”。,例:对人均国民生产总值(Y)的影响因素(X)有:人口变动因素、固定资产数、货币供给量、物价指数、国内国际市场供求关系等 。,含两个以上解释变量的回归模型叫“多元回归模型”;,5,一、多元线性回归模型表示方法,从一个二元线性模型的实例谈起:,-,其中:,6,即,一般形式,矩阵形式,7,总体:,样本:,残 差,随机扰动项,复习(一元) 问题:总体线性回归模型、样本线性回归模型各自的表现形式?系 数的经济意义是什么?,8,总体回归函数(
4、PRF),其中: 为截距 ; 为 “偏回归系数”.(表示:在其它解释变量不变的情况下,变量 每变化一个单位,对Y产生 个单位的影响) ;,样本回归函数(SRF),矩阵表示:,(多元),9,其中:,10,1、干扰项的均值为零,2、同方差性,3、无自相关性,4、扰动项与解释变量之间不相关,5、正态性,复习(一元基本假定(15):,11,二、多元线性模型的古典假定,1、零均值:,矩阵形式,12,2、同方差和无自相关性,即:,13,3、随机扰动项与解释变量不相关,即,附:,14,4、无多重共线性,即假定各解释变量之间不存在线性关系,5、正态性:随机扰动项服从正态分布,(该式成立,X至少有K阶子行列式不
5、为零),附:,15,第二节 多元线性回归模型的估计,一、最小二乘估计 (问题:OLS的基本是思想?),多元线性回归模型的“残差平方和”为:,要使“残差平方和”达到最小,其充分条件是,即:,16,化简得正规方程组,17,对样本回归函数的两边同乘以X的转置矩阵,得,即,18,OLS:原则、求解、结果,19,20,解:线性回归模型设定如下:,其中:,21,22,样本回归方程为 :,其它条件(乙产品销售量)不变时,甲产品销售量每增加一万吨,公司的利润平均增加0.5636百万元;,其它条件(甲产品销售量)不变时,乙产品销售量每增加一万吨,公司的利润平均增加1.0995百万元;,如果甲、乙两种产品的销售量
6、均为零,则公司平均亏损13.8196百万元。,23,复习(一元): 最小二乘估计式的统计性质 (前提:满足古典假定),1、线性性: 、 都是 的线性函数;,2、无偏性,3、最小方差性,注: 满足线性、无偏、方差最小的OLS估计量为最佳线性无偏估计量。,24,(多元) 二、参数最小二乘估计的(统计)性质,附:,25,附:,26,附:,附:证明见附录P73,27,三、方差的估计,附:,28,29,例:由例1(P19、P20) 的资料易得:,30,第三节 多元线性回归模型的检验,本节主要介绍: 一、 拟合优度检验(多重可决系数及其修正) 二、 回归参数的显著性检验(t检验) 三、 回归方程的显著性检
7、验(F检验) 四、 拟合优度、t检验、F检验的关系,31,一、拟合优度检验,(一)可决系数(判定系数),类似于一元情形,先将多元线性回归的总变差作如下分解:,目的:构造一个不含单位,可以相互比较,且能直观判断拟合优劣的指标,32,对以上自由度的说明:,33,意义:可决系数越大(越靠近1,模型对数据的拟合程度越好),自变 量对因变量的解释程度越高,自变量引起的变动占总变动的百分比 高。观察点在回归直线附近越密集。,可决系数(判定系数)的定义:,注:可决系数只涉及变差,没考虑自由度!,34,(二)修正的可决(判定)系数,修正思路:引进自由度校正所计算的变差。,35,例:由例1 的资料(P19)得可
8、决系数(判定系数)、修正的可决系数(判定系数)分别为:,36,二、回归参数的显著性检验,t 检验:对单个回归参数(系数)检验(目的:检验每个解释变量对Y的线性作用是否显著。,37,检验的步骤:,4、根据样本数据计算t 值,38,由例1(P22、P29) 的资料,易得:,39,三、回归方程的显著性检验,F检验:检验因变量和诸自变量之间是否存在显著的线性关系,1、检验的假设:,还需检验:所有解释变量联合在一起,是否对应变量Y的影响也显著?,40,3、根据样本数据,计算F统计量的值,41,42,由例1 的资料,易得:,43,44,就例1结果写出回归分析报告:,SE =(13.326) (0.303)
9、 (0.313),t =(-1.037) (1.860) (3.513),45,四、各种检验之间的关系,1、拟合优度检验与F检验 联系: 1)拟合优度检验和F检验都是对回归方程显著性的检验;2)都是把总离差TSS分解成回归平方和ESS与残差平方和RSS,并在此基础上构造统计量进行检验;3)模型对观测值的拟合程度越高,模型总体线性关系的显著性就越高(两者同增同减) 。,区别:1)F检验有精确的分布,而拟合优度检验没有;2)作用结论时,可决系数(修正可决系数)只能给出一个模糊的推测;而F检验可在给定显著水平下,给出统计上的严格结论.,46,2、F检验和t检验,1)在一元的情形,两者是一致(等价)的
10、。对单个解释变量显著性进行t检验,也就检验了解释变量的整体显著性(F检验);并且可以证明:Ft2 (教材P64)(所以在一元情形,只需进行一种检验即可)2)多元中,不存在以上关系。,3、经济意义检验和其他检验判断一个回归模型是否正确,首先要看模型是否具有合理的经济意义,其次才是统计检验。,47,第四节 多元线性回归模型的预测,一、应变量平均值、个别值的点预测 二、应变量平均值、个别值的区间预测,48,一、点预测,49,二、区间预测,50,附:一元、多元线性回归的点估计、区间估计一览表。,51,一元,多元,52,多元线性回归分析,某化妆品销售情况的15组调查数据。观测变量分别是年销售(万瓶) ,
11、地区人口(万人) 和人均年收入 (千元)。建立二元线性回归销售模型。某地区人口为22万人,人均年收入为2.5千元,可能的销售量为多少?Y 1.620000 27.40000 2.450000 2.230000 37.50000 3.802000 1.160000 19.50000 2.137000 2.120000 37.00000 2.605000,化妆品销售量预测,53,54,设定模型:,Variable Coefficient Std. Error t-Statistic Prob. C 0.080841 0.022708 3.560023 0.0039X1 0.049621 0.000
12、566 87.72771 0.0000X2 0.074162 0.009044 8.199705 0.0000R-squared 0.999055 Mean dependent var 1.500000 Adjusted R-squared 0.998897 S.D. dependent var 0.612442 S.E. of regression 0.020340 Akaike info criterion -7.613449 Sum squared resid 0.004965 Schwarz criterion -7.471839 Log likelihood 38.81679 F-statistic 6340.220 Durbin-Watson stat 2.418249 Prob(F-statistic) 0.000000,55,(0.02278) (0.00566) (0.09044),(3.56002) (87.7277) (8.199705),点预测:,56,57,58,59,genr Y=log(Q),60,补充:多元线性回归模型系数的标准化,注意:解释变量的计量单位不同时,其对Y影响的重要性! 如1):若Y的单位是吨、X2的单位是吨、X3的单位也是吨;若Y的单位是吨、X2的单位是吨、X3的单位是公斤。,