收藏 分享(赏)

第二章 一元线性回归模型.ppt

上传人:hwpkd79526 文档编号:10070175 上传时间:2019-10-05 格式:PPT 页数:163 大小:1.94MB
下载 相关 举报
第二章 一元线性回归模型.ppt_第1页
第1页 / 共163页
第二章 一元线性回归模型.ppt_第2页
第2页 / 共163页
第二章 一元线性回归模型.ppt_第3页
第3页 / 共163页
第二章 一元线性回归模型.ppt_第4页
第4页 / 共163页
第二章 一元线性回归模型.ppt_第5页
第5页 / 共163页
点击查看更多>>
资源描述

1、计量经济学 理论方法EViews应用 郭存芝 杜延军 李春吉 编著,电子教案,第二章 一元线性回归模型, 学习目的,理解回归模型的概念,学会对一元线性回归模型进行参数估计、检验和预测,为多元线性回归模型的学习打下基础。, 基本要求,1) 理解样本回归模型、总体回归模型的概念;2) 掌握一元线性回归模型的普通最小二乘参数估计方法,了解一元线性回归模型的基本假设、一元线性回归模型的最大似然参数估计方法、一元线性回归模型的普通最小二乘参数估计量与样本回归线的性质、一元线性回归模型随机误差项方差的估计;3) 学会对一元线性回归模型进行拟合优度检验,对一元线性回归模型的参数进行区间估计和假设检验;4)

2、学会进行一元线性回归模型被解释变量的总体均值和个别值预测;,第二章 一元线性回归模型,第二章 一元线性回归模型回归模型概述一元线性回归模型的参数估计一元线性回归模型的拟合优度检验 一元线性回归模型的统计推断一元线性回归模型的预测案例分析, 相关分析与回归分析,第一节 回归模型概述, 随机误差项, 总体回归模型, 样本回归模型,1. 经济变量之间的关系,计量经济研究是对经济变量之间关系的研究,针对某一具体经济问题展开研究时,首先需要考察的就是相关经济变量之间有没有关系、有什么样的关系。,确定的函数关系,不确定的相关关系,经济变量之间的关系,一、相关分析与回归分析,函数关系,指某一经济变量可直接表

3、示为其他经济变量的确定的函数,函数表达式中没有未知参数,不存在参数估计的问题。,1) 某一商品的销售收入Y与单价P、销售数量Q之间的关系Y = PQ 2) 某一农作物的产量Q与单位面积产量q 、种植面积S之间的关系Q = q S,例如:,一、相关分析与回归分析,相关关系,指不同经济变量的变化趋势之间存在某种不确定的联系,某一或某几个经济变量的取值确定后,对应的另一经济变量的取值虽不能唯一确定,但按某种规律有一定的取值范围。,居民消费C与可支配收入Y之间的关系,可支配收入的取值确定后,消费的取值虽不能唯一确定,但有一定的取值范围,0 C Y ,遵循边际消费倾向递减的规律。居民消费C与可支配收入Y

4、之间的关系可表示为C = + Y, 、为待估参数。,例如:,相关关系的表达式一般表示为含有未知参数的函数形式,需要进行参数估计。,一、相关分析与回归分析,相关关系的分类,a)按照涉及的变量的数量,单相关(一元相关),复相关(多元相关),- 指两个经济变量之间存在的相关关系,- 指多个经济变量之间存在的相关关系,可能是几个经济变量的某种综合效果与一个经济变量有趋势方面的联系。,一、相关分析与回归分析,相关关系的分类,b)按照相关的程度,完全相关,不完全相关,不相关,一、相关分析与回归分析,相关关系的分类,c)按照相关的性质,正相关,负相关,一、相关分析与回归分析,相关关系的分类,c)按照相关的性

5、质,线性相关,非线性相关,一、相关分析与回归分析,函数关系与相关关系的区别,确定的函数关系可以直接用于经济活动,无需分析。,不确定的相关关系,隐含着某种经济规律,是有关研究的重点,一、相关分析与回归分析,2. 相关分析,研究变量之间的相关关系的形式和程度的一种统计分析方法,主要通过绘制变量之间关系的散点图和计算变量之间的相关系数进行。,绘制变量之间关系的散点图,例如:,计算变量之间的相关系数,一、相关分析与回归分析,相关系数,十九世纪末英国著名统计学家卡尔皮尔逊(Karl Pearson)度量两个变量之间的线性相关程度的简单相关系数(简称相关系数),一、相关分析与回归分析,(2-2),(2-3

6、),或,相关系数的取值介于11之间,取值为负表示两变量之间存在负相关关系;取值为正表示两变量之间存在正相关关系;取值为1表示两变量之间存在完全负相关关系;取值为0表示两变量不相关;取值为1表示两变量之间存在完全正相关关系。,一、相关分析与回归分析,对变量间统计依赖关系的考察主要是通过相关分析(correlation analysis)或回归分析(regression analysis)来完成的:,例如:函数关系:,统计依赖关系/统计相关关系:,3. 回归分析,研究不仅存在相关关系而且存在因果关系的变量之间的依存关系的一种分析理论与方法,是计量经济学的方法论基础,,主要内容,1)设定理论模型,描

7、述变量之间的因果关系;,2)根据样本观察数据利用适当方法对模型参数进行估计,得到回归方程;,3)对回归方程中的变量、方程进行显著性检验,推求参数的置信区间、模型的预测置信区间;,4)利用回归模型解决实际经济问题。,一、相关分析与回归分析,4. 相关分析与回归分析之间的关系,联系:,1)都是对存在相关关系的变量的统计相关关系的研究; 2)都能测度线性相关程度的大小; 3)都能判断线性相关关系是正相关还是负相关。,4. 相关分析与回归分析之间的关系,区别:,1)相关分析仅仅是从统计数据上测度变量之间的相关程度,不考虑两者之间是否存在因果关系,因而变量的地位在相关分析中是对等的;回归分析是对变量之间

8、的因果关系的分析,变量的地位是不对等的,有被解释变量和解释变量之分。,2)相关分析主要关注变量之间的相关程度和性质,不关注变量之间的具体依赖关系。回归分析在关注变量之间的相关程度和性质的同时,更关注变量之间的具体依赖关系,因而可以深入分析变量间的依存关系,有可能达到掌握其内在规律的目的,具有更重要的实践意义。,习 题,下表列出若干对自变量与因变量。对每一对变量,你认为它们之间的关系如何?是正的、负的、还是无法确定?并说明理由。,含有随机误差项是计量经济学模型与数理经济模型的一大区别。,例如:,对于供给不足下的生产活动,可以认为产出是由资本、劳动、技术等投入要素决定的,并且,一般情况下,产出随着

9、投入要素的增加而增加,但要素的边际产出递减。,二、随机误差项,例如:,对于供给不足下的生产活动,可以认为产出是由资本、劳动、技术等投入要素决定的,并且,一般情况下,产出随着投入要素的增加而增加,但要素的边际产出递减。,二、随机误差项,存在原因,第一,人类的经济行为本身带有随机性;,第二,通常一个变量总是受众多因素的影响;,第三,任何函数反映经济变量之间的关系都只是一种简化反映;,第四,经济数据来源于调查统计,而非严格的控制实验;,二、随机误差项,结论,一个经济变量通常不能被另一个经济变量完全精确地决定,需要引入随机误差项来反映各种误差的综合影响,主要包括:,1)变量的内在随机性的影响;,2)解

10、释变量中被忽略的因素的影响;,3)模型关系设定误差的影响;,4)变量观察值的观察误差的影响;,5)其他随机因素的影响。,二、随机误差项,有何特性?,众多因素对被解释变量Y的影响代表的综合体 对Y的影响方向有正有负 由于是次要因素代表,对Y的总平均影响可能是0 对Y的影响是非趋势性的,而是随机扰动。,二、随机误差项,习 题,例1、令kids表示一名妇女生育孩子的数目,educ表示该妇女接受过教育的年数。生育率对教育年数的简单回归模型为(1)随机扰动项包含什么样的因素?它们可能与教育水平相关吗? (2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。,习题答案,(1)收入、年

11、龄、家庭状况、政府的相关政策等也是影响生育率的重要的因素,在上述简单回归模型中,它们被包含在了随机扰动项之中。有些因素可能与增长率水平相关,如收入水平与教育水平往往呈正相关、年龄大小与教育水平呈负相关等。 (2)当归结在随机扰动项中的重要影响因素与模型中的教育水平educ相关时,上述回归模型不能够揭示教育对生育率在其他条件不变下的影响,因为这时出现解释变量与随机扰动项相关的情形,基本假设4不满足。,1总体回归曲线与总体回归函数,给定解释变量条件下被解释变量的期望轨迹称为总体回归曲线(population regression curve),或总体回归线(population regressio

12、n line)。,描述总体回归曲线的函数称为总体回归函数(population regressionfunction)。,三、总体回归模型,三、总体回归模型,例2-1,假设一个由100个家庭构成的总体,并假设这100个家庭的月可支配收入水平只限于1300元、1800元、2300元、2800元、3300元、3800元、4300元、4800元、5300元、5800元10种情况,每个家庭的月可支配收入与消费数据如表2-1所示,要研究这一总体的家庭月消费支出Y与家庭月可支配收入X之间的关系,以便根据已知的家庭月可支配收入水平测算该总体的家庭月消费支出平均水平。,表2-1 100个家庭的月可支配收入与消

13、费数据 单位:元,家庭消费支出主要取决于家庭可支配收入,但不是唯一取决于家庭可支配收入,还会受到其他各种不确定性因素的影响,因而可支配收入相同的不同家庭的消费支出各不相同。,由此可求得对应于家庭可支配收入X的各个水平的家庭消费支出Y的条件均值(conditional mean)或称为条件期望(conditional expectation),如表2-2所示。,析:,表2-2 100个家庭的月可支配收入与消费数据 单位:元,由表2-1、表2-2中的数据绘制不同可支配收入家庭的消费支出散点图、家庭消费支出与可支配收入关系的总体回归曲线,如图2-1所示。,从散点图可以清晰地看出,不同家庭的消费支出虽

14、然存在差异,但总体趋势随可支配收入的增加而增加,总体回归曲线反映了这一趋势。,回归函数(PRF)说明被解释变量Y的平均状态(总体条件期望)随解释变量X变化的规律。,含义:,函数形式:可以是线性或非线性的。,将居民消费支出看成是其可支配收入的线性函数时:,为一线性函数。其中,0,1是未知参数,称为回归系数(regression coefficients)。,三、总体回归模型,事实上,经济活动中的总体包含的个体的数量往往非常多,一般不大可能像例2-1假设的那样得到总体中所有个体的观察数据,因此也就不大可能依据总体的所有观察数据计算得到被解释变量Y的条件期望,无法画出精确的总体回归曲线,相应地,总体

15、回归函数的具体形式也无法精确确定。所以,对于总体回归函数,通常只能根据经济理论或实践经验进行设定,也就是说,通常需要对总体回归函数作出合理的假设。,三、总体回归模型,2总体回归模型,三、总体回归模型,的离差(deviation),,三、总体回归模型,例:个别家庭的消费支出为:,(*)式称为总体回归函数(方程)PRF的随机设定形式。表明被解释变量除了受解释变量的系统性影响外,还受其他因素的随机性影响。,(1)该收入水平下所有家庭的平均消费支出E(Y|Xi),称为系统性(systematic)或确定性(deterministic)部分。(2)其他随机或非确定性(nonsystematic)部分i。

16、,即,给定收入水平Xi ,个别家庭的支出可表示为两部分之和:,(*),由于方程中引入了随机项,成为计量经济学模型,因此也称为总体回归模型。,三、总体回归模型,3线性总体回归模型,确定性部分为线性函数的总体回归模型称为线性总体回归模型。,线性总体回归模型是计量经济学中最常见的总体回归模型。,只含有一个解释变量的线性总体回归模型称为一元线性总体回归模型, 简称一元线性回归模型或简单线性回归模型(simple linear regressionmodel),其一般形式是,(2-8),三、总体回归模型,3线性总体回归模型,三、总体回归模型,注意:,这里所说的线性函数和通常意义下的线性函数不同,这里的线

17、性函数指参数是线性的,即待估参数都只以一次方出现,解释变量可以是线性的,也可以不是线性的。,例如:,都是线性回归模型。,三、总体回归模型,注意:,例如:,都不是线性回归模型。,三、总体回归模型,对于参数线性、解释变量非线性的回归模型,只要稍作变换,就可化为线性回归模型的一般形式。,例如:,模型,三、总体回归模型,4线性回归模型的普遍性,例如,著名的Cobb-Dauglas生产函数表现为幂函数形式,著名的菲利普斯曲线(Phillips curves)表现为双曲线形式。,三、总体回归模型,对于其他复杂的函数形式,可通过级数展开化为线性形式,三、总体回归模型,+余项,令,,,,,余项,原模型可化为,

18、三、总体回归模型,总体的信息往往无法掌握,现实的情况只能是在一次观测中得到总体的一个样本。,问题1:能从一次抽样中获得总体的近似的信息吗?,回答:能,四、样本回归模型,问题2:如果可以,如何从抽样中获得总体的近似信息?,1样本回归函数与样本回归曲线,根据样本数据对总体回归函数作出的估计称为样本回归函数。,由样本回归函数绘制的曲线称为样本回归曲线(样本回归线)。,四、样本回归模型,例2-2,假设没有取得总体中所有家庭的可支配收入与消费支出数据,而是按可支配收入水平的不同水平调查取得了一组有代表性的样本,如表2-3所示。,表2-3 家庭月可支配收入与消费支出的一个样本 单位:元,以例2-1为例(假

19、设一个由100个家庭构成的总体,并假设这100个家庭的月可支配收入水平只限于1300元、1800元、2300元、2800元、3300元、800元、4300元、4800元、5300元、5800元10种情况,每个家庭的月可支配收入与消费数据如表2-1所示,要研究这一总体的家庭月消费支出Y与家庭月可支配收入X之间的关系,以便根据已知的家庭月可支配收入水平测算该总体的家庭月消费支出平均水平。),若将家庭月可支配收入X与消费支出Y的总体回归函数设定为一元线性回归函数的形式,四、样本回归模型,根据样本数据和样本回归方程可绘制不同可支配收入家庭的消费支出散点图、家庭消费支出与可支配收入关系的样本回归线,如图

20、2-2所示。,从图中可以清晰地看出,样本回归线是通过对样本数据的较好的拟合对总 体回归线作出的一种估计。,这里将样本回归线看成总体回归线的近似替代,则,注意:,回归分析的主要目的:根据样本回归函数SRF,估计总体回归函数PRF。,注意:这里PRF可能永远无法知道。,即,根据,估计,2样本回归模型,在样本回归函数中引入残差项后,得到的是随机方程,成为了计量经济学模型,称为样本回归模型。,对于例2-2中的样本回归函数,例如:,四、样本回归模型,3线性样本回归模型,确定性部分是线性函数的样本回归模型称为线性样本回归模型。,四、样本回归模型,3线性样本回归模型,四、样本回归模型,习 题,判断正误并说明

21、理由:1、随机误差项ui和残差项ei是一回事 2、总体回归函数给出了对应于每一个自变量的因变量的值 3、线性回归模型意味着变量是线性的 4、在线性回归模型中,解释变量是原因,被解释变量是结果回答下列问题:随机误差项ui和残差项ei的区别与联系。,习 题,下列方程哪些是正确的?哪些是错误的?为什么? , 一元线性回归模型的基本假设,第二节 一元线性回归模型的参数估计, 参数的普通最小二乘估计, 参数的最大似然估计, 普通最小二乘参数估计量的性质, 普通最小二乘样本回归函数的性质, 随机误差项方差的估计, 一元线性回归模型的基本假设, 参数的普通最小二乘估计, 参数的最大似然估计, 普通最小二乘参

22、数估计量的性质, 普通最小二乘样本回归函数的性质, 随机误差项方差的估计,讲课内容,一、一元线性回归模型的基本假设,一元线性回归模型的基本假设包括对解释变量的假设、对 随机误差项的假设、对模型设定的假设几个方面,主要如下:,1)解释变量是确定性变量,不是随机变量。,2)随机误差项具有0均值、同方差,且在不同样本点之间是独立的,不存在序列相关,即,3)随机误差项与解释变量不相关。即,4)随机误差项服从正态分布,即,5)回归模型是正确设定的。,假设:线性回归模型就参数而言是线性的对变量为线性: 对参数为线性:,E(Y|Xi)=+xi E(Y|Xi)=+x2i,E(Y|Xi)=+x2i E(Y|Xi

23、)=xi,变量非线性函数有多种形式,其中一些可以通过适当的方式变换为参数线性函数,一、一元线性回归模型的基本假设,这5条假设中的前4条是线性回归模型的古典假设,也称为高斯假设,满足古典假设的线性回归模型称为古典线性回归模型(classical linear regression model)。,在这5条假设中,若前两条假设满足,第3条自然满足,因为前两条假设成立时有,且由第2条假设有,因为,习 题,例1、令kids表示一名妇女生育孩子的数目,educ表示该妇女接受过教育的年数。生育率对教育年数的简单回归模型为(1)随机扰动项包含什么样的因素?它们可能与教育水平相关吗? (2)上述简单回归分析能

24、够揭示教育对生育率在其他条件不变下的影响吗?请解释。,习题答案,(1)收入、年龄、家庭状况、政府的相关政策等也是影响生育率的重要的因素,在上述简单回归模型中,它们被包含在了随机扰动项之中。有些因素可能与增长率水平相关,如收入水平与教育水平往往呈正相关、年龄大小与教育水平呈负相关等。 (2)当归结在随机扰动项中的重要影响因素与模型中的教育水平educ相关时,上述回归模型不能够揭示教育对生育率在其他条件不变下的影响,因为这时出现解释变量与随机扰动项相关的情形,基本假设4不满足。, 一元线性回归模型的基本假设, 参数的普通最小二乘估计, 参数的最大似然估计, 普通最小二乘参数估计量的性质, 普通最小

25、二乘样本回归函数的性质, 随机误差项方差的估计,讲课内容,二、参数的普通最小二乘估计,普通最小二乘法(ordinary least squares,OLS)的基本思想使样本回归函数尽可能好地拟合样本数据,表现在图上就是要使样本散点偏离样本回归线的距离最小,表示被解释变量的估计值与实际观察值的偏差总体上最小,称为最小二乘准则。,对于一元线性回归模型,(2-14),整理得,(2-15),解得,(2-16),方程组(2-14)或(2-15)称为正规方程组。,式(2-16)可改写为,(2-17),若一元线性回归模型中没有常数项,即模型为,可得普通最小二乘参数估计量为,(2-18),例:在上述家庭可支配

26、收入-消费支出例中,对于所抽出的一组样本数,参数估计的计算可通过下面的表2.2.1进行。,因此,由该样本估计的回归方程为:,例2-3,以例2-2为例(假设一个由100个家庭构成的总体,并假设这100个家庭的月可支配收入水平只限于1300元、1800元、2300元、2800元、3300元、800元、4300元、4800元、5300元、5800元10种情况,每个家庭的月可支配收入与消费数据如表2-1所示,要研究这一总体的家庭月消费支出Y与家庭月可支配收入X之间的关系,以便根据已知的家庭月可支配收入水平测算该总体的家庭月消费支出平均水平。),注意小数点取值,大样本时影响较大,答 疑,为什么要设定古典

27、假定? 回归分析的目的不仅是获得 ,而且要对真实值做出推断。即用样本对总体进行推断,统计学中称为统计推断。 要想利用样本对总体做出推断,不仅要知道代表总体的对应函数形式,还需要对Yi的产生方式做出某些假定。如果不知道Xi和 是怎样产生的,即不对它们做出某些假定,就无法得出Yi的统计推断。也无法根据 对其真实值做出推断。,(2-8),习 题,线性回归模型随机误差项的0均值假设是否可以表示为 ?为什么?, 一元线性回归模型的基本假设, 参数的普通最小二乘估计, 参数的最大似然估计, 普通最小二乘参数估计量的性质, 普通最小二乘样本回归函数的性质, 随机误差项方差的估计,讲课内容,三、参数的最大似然

28、估计,最大或然法(Maximum Likelihood,简称ML),也称最大似然法,是不同于最小二乘法的另一种参数估计方法,是从最大或然原理出发发展起来的其它估计方法的基础。基本原理:对于最大或然法,当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该使得从模型中抽取该n组样本观测值的概率最大。,三、参数的最大似然估计,对于一元线性回归模型,若满足基本假设,则,那么Yi服从如下的正态分布:,于是,Y的概率密度函数为,(i=1,2,n),假如模型的参数估计量已经求得,为,正态分布:概率密度函数,回 顾,f(x) = 随机变量 X 的频数 = 总体方差 =3.14159; e = 2.71

29、828 x = 随机变量的取值 (- x ) = 总体均值,的联合概率密度函数是,(2-19),由于似然函数极大化等价于似然函数的对数,(2-21),的极大化。,所以,根据微积分中求极限的原理,分别求式(2-21)对,的一阶偏导数,并令求偏导的结果等于0,可得正规方程组,(2-22),解得,(2-23),可见,在满足一系列基本假设的情况下,模型结构参数的最大或然估计量与普通最小二乘估计量是相同的。习题:P72.15, 一元线性回归模型的基本假设, 参数的普通最小二乘估计, 参数的最大似然估计, 普通最小二乘参数估计量的性质, 普通最小二乘样本回归函数的性质, 随机误差项方差的估计,讲课内容,当

30、模型参数估计出后,需考虑参数估计值的精度,即是否能代表总体参数的真值,或者说需考察参数估计量的统计性质。,四、普通最小二乘参数估计量的性质,渐近无偏性,估计量 优劣性,渐近有效性,一致性,无偏性,有效性,线性性,线性性,无偏性,有效性 (最小方差性),渐近无偏性,一致性,渐近有效性,小样本性质,大样本性质 (渐进性质),指参数估计量的数学期望等于参数的真实值,指在所有的线性、无偏估计量中该参数估计量的方差最小,指样本容量趋于无穷大时,参数估计量的数学期望趋于参数的真实值,样本容量趋于无穷大时,参数估计量依概率收敛于参数的真实值,指样本容量趋于无穷大时,在所有的一致估计量中该参数估计量具有最小的

31、渐近方差。,四、普通最小二乘参数估计量的性质,1.线性性- 估计参数 和 均是样本观测值(Xi和Yi)的 线性函数。,OLS,四、普通最小二乘参数估计量的性质,证:,令,则,同理,四、普通最小二乘参数估计量的性质,2.无偏性- 估计参数 和 的均值等于总体参数真值,证:,易知,故,同样地,容易得出,?,四、普通最小二乘参数估计量的性质,四、普通最小二乘参数估计量的性质,3.有效性:利用OLS估计的参数 和 的方差最小,四、普通最小二乘参数估计量的性质,3.有效性,(2)证明最小方差性,其中,ci=vi+di,di为不全为零的常数 则容易证明,四、普通最小二乘参数估计量的性质,1)满足线性性、无

32、偏性、有效性三个小样本性质的参数估计量称为最佳线性无偏估计量(best linear unbiased estimator,BLUE)。,2)满足小样本性质的参数估计量自然也满足大样本性质。,3)在小样本性质不满足的情况下,应扩大样本容量,考察大样本性质。,4)在满足基本假设情况下,一元线性回归模型的普通最小二乘参数估计量是最佳线性无偏估计量。(why?),几点说明:,四、普通最小二乘参数估计量的性质,4.一致性,由于最小二乘估计量拥有一个“好”的估计量所应具备的小样本特性,它自然也拥有大样本特性。,四、普通最小二乘参数估计量的性质,P41 (2-29),习 题,假定有如下的回归结果: ,其中

33、,Y表示美国的咖啡的消费量(每天每人消费的杯数),X表示咖啡的零售价格(美元/杯),t表示时间。 要求: (1)这是一个时间序列回归还是横截面序列回归? (2)如何解释截距的意义,它有经济含义吗?如何解释斜率? (3)能否求出真实的总体回归函数? (4)根据需求的价格弹性定义:弹性=斜率(X/Y),依据上述回归结果,你能求出对咖啡需求的价格弹性吗?如果不能,计算此弹性还需要其他什么信息?,习 题 答 案,截距2.6911表示咖啡零售价在时刻为每磅0美元时,美国平均消费量为每天每人2.6911杯,这个数字没有经济意义;斜率-0.4795表示咖啡零售价与消费量负相关,在时刻t,价格上升1美元/磅,

34、则平均每天每人消费量减少0.4795杯; 不能; 不能;在同一条需求曲线上不同点的价格弹性不同,若要求出,须给出具体的值及与之对应的值。,习 题,令 和 分别为Y对X回归和X对Y回归中的斜率,试证明:其中r为X和Y之间的线性相关系数 p24 (2-2), 一元线性回归模型的基本假设, 参数的普通最小二乘估计, 参数的最大似然估计, 普通最小二乘参数估计量的性质, 普通最小二乘样本回归函数的性质, 随机误差项方差的估计,讲课内容,五、普通最小二乘样本回归函数的性质,2被解释变量的估计的均值等于实际值的均值,即,3残差和为零,即,4解释变量与残差的乘积之和为零,即,5被解释变量的估计与残差的乘积之

35、和为零,即,习 题,对于经济计量模型: ,其OLS估计参数的特性在下列情况下会受到什么影响: (1)观测值数目n增加; (2)Xi各观测值差额增加; (3)Xi各观测值近似相等,答 案,(1)根据大样本特性,更接近真实值 (2)更接近真实值 (3)使得 变得不稳定,甚至无法计算, 一元线性回归模型的基本假设, 参数的普通最小二乘估计, 参数的最大似然估计, 普通最小二乘参数估计量的性质, 普通最小二乘样本回归函数的性质, 随机误差项方差的估计,讲课内容,六、参数估计量的概率分布及随机干扰项方差的估计,六、参数估计量的概率分布及随机干扰项方差的估计,2、随机误差项的方差2的估计,由于随机项i不可

36、观测,只能从i的估计残差ei出发,对总体方差进行估计。,2又称为总体方差。,可以证明,2的最小二乘估计量为,它是关于2的无偏估计量。,2的最大似然估计量,即,2、随机误差项的方差2的估计,2的最大或然估计量不具无偏性,但却具有一致性。,最大似然法与最小二乘法,结构参数估计结果 随机误差项的方差的估计结果 应用范围,习 题1,线性回归模型有哪些基本假设?违背基本假设的计量经济学模型是否就不可估计?,习 题2,p18,习 题,线性回归模型的基本假设(实际是针对普通最小二乘法的基本假设)是:解释变量是确定性变量,而且解释变量之间互不相关;随机误差项具有0均值和同方差;随机误差项在不同样本点之间是独立

37、的,不存在序列相关;随机误差项与解释变量之间不相关;随机误差项服从0均值、同方差的正态分布。违背基本假设的计量经济学模型还是可以估计的,只是不能使用普通最小二乘法进行估计。,第二节 结束, 一元线性回归模型的基本假设, 参数的普通最小二乘估计, 参数的最大似然估计, 普通最小二乘参数估计量的性质, 普通最小二乘样本回归函数的性质, 随机误差项方差的估计,内容回顾,回归分析是要通过样本所估计的参数来代替总体的真实参数,或者说是用样本回归线代替总体回归线。,尽管从统计性质上已知,如果有足够多的重复 抽样,参数的估计值的期望(均值)就等于其总体的参数真值,但在一次抽样中,估计值不一定就等于该真值。那

38、么,在一次抽样中,参数的估计值与真值的差异有多大,是否显著,这就需要进一步进行统计检验。主要包括拟合优度检验、变量的显著性检验及参数的区间估计。,第三节 一元线性回归模型的拟合优度检验,问题:采用普通最小二乘估计方法,已经保证了模型最好地拟合了样本观测值,为什么还要检验拟合程度?,要考虑: 残差平方和会随样本容量增大而增大 样本数据的整体数值大小会影响残差平方和。因此,残差平方和不具有横向可比性。,第三节 一元线性回归模型的拟合优度检验,拟合优度指样本回归线对样本数据拟合的精确程度,拟合优度检验,拟合优度检验方法通过构造表征拟合优度的统计量,对模型的拟合效果作出评价,拟合优度检验实质通过残差平

39、方和构造了拟合优度的度量指标一一决定系数,其基础是被解释变量的离差分解。,讲课内容,1、离差分解 2、决定系数 3、决定系数与相关系数的关系,如果Yi=i 即实际观测值落在样本回归“线”上,则拟合最好。 可认为,“离差”全部来自回归线,而与“残差”无关。,能够由回归直线解释,不能由回归直线解释,(2-37),记,=,总体平方和或总离差平方和反映样本观察值的总体离差的大小,回归平方和反映模型中由解释变量解释的那部分离差的大小,残差平方和反映模型中解释变量未解释的那部分离差的大小,这样,式(2-37)可表示为,(2-38),讲课内容,1、离差分解 2、决定系数 3、决定系数与相关系数的关系,二、决

40、定系数,(2-38),(2-39),(2-40),是模型中由解释变量解释的那部分离差占总离差的比重,(2-41),是模型中解释变量未解释的那部分离差占总离差的比重,决定系数( ),(2-42),TSS=ESS+RSS,Y的观测值围绕其均值的总离差(total variation)可分解为两部分:一部分来自回归线(ESS),另一部分则来自随机势力(RSS)。,在给定样本中,TSS不变,如果实际观测点离样本回归线越近,则ESS在TSS中占的比重越大。,拟合优度:回归平方和ESS/Y的总离差TSS,可决系数的取值范围:0,1R2越接近1,说明实际观测点离样本线越近,拟合优度越高。可决系数依赖于所给出

41、的回归方程的数学形式,同样的因果关系采用不同的表达式将得到不同的R2。不要将R2高低作为评价模型优劣的唯一标准,估计方程的目的是得到可靠的参数估计。,例2-4,以例2-3为例(假设一个由100个家庭构成的总体,并假设这100个家庭的月可支配收入水平只限于1300元、1800元、2300元、2800元、3300元、800元、4300元、4800元、5300元、5800元10种情况,每个家庭的月可支配收入与消费数据如表2-1所示,要研究这一总体的家庭月消费支出Y与家庭月可支配收入X之间的关系,以便根据已知的家庭月可支配收入水平测算该总体的家庭月消费支出平均水平。),求关于家庭消费支出与可支配收入关

42、系的一元线性回归模型的拟合优度。,模型的拟合效果较好,或,讲课内容,1、离差分解 2、决定系数 3、决定系数与相关系数的关系,三、决定系数与相关系数的关系,三、决定系数与相关系数的关系,相关系数:度量变量X、Y之间线性相关程度。不涉及变量间的因果关系。 决定系数:度量变量X、Y之间线性因果关系的程度。告诉我们在因变量的变异中由解释变量能够解释的部分占多大比例。度量变量X、Y之间的单向因果关系的程度。,在例2.1.1的收入-消费支出例中,,注:可决系数是一个非负的统计量。,第四节 一元线性回归模型的参数的统计推断,参数的假设检验,参数估计与检验结果的表述,参数的区间估计,参数估计量的分布,一、参

43、数估计量的分布,服从正态分布,进行标准化变换可得,的样本方差,的样本标准差,服从自由度为n-2的t 分布,二、参数的区间估计,区间,由此可得,所以,在 显著性水平下,参数 的置信区间分别为,例2-5,以例2-3为例(假设一个由100个家庭构成的总体,并假设这100个家庭的月可支配收入水平只限于1300元、1800元、2300元、2800元、3300元、800元、4300元、4800元、5300元、5800元10种情况,每个家庭的月可支配收入与消费数据如表2-1所示,要研究这一总体的家庭月消费支出Y与家庭月可支配收入X之间的关系,以便根据已知的家庭月可支配收入水平测算该总体的家庭月消费支出平均水

44、平。),答案,的95%的置信区间为,的95%的置信区间为,三、参数的假设检验,参数的假设检验检验对模型参数所作的某一个假设是否成立,基础是参数估计量的分布性质,采用的方法是统计学中的假设检验,对模型参数所作的假设,可以是参数等于某一特定的数值,可以是参数大于或小于某一特定的数值,针对参数的某一假设,检验的基本思想是由原假设和参数估计量构造一个小概率事件,判断在给定显著性水平下这一小概率事件是否发生,如果小概率事件发生了,则拒绝原假设,接受备择假设;如果小概率事件没有发生,则接受原假设,拒绝备择假设。因为小概率事件是一次抽样中几乎不可能发生的事件,小概率事件发生,说明原假设不真。,由式(2-45

45、)、式(2-46),可利用 t 分布进行参数的假设检验,称为 t 检验。,,,接受原假设,,,如果,接受原假设,例2-6,以例2-3为例(假设一个由100个家庭构成的总体,并假设这100个家庭的月可支配收入水平只限于1300元、1800元、2300元、2800元、3300元、800元、4300元、4800元、5300元、5800元10种情况,每个家庭的月可支配收入与消费数据如表2-1所示,要研究这一总体的家庭月消费支出Y与家庭月可支配收入X之间的关系,以便根据已知的家庭月可支配收入水平测算该总体的家庭月消费支出平均水平。),析:,查t分布表可得,影响显著,P54 P值,四、参数估计与检验结果的

46、表述,以例2-3例2-6对消费函数模型的分析为例,,可按规范格式将分析结果表述为,第一行是样本回归函数;,第二行是对应参数估计值的t 统计值,第三行是模型的拟合优度,习题p26、25、18,第五节 一元线性回归模型的预测,在样本数据反映的经济变量之间的关系基本上没有变化的情况下,可利用经过参数估计和检验的模型,由已知或事先测定的解释变量的数值,预测被解释变量的数值。,被解释变量的总体均值的点预测,被解释变量的总体均值的区间预测,被解释变量的个别值的区间预测,(2-49),( Why? ),例2-7,以例2-3为例(假设一个由100个家庭构成的总体,并假设这100个家庭的月可支配收入水平只限于1

47、300元、1800元、2300元、2800元、3300元、800元、4300元、4800元、5300元、5800元10种情况,每个家庭的月可支配收入与消费数据如表2-1所示,要研究这一总体的家庭月消费支出Y与家庭月可支配收入X之间的关系,以便根据已知的家庭月可支配收入水平测算该总体的家庭月消费支出平均水平。),利用例2-3建立的消费函数模型,求家庭可支配收入为6000元时家庭平 均消费支出的预测值。,可得家庭平均消费支出的预测值为,析:,由于,可以证明,所以,其中,对于给定的显著性水平,例2-8,以例2-3为例(假设一个由100个家庭构成的总体,并假设这100个家庭的月可支配收入水平只限于1300元、1800元、2300元、2800元、3300元、800元、4300元、4800元、5300元、5800元10种情况,每个家庭的月可支配收入与消费数据如表2-1所示,要研究这一总体的家庭月消费支出Y与家庭月可支配收入X之间的关系,以便根据已知的家庭月可支配收入水平测算该总体的家庭月消费支出平均水平。),利用例2-3建立的消费函数模型,求家庭可支配收入为6000元时家庭平 均消费支出的置信度为95%的预测置信区间。,析:,可求得,预测置信区间为,已知,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报