收藏 分享(赏)

计量经济学2.1 回归分析概述.ppt

上传人:fmgc7290 文档编号:8238054 上传时间:2019-06-16 格式:PPT 页数:42 大小:541.50KB
下载 相关 举报
计量经济学2.1 回归分析概述.ppt_第1页
第1页 / 共42页
计量经济学2.1 回归分析概述.ppt_第2页
第2页 / 共42页
计量经济学2.1 回归分析概述.ppt_第3页
第3页 / 共42页
计量经济学2.1 回归分析概述.ppt_第4页
第4页 / 共42页
计量经济学2.1 回归分析概述.ppt_第5页
第5页 / 共42页
点击查看更多>>
资源描述

1、1,单方程计量经济学模型 理论与方法,Theory and Methodology of Single-Equation Econometric Model,2,第二章 经典单方程计量经济学模型: 一元线性回归模型,2.1 回归分析概述 2.2 一元线性回归模型的参数估计 2.3 一元线性回归模型检验 2.4 一元线性回归模型预测 2.5 实例,3,2.1 回归分析概述,一、变量间的关系及回归分析的基本概念,二、总体回归函数,三、随机扰动项,四、样本回归函数(SRF),4,“回归”一词的历史渊源,“回归” 一词最先由弗朗西斯高尔顿(Francis Galton)引入。高尔顿的普遍回归定律( l

2、aw of universal regression)高尔顿发现,虽然有一个趋势父母高,儿女也高;父母矮,儿女也矮,但给定父母的身高,儿女辈的平均身高却趋向于或者“回归”到全体人口的平均身高。换言之,尽管父母都异常高或异常矮,但儿女的身高却有走向人口总体平均身高的趋势。,5,回归的现代释义,“回归分析” 是关于研究一个叫做被解释变量(因变量)的变量对另一个或多个叫做解释变量的变量的依赖关系;其用意在于通过后者(在重复抽样中)的已知值或设定值,去估计和(或)预测前者的(总体)均值。,6,回归的例子(1),高尔顿的普遍回归定律。,回归分析关心的儿辈身高的均值对给定父辈身高的依赖关系。从而可以通过给

3、定父辈的身高,来预测儿辈的平均身高。,回归线,7,回归的例子(2),不同的固定年龄处测度的一个假想的男孩身高总体分布图。,回归分析关心的男孩身高的均值对给定年龄的依赖关系。从而可以对给定的年龄,来预测男孩的平均身高。,回归线,8,回归的例子(3),由货币经济学中得知,其他条件不变,通货膨胀率愈高,人们愿意以货币形式保存的收入比例愈低。下图描述了这种关系。对这种关系进行回归分析,将使货币经济学家能够预测在各种通货膨胀率下人们愿意以货币形式保存的收人比例,9,变量间的关系,(1)确定性关系(函数关系):确定现象而非随机变量间的关系。例如:圆的面积与半径的关系;物质之间的引力与质量、距离之间的关系;

4、(2)统计关系:非确定现象随机变量间的关系(如统计依赖关系)例如:农作物收成与气温、降雨量、阳光量和施肥量之间的关系个人收入与受教育程度之间的关系收入与消费之间的关系,变量之间的关系,大体可分为两类:,10,相关分析与回归分析的区别,对变量间统计依赖关系的考察有两种易混淆的分析方法:(1)相关分析(correlation analysis):测度两个变量之间的线性关联力度。(可通过相关系数来判定)(2)回归分析(regression analysis):考察一个变量如何依赖于另一个变量而变化。从而试图根据一个变量的设定值来估计或预测另一变量的平均值。,11,相关系数,12,相关关系图例,13,

5、不线性相关并不意味着不相关;有相关关系并不意味着一定有因果关系;回归分析/相关分析研究一个变量对另一个(些)变量的统计依赖关系,但它们并不意味着一定有因果关系。相关分析对称地对待任何(两个)变量,两个变量都被看作是随机的。回归分析对变量的处理方法存在不对称性,即区分应变量(被解释变量)和自变量(解释变量):前者是随机变量,后者不是。,注意:,14,计量经济分析所用的数据类型,用于经验分析的数据主要有三类:(1)时间序列数据:一个时间序列是对一个变量在不同时间取值的一组观测结果。(2)横截面数据:一个或多个变量在一个时间点上收集的数据。(3)混合数据:数据中兼有时间序列数据和横截面数据的成分。,

6、15,时间序列数据例,16,横截面数据例,该表给出1990和1991年美国20个州的劳工会蛋产量和蛋价格(为两个横截面样本),17,混合数据例,该表给出1990和1991年美国20个州的劳工会蛋产量和蛋价格(为两个横截面样本,也是混合数据),18,回归分析(regression analysis)是研究一个变量关于另一个(些)变量的具体依赖关系的计算方法和理论。其用意:在于通过后者的已知或设定值,去估计和(或)预测前者的(总体)均值。这里:前一个变量被称为被解释变量(Explained Variable)或因变量(Dependent Variable),后一个(些)变量被称为解释变量(Expl

7、anatory Variable)或自变量(Independent Variable)。,回归分析的基本概念,19,回归分析构成计量经济学的方法论基础,其主要内容包括:(1)根据样本观察值对经济计量模型参数进行估计,求得回归方程;(估计)(2)对回归方程、参数估计值进行显著性检验;(假设检验)(3)利用回归方程进行分析、评价及预测。(应用),回归分析的主要内容,20,由于变量间关系的随机性,回归分析关心的是根据解释变量的已知或给定值,考察被解释变量的总体均值,即当解释变量取某个确定值时,与之统计相关的被解释变量所有可能出现的对应值的平均值。,例2.1:一个假想的社区有100户家庭组成,要研究该

8、社区每月家庭消费支出Y与每月家庭可支配收入X的关系。即如果知道了家庭的月收入,能否预测该社区家庭的平均月消费支出水平。,回归分析概念-总体回归函数,为达到此目的,将该100户家庭划分为组内收入差不多的10组,以分析每一收入组的家庭消费支出。,21,22,(1)由于不确定因素的影响,对同一收入水平X,不同家庭的消费支出不完全相同;(2)但由于调查的完备性,给定收入水平X的消费支出Y的分布是确定的,即以X的给定值为条件的Y的条件分布(Conditional distribution)是已知的, 如: P(Y=561|X=800)=,因此,给定收入X的值Xi,可得消费支出Y的条件均值(conditi

9、onal mean)或条件期望(conditional expectation):E(Y|X=Xi),该例中:E(Y | X=800),分析:,1/4,=(5611/4+5941/4+6271/4+6381/4)=605,23,描出散点图发现:随着收入的增加,消费“平均地说”也在增加,且Y的条件均值均落在一根正斜率的直线上。这条直线称为总体回归线。,24,概念:,在给定解释变量Xi条件下被解释变量Yi的期望轨迹称为总体回归线(population regression line),或更一般地称为总体回归曲线(population regression curve)。,称为(双变量)总体回归函数

10、(population regression function, PRF)。,相应的函数:,25,回归函数(PRF)说明被解释变量Y的平均状态(总体条件期望)随解释变量X变化的规律。,含义:,函数形式:可以是线性或非线性的。(函数形式是经验问题,有时候可借助理论。),例2.1中,将居民消费支出看成是其可支配收入的线性函数时:,其中,0,1是未知参数,称为回归系数(regression coefficients)。 0 称为截距,1 称为斜率系数。,26,“线性”一词的两种含义,对线性的两种解释(1)对变量为线性:变量的指数为1(2)对参数为线性:参数的指数为1(李子奈教材采用第一种解释,古扎拉

11、蒂教材采用第二种解释),27,回归分析概念-随机干扰项,总体回归函数说明在给定的收入水平Xi下,该社区家庭平均的消费支出水平。但对某一个别的家庭,其消费支出可能与该平均水平有偏差。,称i为观察值Yi围绕它的期望值E(Y|Xi)的离差(deviation),是一个不可观测的随机变量,又称为随机干扰项(stochastic disturbance)或随机误差项(stochastic error)。,记,或,28,例2.1中,个别家庭的消费支出为:,(*)式称为总体回归函数(方程)PRF的随机设定形式。表明被解释变量除了受解释变量的系统性影响外,还受其他因素的随机性影响。,(1)该收入水平下所有家庭

12、的平均消费支出E(Y|Xi),称为系统性(systematic)或确定性(deterministic)部分。(2)其他随机或非确定性(nonsystematic)部分i。,即,给定收入水平Xi ,个别家庭的支出可表示为两部分之和:,(*),由于方程中引入了随机项,成为计量经济学模型,因此也称为总体回归模型。,29,引入随机误差项的主要原因(1),1)存在未知的影响被解释变量的因素理论模糊性使得无法知道或确定所有影响因素2)数据的欠缺某些变量由于得不到数据而不得不被忽略。如 财富对家庭支出有影响,但无法得到财富的数据。3)区分核心变量与周边变量由于某些变量合起来的影响非常小,因此为简化模型,用i

13、取代。如家庭的孩子数、宗教信仰、受教育水平和所在地区等因素对消费有影响,但并不大。,30,引入随机误差项的主要原因(2),4)数据观测误差由于某些主客观原因,在取得观测数据时,往往存在测量误差,这些观测误差也被归入随机干扰项。5)模型的设定误差由于经济现象的复杂性,模型的真实函数往往是未知的,因此,实际设定的模型与真实的模型可能会有偏差。随机干扰项包含了这种偏差。6)变量的内在随机性由于变量所固有的内在随机性,也可能会对解释变量产生影响。,31,回归分析概念-样本回归函数(SRF),问题:能从一次抽样中获得总体的近似的信息吗?如果可以,如何从抽样中获得总体的近似信息?,问:能否从该样本估计总体

14、回归函数PRF?,回答:能,例2.2:在例2.1的总体中有如下一个样本,,总体的信息往往无法掌握,现实的情况只能是在一次观测中得到总体的一个样本。,32,核样本的散点图(scatter diagram):,样本散点图近似于一条直线,画一条直线以尽好地拟合该散点图,由于样本取自总体,可以用该线近似地代表总体回归线。该线称为样本回归线(sample regression lines)。,记样本回归线的函数形式为:,称为样本回归函数(sample regression function,SRF)。,33,这里将样本回归线看成总体回归线的近似替代,则,注意:,34,样本回归函数的随机形式/样本回归模型

15、,与总体回归函数的随机形式类似,样本回归函数也有如下的随机形式:,由于方程中引入了随机项,成为计量经济模型,因此也称为样本回归模型(sample regression model)。,35,回归分析的主要目的:根据样本回归函数SRF,估计总体回归函数PRF。,注意:这里PRF可能永远无法知道。,即,根据,估计,36,一个说明性的例子(1),下表给出了受教育水平(以读书的年数度量),每个受教育层次中人们的平均小时工资和所述受教育水平的人数三类数据。,37,一个说明性的例子(2),以受教育水平为横轴、以(条件)平均工资为纵轴画图,可得到下图。图中的回归曲线表明了平均工资如何随受教育水平而变化;平均

16、工资随着受教育水平的提高而增加。,38,总体回归函数确定形式:,回归函数总结,总体回归函数的随机形式:,双变量线性总体回归函数的确定形式:,双变量线性总体回归函数的随机形式:,双变量线性样本回归函数的确定形式:,双变量线性样本回归函数的随机形式:,39,教材P52:1,习题(2),40,1. 什么是总体回归函数?总体回归函数给出在给定Xi值下Y的期望值如何随Xi的变化而变化。2. 回归分析中的随机误差项有什么作用?它与残差ei有何区别?一个回归模型永远也不可能对现实做出完全准确的描述。因此,被解释变量的实际值与所选择的模型中估计出来的值必不相同,二者之差就是随机误差项。残差是指样本的随机误差项

17、。3. 总体和样本回归函数之间的差别是什么?后者是前者的一个估计量。在多数情况下,我们只能获得总体的而一个样本,并试图从给定样本对总体做出某种推断。,习题(2),41,(4) 下图是一个散点图及其回归线。你从此图中能得到什么一般性的结论?途中勾画出的回归线是总体还是样本回归线?,习题(3),一个国家的出口倾向越强,其制造业真实工资的增长率就越快。(这也一定程度上说明为何许多发展中国家采用出口导向型增长政策。)该回归线为样本回归线。,42,(4)你能从以下散点图中得出什么一般性结论?,习题(4),每个国家都倾向于出口那些在生产过程中较密集使用本国相对丰裕要素的产品。(赫克歇尔-俄林(Hecscher-Ohlin)贸易模型)。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报