收藏 分享(赏)

计量经济学课件7.ppt

上传人:gnk289057 文档编号:4843522 上传时间:2019-01-16 格式:PPT 页数:29 大小:591KB
下载 相关 举报
计量经济学课件7.ppt_第1页
第1页 / 共29页
计量经济学课件7.ppt_第2页
第2页 / 共29页
计量经济学课件7.ppt_第3页
第3页 / 共29页
计量经济学课件7.ppt_第4页
第4页 / 共29页
计量经济学课件7.ppt_第5页
第5页 / 共29页
点击查看更多>>
资源描述

1、1,计量经济学,北京交通大学经济管理学院,2,7 单方程回归模型专题分析,7.1 虚拟变量的回归 7.2 模型的设定误差 7.3 模型变量的观测误差 7.4 随机解释变量的问题 7.5 案例分析,3,要求,1.掌握虚拟变量的设定方法; 2.理解模型的设定误差及处理方法; 3.理解变量的测量误差; 4.了解随机解释变量对回归模型的影响; 5.掌握虚拟变量的应用。,7.1 虚拟变量的回归,4,7.1.1虚拟变量回归的背景与其系数的含义,在研究现实问题时,许多解释变量都是定性变量,例如,当我们研究影响一个人工资水平的因素,“性别”因素就是一个只能取“男”或“女”两个值;再比如,“党员”与“非党员”、

2、“外地人”与“本地人”、“欧元诞生之前”与“欧元诞生之后”它们都是只有两种可能出现的情况。对于这样的变量,我们就可以用“虚拟变量”来描述。,7.1.1虚拟变量回归的背景与其系数的含义,当一个回归方程引入“虚拟变量”作为其中一个或几个解释变量时,无论是参数的估计,还是显著性检验的方法与普通变量的回归没有任何区别。只是这样的变量,其前面的系数所表示的含义有一些独特的地方。例如,有如下回归方程:回归系数 的含义就是:当D分别取1和0时,相应的 被解释变量的期望值之差。,7.1.2 虚拟变量的设定,当需要处理定性变量时,我们可以通过引入“二值变量”来处理。但是在现实中,定性变量的取值往往不止两个状态,

3、例如,“季节”有四个状态(春、夏、秋、冬),“人种”按肤色分有四种(黄色、白色、黑色,和棕色)。还有许多更多种状态的定性变量,如,民族、省份 对于具有多种状态的定性变量,我们可以通过引入多个“二值变量”的方法加以解决。但是要注意的是,在设定“虚拟变量”时,要遵循两个原则:一是要把所有的状态都能够表示出来;二是引入“虚拟变量”的个数越少越好。前者不言自明,后者是因为,随着引入变量个数的增加,自由度将会减少,从而估计的有效性就会越差。,7.2 模型的设定误差,模型的设定误差主要包括三种形式:遗漏相关变量、包括不必要的变量,以及采用错误的函数形式。,7.2.1 遗漏相关变量“过低拟合“模型,1、如果

4、遗漏变量X2与模型中的变量X1相关,则1和2是对1和2的有偏估计。 2. 根据结论可推知:0和1都是不一致的估计量,即无论样本容量有多大,偏差也不会消失。 3.如果X1与X2不相关,则b21为零。根据式(7-8)可以看出,此时1是无偏的,而且也是一致的。但0仍然是有偏的,除非式(7-9)中的等于零。,7.2.1 遗漏相关变量“过低拟合“模型,4.利用错误形式,即,式(7-7)得到的残差估计出的误差方差是真实误差方差2的有偏估计量。 5.通常的置信区间和假设检验过程不再可靠。,7.2.2 包括冗余变量“过度拟合”模型,在实际的计量研究中,我们常常犯的另一个错误是:回归方程引入了“不必要”的变量。

5、我们称之为“过度拟合”(over fitting)或者“过度设定模型”。 之所以会犯此类错误原因有两点:一是赖以建模的经济理论本身不完善,从而导致模型引入不相关的变量。二是在实践中有时为了提高模型的拟合程度,我们会倾向于引入尽可能多的变量。,7.2.2 包括冗余变量“过度拟合”模型,后果: 1. OLS估计量仍然是无偏的(也是一致的)。即E(0)= 0,E(1)= 1,E(2)=0。 2.从回归方程(7-14)中得到的估计量与从(7-13)中得到的估计量相比,有效性降低。 3.建立在t检验和F检验基础上的标准的置信区间和假设检验仍然是有效的。但是根据结论2可知:建立在的标准误上的置信区间比建立

6、在的标准误上的置信区间宽,尽管前者的假设检验是有效的。,7.2.3 设定错误的函数形式,由于缺乏很好的理论基础,因此如果选择了错误的函数形式,则估计的系数可能是真实系数的有偏估计值。,7.2.4 上述三种偏差的检验,1)对遗漏变量的诊断 判断方程是否遗漏重要变量的最简单且直接的方法就是:观察残差图(并且是Y以为横轴,残差为纵轴)。如果没有遗漏重要变量,那么残差的变化应该是以一个固定的水平为均值上下随机波动。如果不具有这一特征,则意味着可能遗漏了重要变量。,7.2.4 上述三种偏差的检验,2)对引入不相关变量的诊断 对于方程是否引入了不相关变量的问题,可以用我们所熟悉的t检验,进行逐个的检验;也

7、可以采用F检验,同时对若干个可疑变量进行联合检验。,7.2.4 上述三种偏差的检验,3)对回归模型形式正确与否的判断 理论上,可以用MWD检验和拉姆齐检验这两种方法。 MWD检验 MWD检验方法是麦金农(MacKinnon )、怀特(White )和戴维森 Davidson, 共同开发出的一种检验方法。,7.2.4 上述三种偏差的检验,3)对回归模型形式正确与否的判断 拉姆齐检验RESET检验(regression specificationerror test)是由拉姆齐(Ramsey,1969)提出的对设定误差的一种检验方法。该方法既可以检验遗漏变量的误差,也适用于检验模型形式的设定误差。

8、 该方法的核心思想就是通过对残差进行分析来判断是否存在各种可能的设定误差。,7.2.4 上述三种偏差的检验,上述两个检验,在实际应用时,用得并不多。原因是这些检验需要样本容量很大才有效力,否则结果并不理想。现实中,社会科学的数据常常很少,所以上述两个检验使用的并不多。所以,在选择回归模型形式时,我们还是建议以相关的理论为基础,同时辅以对散点图的观察。,7.3 模型变量的测量误差,测量误差对我们的回归会产生怎样的影响呢?我们说,首先,其后果取决于误差是产生于被解释变量还是解释变量;其次,取决于测量误差本身的性质。我们在下面要介绍的结论其实是建立在这样一个前提下,即,测量误差是由不可避免的随机因素

9、引起的。既然是随机因素引起,那么这些误差的总体均值为零,以工程上测量某一个物体的长度为例,每次测量时都会有误差,但经过多次测量,然后取平均,理论上就会消除这种误差。我们下面的结论就是建立在上述假设之上。,7.3.1 被解释变量中的测量误差,如果是被解释变量中出现了测量误差,则会导致如下后果; 最小二乘估计量是无偏的。 最小二乘估计量的方差也是无偏的。但是估计量的估计方差比没有度量误差时的大。因为因变量中的误差加入到了误差项ui中。(证明省略) 不难看出,实践中应变量中的度量误差引起的后果不太严重。,7.3.2 解释变量中的测量误差,这种情况下的后果是: 最小二乘估计量是有偏的。 最小二乘估计量

10、也是不一致的。即使样本容量足够大,OLS估计量仍然是有偏的。 显然,解释变量中的度量误差是一个严重问题。当然,如果因变量和解释变量中都存在测量误差,则问题更为严重。,7.3.2 解释变量中的测量误差,指出测量误差的后果是一回事,找到适当的补救措施则是另外一回事,因为诊断这些度量误差并非易事。 如果解释变量中存在测量误差,则建议使用工具(instrumental)或替代(proxy)变量,这些变量与原始的X变量高度相关,但与度量误差和回归误差项ui无关。有些时候可以找到这些替代变量,但大多数时候也很难找到合适的替代变量。 实践中最重要的一条建议是:确保变量的数据尽可能准确,避免记录、舍入和遗漏误

11、差。如果不同时期变量的定义不同,则要确保数据之间的可比性。,23,7.4 随机解释变量的问题,7.4.1 随机解释变量问题产生的背景 在经典的回归分析,有一条基本的假设:自变量是可控的、非随机的。例如,研究施肥数量与农作物的产出数量之间的关系,那么对于施肥数量我们是完全可以控制的。 但是在现实研究中,我们常常无法控制自变量,因为许多经济变量是不能用控制的方法进行观测的,所以作为模型中的解释变量其取值就不可能在重复抽样中得到相同和确定的数值,其取值很难精确控制,也不易用实验方法进行精确观测,解释变量成为随机变量。又由于现实研究中,我们往往无法避免遗漏变量的错误,因此随机项中也就常常包含了模型中略

12、去的那些解释变量,而略去的解释变量往往是同模型中的变量相关的,因而就很有可能在解释变量是随机变量的情况下与随机项相关,这样原有的古典假设就不能满足,产生了所谓“随机解释变量”的问题。,24,7.4 随机解释变量的问题,7.4.2 随机解释变量产生的后果 在经典回归理论中,正是由于假设了自变量是确定的、非随机的,才保证了OLS的估计量具有“无偏性”的特征。因为,如果自变量X是非随机的,那么它与随机项自然是无关,因此有E(Xu)= X E(u)=0,其中u是随机向量。于是,针对回归方程,回归系数的OLS估计量就是无偏的。,25,7.4 随机解释变量的问题,随机解释变量带来何种结果取决于它与随机误差

13、项是否相关: 随机解释变量与随机误差项不相关,那么OLS得到的估计量依然是无偏估计。 随机解释变量与随机误差项在小样本下相关,在大样本下渐进无关。此时,OLS得到的估计量是有偏的,但仍保持一致性。 随机解释变量与随机误差项高度相关。此时,OLS得到的估计量将具有很大的偏误。,26,7.4 随机解释变量的问题,7.4.3 随机解释变量的处理 显然,如果随机解释变量与随机项不相关,或是相关程度不大,那么无需进行处理。只有在相关程度较高时,我们才需要进行处理。 实践中,我们并不直接检验每个自变量是否与随机项相关。而是通过事前的定性分析或者事后对回归结果满意与否来判断我们所引入的变量是否会与随机项相关

14、。前者是指,如果我们进行联立方程的回归,或者解释变量中含有“滞后因变量”的时候,那么我们就先验的认为会存在随机解释变量与随机项相关的问题;后者是指,如果我们的回归结果并不令人满意,比如理论上某变量前的系数是正,但结果却是负的,那么我们可以将解释变量与随机项相关作为可能的原因之一。 对于随机解释变量与随机项高度相关的问题,我们可以采用引入“工具变量”进行处理。,27,7.5 案例分析,煤炭在我国的能源结构占有重要位置,对我国经济的发展起着重要作用。下表是我国1982年至1988年间,我国煤炭销售量的季节数据。通过观察,我们可以看出我国的煤炭销售量存在显著的季节性特征,第四季度的煤炭销售量要高于第一、二、三季度的煤炭销售量。本案例将用虚拟变量来处理煤炭销售量的季度数据。,28,7.5 案例分析,表7-2 中国市场用煤销售量季节数据,29,思考与练习,试述虚拟变量在回归模型应用时的注意事项。 试述模型设定误差的常见形式。 试述模型解释变量的测量误差及其影响。 试述模型被解释变量的测量误差及其影响。 试述模型随机解释变量的测量误差及其影响。 试结合某一实际问题进行虚拟变量在回归模型的应用。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 经济财会 > 经济学

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报