收藏 分享(赏)

第七章+模型选择:标准与检验(新).ppt

上传人:j35w19 文档编号:4725410 上传时间:2019-01-09 格式:PPT 页数:31 大小:164.50KB
下载 相关 举报
第七章+模型选择:标准与检验(新).ppt_第1页
第1页 / 共31页
第七章+模型选择:标准与检验(新).ppt_第2页
第2页 / 共31页
第七章+模型选择:标准与检验(新).ppt_第3页
第3页 / 共31页
第七章+模型选择:标准与检验(新).ppt_第4页
第4页 / 共31页
第七章+模型选择:标准与检验(新).ppt_第5页
第5页 / 共31页
点击查看更多>>
资源描述

1、第二部分实践中的回归分析基本假定违背: 不满足基本假定的情况。 ( 1)模型设定有偏误;所选模型是正确设定的( 2)解释变量之间存在 多重共线 性;( 3)随机误差项序列存在 异方差 性;( 4)随机误差项序列存在 序列相关 性。所选模型是正确设定的解释变量之间不存在完全线性关系误差项方差为常数误差项之间不相关基本假定基本假定基本假定基本假定第七章 模型选择:标准与检验7.1“好的 “模型具有的性质7.2设定误差的类型7.3遗漏相关解释变量的模型 :过低拟合模型7.4引入不相关解释变量模型 :过度拟合模型7.5不正确的函数形式7.6变量的度量误差 7.7模型设定误差的检验 7.1“ 好的 ”

2、模型具有的性质 简约性可识别性拟合优度理论一致性预测能力模型是对现实的抽象,模型应尽可能简洁即能够用少数解释变量能够说明一个被解释变量就不要用多个解释变量每个参数只有一个估计值对样本数据的拟合程度较好参数估计值的符号与经济理论相符预测值与经验值检验模型的有效性,即具有良好的预测能力7.2设定误差的类型 :四个 遗漏相关变量采用了错误的函数形式变量的度量误差引入无关变量请注意 :实践中的模型设定误差可能源于上述一个或多个原因。对所研究问题的相关理论了解不深未关注本领域前期的研究成果在研究中缺乏相关数据数据测量时有误差设定误差产生的原因 采用遗漏相关变量的模型进行估计而带来的误差称为 遗漏相关变量

3、误差设正确的模型为Y=B1+B2X1+B3X2+ 却错误设定为:Y=A1+ A2X1+v7.3遗漏相关变量遗漏解释变量将产生如下后果: (1)如果漏掉的 X2与 X1相关,使得遗漏变量的模型的最小二乘 估计量是有偏的。即不仅代表了 x1对被解释变量的直接影响,还代表了对被解释变量的间接影响(经由 x2)。简言之,本应由 x2对被解释变量的影响确体现在 x1上。第四章之 4.9设定误差 ,分析了古钟拍卖价格与钟表年代、竞标人数的回归 ,(见P83)( 2)错误模型的参数估计量也是不一致的,即参数估计值的均值 E(ai)与其理论值 Ai不相等。(3)如果 X2与 X1不相关,则遗漏变量的模型的估计

4、量满足无偏性与一致性。( 4)错误模型的随机误差项方差是真实随机误差方差的有偏估计( 5)错误模型的斜率系数方差也是有偏估计。 (6) 通常的置信区间和假设检验过程不再可靠,置信区间会变宽,会更频繁接受零假设。 举例:婴儿死亡率的决定因素 被解释变量:婴儿死亡率( CM) 解释变量:人均国民收入 PGNP; 女性识字率 FLR 正确模型:上述三个变量模型 (CM对 PGNP、 FLR回归) 错误模型:遗漏 FLR变量的两个变量模型( CM对 PGNP回归) 结论:不包含女性识字率的双变量模型,错误之处:不仅忽略了遗漏变量 “女性识字率 ”对婴儿死亡率的影响,而且,也忽略了女性识字率对人均国民收

5、入的影响。 因此,错误模型中的解释变量 PGNP,就担负起遗漏变量 “女性识字率 ”对被解释变量( CM)的影响,从而无法表现出 PGNP对CM的真实的影响。 提示:在建立计量经济模型时,需要对所研究现象所蕴含的经济理论做深入了解,目的是把相关变量都引入模型中。婴儿死亡率与人均收入女性识字率建立的模型 正确设定模型 : cm=263.6416-0.0056PGNP-2.2316FLR 错误设定模型: cm=157.4244-0.0114PGNP 错误模型表明,人均收入每增加 1美元,婴儿死亡率平均降低 0.01,而该估计结果是错误高估了解释变量对被解释变量的影响,是上偏的。 做 FLR与 PG

6、NP回归即可以看出上偏的结果。 FLR=47.5971+0.00256PGNP 其斜率系数为 b32=0.00256,由正确模型估计结果知, B2=-0.0056, B3=-2.2316,根据式( 7-3)得: B2+B3*b32=-0.0056+(-2.2316)*0.00256=-0.0114 这与错误模型得到的估计值基本相等。 因此,错误设定的模型中遗漏了变量 FLR,不仅忽略了 FLR对 CM的影响,也忽略了 FLR对 PGNP的影响,则错误设定模型的变量 PGNP就只能担负起遗漏变量 FLR对 CM的影响。从而也就无法表示 PGNP对 CM的真实影响结果。包含无关变量偏误 :采用包含

7、无关解释变量的模型进行估计带来的偏误。设 Y=0+ 1X1+v (*) 为正确模型,但却估计了错误的模型 :Y=0+1X1+2X2+ (*)如果 2=0, 则 (*)与 (*)相同,因此,可将(*)式视为以 2=0为约束的 (*)式的特殊形式。 即P86,第四章所介绍的 “ 受限最小二乘 ”7.4包含无关变量 :过度拟合模型用 OLS法估计模型 Y=0+1X1+2X2+由于所有的经典假设都满足,因此 :( 1) OLS估计量无偏的,也是一致的( 4) 但是,引入多余解释变量的模型的 OLS估计量无效,不具有最小方差性( 2)从错误的回归方程中,得到的方差估计量是正确的( 3)置信区间和假设检验

8、仍然是有效的OLS估计量是线性无偏估计量,但非最优,不再有效。小结:例 7-2:举例说明 第六章中的 6.5:食品支出模型 被解释变量:食品支出 解释变量:税后收入( x), “性别 ”(采用加法引入和乘法引入两个变量( D、 DX) 模型: 回归结果: Y=1432.577+0.0616X-67.893D-0.0063DX t=( 5.765) (7.376) (-0.194) (-0.485)结论 前面的模型中引入了差别截距、差别斜率变量的虚拟变量模型,由于 D、 DX参数估计值都不显著,而引入虚拟变量 D的差别截距模型( 6-9) 的虚拟变量系数显著,表明,差别斜率虚拟变量 DX很可能属

9、于多余的。也就是说,食品支出模型中,正确的引入解释变量,应该是定量变量:税后收入 X,虚拟变量 D 食品支出模型引入虚拟变量 D,表明:男女食品支出的平均水平(截距)存在差异,但男女食品支出的变化率(斜率)无差异。当选取了错误函数形式并对其进行估计时,带来的偏误称 错误函数形式偏误 容易判断,这种 偏误 所估计的模型参数估计量 是 有偏估计 。 例如,如果 “真实 ”的回归函数为生产函数却估计线性式:显然, 两者的参数具有完全不同的经济含义,且估计结果一般也是不相同的。 7.5错误函数形式例 7-3:举例说明 被解释变量:美国进出口商品支出 解释变量:个人可支配收入( PDI)、年份(Year

10、) 线性回归模型与对数回归模型所得到的参数估计值含义是完全不同的,(详细解释见教材第 170页)7.6度量误差应变量中的度量误差引起的后果不太严重。解释变量中的度量误差引起的后果非常严重。建议使用 工具变量 或 替代变量 :与原始变量 X高度相关,但与回归误差项无关,且不存在度量误差。若不同时期变量的定义不同,则需要确保数据的可比性。实践中的建议:确保解释变量( X) 的数据尽可能准确,不免除记录、舍入和遗漏误差。模型设定偏误的后果 模型设定出现误差时,模型估计结果会与 “ 实际 ” 有偏差。这种 偏差的性质与程度与模型设定误差的类型密切相关。7.7模型设定误 差 的检验 7.7.1检验是否含

11、有无关变量 可用 t 检验与 F检验完成。检验的基本思想 :如果模型中误选了无关变量,则其系数的真值应为零。因此,只须对无关变量系数的显著性进行检验。t检验 :检验某 1个变量是否应包括在模型中;F检验 :检验若干个变量是否应同时包括在模型中 (建议: F检验可以采用受限最小二乘,可以回答多个变量是否包含在模型中)。 7.7.2对 遗漏相关变量或函数形式设定偏误 的 检验( 1)残差图示法 残差序列变化图( a)趋势变化 :模型设定时可能遗漏了一随着时间的推移而持续上升的变量 ( b)循环变化:模型设定时可能遗漏了一随着时间的推移而呈现循环变化的变量 ( c) 模型函数形式设定偏误时残差序列呈

12、现正负交替变化 图示: 一元回归模型中,真实模型呈幂函数形式,但却选取了线性函数进行回归。 7.7.3在线性模型和对数模型之间选择: MWD检验H0:线性模型: Y是 X的线性函数H1:对数线性模型: Y是 X(或 LnX)的线性函数估计线性模型,得到 Y的拟合值估计对数线性模型,得到 LnY的拟合值做 Y对 X和 Z1的回归 做 LnY对 X(或 LnX )和 Z2的回归对 Z1的系数进行变量的显著性检验,若显著,则拒绝 H0对 Z2的系数进行变量的显著性检验,若显著,则拒绝 H1例 P176:因为 Z1的系数显著,则拒绝 H0:假设真实的进口支出函数是线性的。因为 Z2的系数显著,则拒绝

13、H1:假设真实的进口支出函数是对数线性的。根据上述结果,本例中两个模型都是合理的。7.7.4一般性设定偏误检验但更准确更常用的判定方法是拉姆齐 (Ramsey)于 1969年提出的所谓 RESET 检验 ( regression error specification test)。基本思想:如果事先知道遗漏了哪个变量,只需将此变量引入模型,估计并检验其参数是否显著不为零即可;问题是不知道遗漏了哪个变量,需寻找一个替代变量 Z,来进行上述检验。RESET检验中,采用所设定模型中被解释变量 Y的估计值 的若干次幂来充当该 “替代 ”变量。 ( 1) 估计。 先估计原始模型 得到拟合值。 ( 4)

14、检验和判断。 若仅增加一个 “ 替代 ” 变量,可采用t检验; 若增加多个 “ 替代 ” 变量,可采用 “ 受限最小二乘 ” 的 F检验。( 2) 观察 残差与拟合值的关系,决定引入拟合值的若干次幂进入模型作为 “ 替代变量 ” 。( 3) 再估计。 估计引入了 “ 替代变量 ” 的新模型。拉齐姆检验( RESET 检验)RESET 检验评价优点:简单易行。缺陷:可用于判断模型设定是否错误,却不能帮助我们选择正确模型。因此,该检验主要是诊断工具。例 :对 商品进口进行研究 ,估计了中国商品进口M与 GDP的关系,然而,由于仅用 GDP来解释商品进口的变化,明显地遗漏了诸如商品进口价格、汇率等其他影响因素。在此,采用 RESET检验考察建模时是否遗漏了重要的相关变量。( 1)用原回归模型估计出商品进口序列 R2=0.9484( -0.085) ( 8.274) ( -6.457) ( 6.692)R2=0.9842在 =5%下,查得临界值 F0.05(2, 20)=3.49判断: 拒绝原模型与引入新变量的模型可决系数无显著差异的假设,表明原模型确实存在遗漏相关变量的设定偏误。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 经营企划

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报