收藏 分享(赏)

离散数学11.ppt

上传人:dzzj200808 文档编号:4018403 上传时间:2018-12-05 格式:PPT 页数:35 大小:203KB
下载 相关 举报
离散数学11.ppt_第1页
第1页 / 共35页
离散数学11.ppt_第2页
第2页 / 共35页
离散数学11.ppt_第3页
第3页 / 共35页
离散数学11.ppt_第4页
第4页 / 共35页
离散数学11.ppt_第5页
第5页 / 共35页
点击查看更多>>
资源描述

1、第三部分 实践中的回归分析,Chp 11 标准与检验,主要内容,优良模型的性质 设定误差的类型 遗漏相关变量 包括不相关变量 不正确的函数形式 度量误差 设定误差的诊断 小结,一、优良模型的性质,简约性(Parsimony) 可识别性(Identifiability) 拟合优度(Goodness of fit) 理论一致性(Theoretical consistency) 预测能力(Predictive power),二、设定误差的类型,导致模型失效的设定误差主要包括如下几种类型: 遗漏相关变量 包括不必要的变量 采用了错误的函数形式 度量误差,三、遗漏相关变量 “过低拟合”模型,考虑如下模型

2、:Yi=B1+B2X2i+B3X3i+ui 其中,Y为婴儿死亡率,X2为人均GNP,X3为女性识字率 若在建模时遗漏了变量X3,则有:Yi=A1+A2X2i+vi,遗漏变量X3将导致的后果: 如果遗漏变量X3与模型中的变量X2相关,则和是有偏的,即:其均值或期望值与真实值不一致,用符号表示如下:E(a1)B1,E(a2) B2 可以证明:E(a2) =B2+B3b32E(a1)=B1+B3E(X3)-b32E(X2),a1和a2也是不一致的,即无论样本容量有多大,偏差也不会消失 如果X2与X3不相关,则b32为零。 根据错误模型得到的误差方差是真实误差方差的有偏估计量; a2的方差是真实估计量

3、b2方差的有偏估计量。 通常的置信区间和假设检验过程不再可靠。,例11-1 :婴儿死亡率的决定因素 正确:CM=f(PGNP,FLR,u) 错误:CM=f(PGNP,u) 启示:在建立模型时,要对研究现象所蕴含的经济理论做深入了解,从而把相关变量都纳入模型。,四、包括不相关变量 “过度拟合”模型,模型包括不必要变量将导致的后果不相关变量偏差 假定下列包含双变量的模型为正确:Yi=B1+B2X2i+ui 但建模时包括了不必要的变量X3,即:Yi=A1+A2X2i+A3X3i+vi 该模型的估计后果:,“不正确”模型的OLS估计量是无偏的,即 E(a1)=B1, E(a2)=B2, E(a3)=0

4、 方差2的估计量是正确的 建立在t检验和F检验基础上的标准的置信区间和假设检验仍然是有效的。 错误的回归方程中估计的a是无效的其方差比从真实模型中估计的b的方差大。,五、不正确的函数形式,Yt=B1+B2X2t+B3X3t+ut(1) B2度量了Y对X2的变化率 lnYt=A1+A2lnX2t+A3lnX3t+vt(2) A2度量了Y对X2的弹性, 实践中,经济理论没有明确应变量与解释变量之间的函数形式,假定对数形式是正确的,但人们很可能用(1)式来拟合数据,导致模型设定误差。,例:11-3 美国进口货物的支出(P251) =-751.47+0.576X-19.01Timet= -5.63*

5、8.68* -5.43* R2=0.96,Ad_R2=0.96,F=233.3 ln=-22.01+3.66lnX-0.05Timet= -4.17* 5.10* -2.32* R2=0.96,Ad_R2=0.96,F=233.3,例:11-3 美国进口货物的支出(P251) 分别用上述两种模型对数据进行拟合,其中: 模型一的所有回归系数都显著,X的回归系数表明在其他条件不变的情况下,个人可支配收入每增加1美元,平均进口支出将增加57美分, 模型二的回归系数亦显著,其中,进口支出对PDI的弹性约为3.66,而时间的回归系数表明,在其他变量保持不变的条件下,进口支出年均以4.58%的速率降低,。

6、 两个模型难以进行直接的比较,六、度量误差,一般地,我们隐含地假定应变量和解释变量不存在度量误差,即数据是准确的,而不是臆断的、外推的、内插的或围绕某个系统样式。实践中,这种假定往往难以满足。 应变量中的度量误差导致的后果: OLS估计量是无偏的; OLS估计量的方差也是无偏的; 估计量的估计方差比没有度量误差时的大 应变量中的误差加入到了误差项ui中。,解释变量中的度量误差导致的后果: OLS估计量是有偏的; OLS估计量也是不一致的 解决办法: 使用工具变量或替代变量 实践中的建议: 确保变量X的数据尽可能准确,避免记录、舍入和遗漏误差。,七、诊断设定误差:检验,1. 诊断非相关变量的存在

7、t检验 在建模时,为了避免遗漏变量偏差,会纳入一些控制变量。如果统计检验表明它们不显著(t检验),则可将它们从模型中删除。 例:考虑模型 Yt=B1+B2X2t+B3X3t+B4X4t+ut,例11-4 : 85个国家的生命预期 先验地预期收入和生命预期、获得保健和生命预期之间正相关。 模型1验证这一预期; 模型2增加了收入平方变量 目的在于验证生命预期对收入是以递增的速率变化还是以递减的速率变化; 模型3增加了获得保健平方变量 目的在于验证生命周期对获得保健是以递增的速率变化还是以递减的速率变化。,表11-2 生命预期模型,逐步回归:最开始Y与X2相关,因为b2在统计是显著,接着将模型加入变

8、量X3。如果b3统计显著,则把这个变量保留在模型中这样的过程。建模中不能重复使用t检验和F检验,但从某种程度上说,某些实验过程(如数据挖掘)有助于决定应变量和解释变量之间的函数形式。尤其当模型中包含若干解释变量,而我们又无法通过作图直观观察这些变量与应变量关系的时候。,2. 对遗漏变量和不正确函数形式的检验 对于菲利普斯曲线:预期工资变化率与失业率负相关,但它们可能的关系有: Yt=B1+B2Xt+ut(B20),模型的选择:实践中通常按如下步骤进行判断: 首先根据理论或调查及先前的实践经验,建立一个自认为抓住了问题本质的模型; 然后对这个模型进行实证检验; 得到回归结果后,根据前面讨论的“好

9、”的模型衡量标准进行事后分析。此时才知道所选择模型是否恰当。,判定模型是否恰当主要根据以下一些参数: R2和校正后的R2 估计的t值 与先验预期相比,估计系数的符号 如果结果并不令人满意,由要考虑模型是否恰当,并寻求补救措施,可能是遗漏某个重要变量;使用错误的函数形式等。主要可采用以下一些方法:,残差检验 残差图可显示模型中的设定误差,如遗漏了某个重要的变量,或使用了不正确的函数形式。例: 正确模型为(11-13) :Yt=B1+B2Xt+B3timet+ut 错误模型为(遗漏X):Yt=B1+B3timet+vt 则:vt=B2Xt+ut V不仅反映出真实的随机项u,还反映变量X,对图11-

10、2的说明 S1:“错误”模型的残差; S2:“正确”模型的残差。 但从图中我们还可以看出,即使在进口支出函数中增加了趋势变量,残差也不完全是随机分布的,从而说明模型1113本身设定也不完全正确,可能是遗漏了与国内价格有关的进口价格指数,或是遗漏了趋势变量的平方项。 在任何情况下,对估计模型的残差图进行检查都是建模过程中不可或缺的重要内容。,线性与对数线性模型之间的选择:MWD检验(麦克金农怀特戴维森检验),建立假设:H0:线性模型:Y是X的线性函数H1:对数线性模型:lnY是X或lnX的线性函数,MWD检验步骤: 1. 估计线性模型,得到Y的估计值 i ; 2. 估计线性对数模型,得到lnY的

11、估计值 ; 3. 求 4. 做Y对X和Z1i的回归; 如果根据t检验Z1i的系数是统计显著的,则拒绝H0; 5. 求 6. 做lnY对X或lnX和Z2i的回归 如果Z2i的系数是统计显著的,则拒绝H1,MWD检验的思想:如果线性模型是正确的,那变量Z1i应该是统计不显著的。,例:P256(原始数据见表11-1) 表11-3;11-4,回归误差设定检验:RESET检验(拉姆齐检验),RESET(regression specification error test) 思想:将残差对Y的预期值作图 我们已经知道,ei=0,eii=0。如果残差图显示残差随估计的Y值呈现某种变动样式,则表明,如果把以

12、某种形式的解释变量纳入模型,将提高R2,如果增加的R2是统计显著的(F检验),则表明原始模型是错误设定的。,RESET检验的步骤: 1. 根据模型估计出Y值,即i ; 2. 回到模型,把i的高次幂,平方立方等纳入模型以获取残差和 i 之间的系统关系; 3. 令从方程得到的R2为R2new ,从方程得到的R2old为,然后利用F检验差别从方程中增加的R2是否是统计显著的;4. 如果在所选显著水平下计算的F值是统计显著的,则认为原始模型是错误设定的。,例:进口支出一例的说明 原始数据见P251,表11-1 结果见P258,表11-5 结论:模型11-22是错误设定的,遗漏了趋势项及其平方 RESE

13、T检验 优点:简单易行,无需设定备择模型 缺点:知道了模型是错误设定的,但不能帮助我们选择正确模型。 故RESET检验主要用作诊断工具。,结语,“建模既是一门艺术也是一门科学,仅靠经济计量学知识和计算机统计软件并不足以确保我们成功。”,本章小结,古典线性回归模型假定实证分析中所使用的模型是“正确设定的”; 正确模型的几条实践标准: 简约 可识别 拟合优度 理论一致性 预测能力,本章小结,模型正确设定的几种含义: 模型没有排除理论上的相关变量; 模型没有包括非相关变量; 模型的函数形式正确; 没有度量误差 由于模型中能被错误设定,传统的t检验和F检验的结果不可靠,相对而言,包括不相关变量比起遗漏相关变量的严重性要小一些; 几种诊断设定误差的工具: 残差的图形检验 MWD检验 RESET检验,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 中等教育 > 初中教育

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报