1、第三部 线性分析第五章 误差项问题1第五章 误差项的问题学习目标系列相关数据所表现的现象检验方法和估计方法异方差数据所表现出的现象检验方法和估计方法(一)系列相关 (Serial correlation)1 系列相关的定义系列相关也叫自己相关(autocorrelation),是时系列数据分析中经常发生的问题。系列相关意味着误差项之间具有相关性。具体最小二乘法假设中的 220 UE 22122 11 uEuUEnn n假设误差项 存在一阶系列相关,我们可以用下面方程式表示:u, 。1,1ttt,0Nt其中, ,说明误差项存在一阶正的系列相关;,说明误差项存在一阶负的系列相关。0我们称 为自己相
2、关系数。一阶相关的方差协方差矩阵为。 2221 2122 nn nUE2 后果出现系列相关后,用最小二乘法估计参数得到的 t-value, F-value 以及决定系数都会发生变化,使原本的估计变得没有意义。3 发生原因原因 1. 理论模型的建模阶段缺少重要的说明变量;原因 2. 经济行为具有惯性;原因 3. 一些大的事件给经济带来的冲击在一个经济周期内不能完全消失;原因 4. 模型的函数形式不对;原因 5. 数据的时间间隔越短,越容易发生系列相关。4 检验方法 1. Durbin-Watoson ratio (DW)第三部 线性分析第五章 误差项问题21) 条件 (1) 误差项最多存在一阶的
3、相关性;(2) 被说明变量的滞后变量不能作为说明变量;(3) 样本的数量不能太少。2) 检验方法(1) 检验目的:存在一阶的系列相关,还是系列无关。(2) 检验原理:假设最小二乘回归的残差为 ,tu, 。nttttuDW12104DW当样本数很大 时,我们可以用下面的算式近似地求解 DW 统计量,3, 其中, 。21DWntttu21当 的时候, ; - 系列存在完全正相关0当 , ; - 系列存在正的相关0当 的时候, ; - 系列完全无关2当 , ; - 系列存在负相关14D当 的时候, 。 - 系列存在完全负相关WDW 统计检验时,请参考下面的简图。0 LdU2Ud4L4正相关无法判断相
4、关无法判断相关负相关不相关(3) 检验方法第三部 线性分析第五章 误差项问题3第一步 用最小二乘法(OLS)求出残差 ;te第二步 用 替代 ,计算 ;tetunttttuDW121第三步 查表找出相应的 ,计算 ;ULd, ULd4,第四步 把 DW 与 ,和 进行比较,得出结论。,43)案例分析日本 1970 年到 1994 年 25 年间的实质消费支出与实质可支配收入的数据,请参考 数据DW-1.xls。OLS 回归残差图 -10-8-6-4-202468100 5 10 15 20 25 30(1)检验相关的阶数(1-1 ) 的 OLS 结果ttttt eaea3210Coeffici
5、ents 标准误差 t StatIntercept -0.11783 0.604907 -0.19479e(t+2) 0.857891 0.243415 3.52439e(t+1) 0.213242 0.309822 0.688273e(t) -0.24939 0.241643 -1.03204(1-2 ) 的 OLS 结果ttttt eaea321第三部 线性分析第五章 误差项问题4(1-3 ) 的 OLS 结果tttt eae21Coefficients 标准误差 t State(t+2) 0.845856 0.237714 3.55829e(t+1) 0.015091 0.240166
6、0.062835(1-4 ) 的 OLS 结果tttea1Coefficients 标准误差 t State(t+2) 0.858103 0.132834 6.459958= 一阶相关tttea1(2) DW 检验法 te1te2tette121tte-3.10556 -1.11737 9.6445335 1.988195616 3.952921806-1.11737 -2.59123 1.24851417 -1.47386172 2.17226837-2.59123 -2.61484 6.71447824 -0.02360877 0.000557374-2.61484 -8.52715 6.
7、83738717 -5.91231029 34.95541293-8.52715 -2.90152 72.7122886 5.625632378 31.64773965-2.90152 -1.35177 8.418805 1.549747049 2.401715916-1.35177 -2.17639 1.82728391 -0.82462057 0.67999909-2.17639 -1.72614 4.73667879 0.450252951 0.20272772-1.72614 1.174368 2.97955336 2.900505902 8.4129344891.174368 1.7
8、24115 1.37913931 0.549747049 0.3022218181.724115 6.636425 2.9725714 4.912310287 24.130792356.636425 8.262057 44.0421362 1.625632378 2.6426806288.262057 8.349747 68.2615914 0.087689713 0.0076894868.349747 7.250253 69.7182758 -1.0994941 1.208887271Coefficients 标准误差 t State(t+2) 0.857682 0.23717 3.6163
9、12e(t+1) 0.210663 0.3016 0.698484e(t) -0.25082 0.235337 -1.06579第三部 线性分析第五章 误差项问题57.250253 4.150759 52.5661679 -3.0994941 9.6068636624.150759 4.238449 17.2287991 0.087689713 0.0076894864.238449 1.138954 17.9644463 -3.0994941 9.6068636621.138954 0.30253 1.29721728 -0.83642496 0.699606710.30253 -1.522
10、09 0.09152411 -1.82462057 3.329240237-1.52209 0.015852 2.3167612 1.537942664 2.3652676390.015852 -3.08364 0.00025127 -3.0994941 9.606863662-3.08364 -2.35852 9.50885104 0.725126476 0.525808406-2.35852 -3.08364 5.56259782 -0.72512648 0.525808406-3.08364 -7.08364 9.50885104 -4 16-7.08364 50.177991sum 4
11、67.716695 164.992560835.072.4691DW= 存在一阶正相关。方法 2. Cochrane-Orcutt (CO)1) 检验思想 和 检验流程检验思想不管实际上样本数据是几阶相关,先根据一阶自相关结果构筑新模型,再对新模型进行最小二乘回归,然后根据 判断新模型是否还具有自相关问题,如果还存在自相关问题,就需要根据新的结果区构筑新的模型,然后再进行回归和判断;如果不存在自相关问题,就可以结束循环。检验流程第三部 线性分析第五章 误差项问题6ttt XY10进 行 回 归 。 其 中 , ,tttY,10t1ttt结束循环,采用模型 ttt XY10收敛不收敛2) 检验方
12、法考虑存在一阶系列相关的模型,01,2ttXutn, 。1tu,0NtStep-1. 先写出 t-1 期的模型方程式1011t ttYStep-2. t-1 期的模型的两侧同时乘上自己相关系数 ,t ttXuStep-3. 用 t 期的模型减去 t-1 期的模型10111()tt ttttYXu ()tt tttStep-4. 重新定义说明变量和参数, , 。1tttY10tY1tttX第三部 线性分析第五章 误差项问题7Step-5 得到新的模型方程式,再对新模型进行 OLS 分析,。tttXY10实际中,常常用下面的方法:步骤 1 对原来模型01,2ttutn进行 OLS 估计,并求出残差
13、项 ;tu步骤 2 对误差项1tttu进行 OLS 估计,求出自己相关系数 ;具体可以用下面算式计算 ntttu21步骤 3 把 代入, ,1tttY001tttX中,做出新的数据 和 ;tYt步骤 4 对新的模型01tttYX进行 OLS 估计分析;步骤 5 求解原来模型的参数 01,。01一般的 CO 方法到了步骤 5 就结束了,但是需要反复(iterative)应用的情况下,我们还将进行步骤 6 到步骤 8。步骤 6 求出新的残差 t01tttYX步骤 7 用新的残差 求出新的自己相关系数t第三部 线性分析第五章 误差项问题8步骤 8 判断 是否满足收敛条件,其中, 是很小,比如 。0.
14、5如果满足收敛条件的话,循环计算就可以结束,我们将采用步骤 5 的结果;如果收敛条件不满足的情况下,我们再从步骤 3 开始循环,直至满足收敛条件为止。案例分析数据参考 数据DW-1.xls 。(1) 求 ;71.02.46321ntttu(2) 用新的 回归得到的 ;ttXY, 9.(3) 判断 ;5.071.0(4) 用新的 回归得到的 ;ttY, 97.(5) 判断 ;03.029.(6) 用新的 回归得到的 ;ttXY, .。 。 。 。 。 。 。 。 。方法 3. 2) 检验思想对模型 ,残差 进行逐一回归,找出01,1,2ttYXutn te比较理想的形式。3) 检验方法;ttte
15、e10;2;tttt 2;te310 如果残差回归模型中出现任何一个系数显著不同于零,就说明模型第三部 线性分析第五章 误差项问题9中的误差项存在系列相关。01,1,2ttYXutn5 估计1) 思想先消除系列相关性,然后再进行最小二乘回归(OLS) 。主要任务是消除系列相关性。下面介绍如何消除系列相关性的方法。2) 方法基于最小二乘回归(OLS)进行估计方法 1 假设 ,建立新的模型 ,其中 tttXY10, , 。1tttY0t1ttt方法 2 根据 ,计算 ,进而建立新的模型2DW,tttXY10其中, , , 。1tttY10tY1tttX方法 3 一般最小二乘法(Generalize
16、d Least Squares , GLS)这里以基于 PW(Prais-Winsten)变换为例。(1)具体步骤步骤 1 对原来模型01,1,2ttYXutn进行 OLS 估计,并求出残差项 ;tu步骤 2 对误差项1tttu进行 OLS 估计,求出自己相关系数 ;具体可以用下面算式计算 ntttu21步骤 3 用 ,我们把 t=1 和 t=2,3,n 的被说明变量,常数项,以及说明变量作个变换。当 t=1 的时候,第三部 线性分析第五章 误差项问题10, , ;211Y20C211X当 t=2,3,n 的时候, , 。1ttt01ttt步骤 4. 对没有常数项的模型21tY01ttttCX
17、u进行 OLS 回归分析。(2) 案例分析数据参考 数据 DW-1.xls最尤法 (Maximum Likelihood: ML) 最尤法与最小二乘法不同,它是根据样本的联合密度进行参数估计。(二)异方差模型: UXY1 异方差的概念:;ntforuEtt ,21,2方差协方差矩阵为:; 2210nUE 2 异方差的后果对于不考虑异方差,强行使用最小二乘法,得到最小二乘估计量 。在存YX1在异方差的情况下,估计量的线性,无偏性和有效性会有什么样的变化?1) 线性;UXUXYX 111 = 继续维持线性2) 无偏性第三部 线性分析第五章 误差项问题11UXEUXEYXE 111 ;U= 继续维持
18、无偏性。3) 有效性E UXXE11UX11111E= 有效性得不到保障,导致 的检验和预测不稳定。3 异方差检验1) 散点图与 或 的散点图;2tetXtY2) H. Glejser 检验法步骤 1. 现求出误差项的估计 ;te步骤 2. 做下面回归:;tttXe0;ttt;tttXe1;ttt2;tttte210 。步骤 3. 进行显著性检验,如果存在一个系数(常数项出外)显著地不同于 0,则说明模型 存在异方差问题。UXY3) Goldfeld-Quandt 检验 法第三部 线性分析第五章 误差项问题12步骤 1 按照说明变量的递增或者递减的顺序排列;步骤 2 把样本分成三 组:第一 组
19、的样本数为 ,第二组的样本数为 ,第三组的样本1n2n是为 ;1n步骤 3 分别计算样本 1 和样本 3 的残差平方和: 和 ;12te13ntt步骤 4 构筑 F 检验统计量112312knettnt不存在异方差的情况下, 。1,1knF4 异方差模型的估计 - 加权最小二乘法方法 1 最小二乘回归1) 估计思想 消除异方差性,然后进行最小二乘回归。2) 具体方法比如,H. Glejser 检验法中,判断 最有效,说明 中tttXe0 UXY的误差项 与 成一次(线性)关系。tutX于是,我们可以通过对原模型 的两侧分别除上 ,即UYttttt XXY10进行变换。令 , , , , 。ttttttu100得到新的回归模型。ttt uXY10达到修正异方差。注意:我们感兴趣的是 第三部 线性分析第五章 误差项问题13ttt uXY10中的 和 。于是还需要从 和 中求出 和 。10001方法 2 最尤法5 案例分析数据hete-1 121-1.xls