1、第八章:包含非平稳时间序列的回归,杨旭,主要内容,什么是平稳的时序 什么是非平稳的时序 对非平稳时序进行回归会遇到什么问题? 如何解决问题?,1. 平稳的时序,1. 平稳的时序,1. 平稳的时序,对于“平稳序列”可以有多种定义,通常区分为两种:宽平稳、 严平稳,1. 平稳的时序,严平稳 严平稳是一种条件比较苛刻的平稳性定义 它认为只有当序列所有的统计性质(分布)都不会随着时间的推移而发生变化时,该序列才能被认为平稳。,1. 平稳的时序,宽平稳 宽平稳是使用序列的特征统计量来定义的一种平稳性。它认为序列的统计性质主要由它的低阶矩决定,所以只要保证序列低阶矩平稳,就能保证序列的主要性质近似稳定。,
2、1. 平稳的时序,均值 方差自协方差自相关系数,1. 什么是平稳的时序,宽平稳 例如,二阶平稳。 要求:均值、方差,都不随时间而变化。 两期数据之间的协方差只和两期数据之间的时间长度有关,而与起始点无关,考察如下两个模型的平稳性,平稳序列时序图,1. 平稳的时序,对于一阶自相关模型而言:只要序列就是平稳的。,Eight Line Graphs of 1,000 Serially Correlated Observations, = 0.9,2. 非平稳的时序,不满足“平稳时序定义”的时间序列(以宽平稳定义为基础)(1) 一阶非平稳序列 =()但高阶矩不随时间变化!,一阶不平稳的时序,例如:具有
3、确定性趋势的时间序列,确定性趋势( deterministic trend ),一个具有确定性趋势的散点图,2. 非平稳的时序,(2) 一阶矩平稳,但二阶矩不平稳的序列 = Var =() 但更高阶矩不随时间变化!,例如:随机游走模型,随机游走(random walk),随机漫步过程的4个实现,8幅具有1000次观测的随机游走图形,均值都为零,但差异却非常大!,2. 非平稳的时序,例如:具有随机趋势的非平稳时间序列,带漂移项的随机游走模型或者,例如:具有随机趋势的非平稳时间序列,由于以此可得:,例如:具有随机趋势的非平稳时间序列,所以,随机趋势变量的均值:,例如:具有随机趋势的非平稳时间序列,
4、所以,随机趋势变量的方差:方差随时间推移,越来越大!,2. 非平稳的时序(四种实现),(1)具有确定性趋势的非平稳时间序列;(2) 带漂移项的随机漫步;(3) 随机漫步;(4)具有确定性趋势+随机趋势的非平稳时间序列;,3. 非平稳序列对回归估计的影响,(1) 对于具有确定性趋势的序列而言OLS估计依然是有效的、一致的。甚至性能更加优良!,3. 非平稳序列对回归估计的影响,(2) 对于具有随机趋势的序列而言如果,其中X t和Y t都包含一个随机趋势,那么直接的回归很可能导致“伪回归”的出现!且样本量越大, “伪回归”出现的可能性也越大!,案例:伪回归的出现,现有如下任意构造的两个时间序列:,X
5、与Y的曲线图,用前10个样本做回归,用前20个样本做回归,用前50个样本做回归,用100个样本做回归,伪回归( spurious regression),理论上:随着样本量的不断增加,本来不相关的两个非平稳序列逐渐显现出越来越显著的相关性。这就是“伪回归”。 现实中,样本当然是固定的,但有时会遇到随机趋势同步变化的情况,这时“伪回归”也会出现。,X与Y的曲线图,伪回归( spurious regression),为什么会出现“伪回归”?,伪回归( spurious regression),X与Y可能会同时遭到同一个冲击的影响 当X与Y是平稳序列时,这个冲击会在当期(或经过几期)消散掉。 当X与
6、Y是非平稳序列时,这个冲击会持续影响影响这两个变量。(使得两个变量在相当长的时间里,具有相似的走势),判断是否存在伪回归的标准,针对回归方程:如果Y和X都是非平稳的时间序列,则很有可能出现“伪回归”的结果。 而判断是否为“伪回归”的标准是: 残差 是否平稳!如果不平稳,则说明原回归属于“伪回归”,如何应对伪回归?,平稳性检验 差分模型 协整模型 误差纠正模型,4.平稳性检验,非平稳序列的四种可能 确定性的趋势: 随机游走:随机趋势:确定性趋势和随机趋势:,4.平稳性检验,设定一个一般性的数据生成模式:,r= 0 and 1 0 :确定性趋势;r = 1 and 0 = 1 = 0,随机漫步;r
7、 = 1 and 1 = 0, 0 0,随机趋势;r = 1 and 0 = 1 0,随机趋势 + 确定性趋势If 0 r 1, 1 = 0, 平稳序列;,所以,平稳性检验可转化为对三种形式下的假设检验:在三种情况下,分别做如下假设检验:H0 : r = 1 ;H1 : r 1,4.平稳性检验,对上述假设进行检验时,遇到的困难: 在原假设成立时, OLS估计量虽然依然是一致估计量。 但其“渐进分布”不再是“正态分布”,因此原有的 t检验、F检验都无法进行,Copyright 2006 Pearson Addison-Wesley. All rights reserved.,4.平稳性检验,问题
8、的解决: 1979年,北卡罗来纳州立大学的统计学家戴维.迪基(David Dickey)爱荷华州立大学的统计学家韦恩.富勒(Wayne Fuller),David Dickey,Wayne Fuller,Copyright 2006 Pearson Addison-Wesley. All rights reserved.,4.平稳性检验,问题的解决: 利用Monte Carlo simulations方法研究了在r= 1的情况下, r -1和 t统计量的渐进分布asymptotic distribution,r -1的渐进分布,Copyright 2006 Pearson Addison-We
9、sley. All rights reserved.,4.平稳性检验,单位根检验(unit root test): 菲利普斯-佩龙检验 DF检验 ADF检验,Copyright 2006 Pearson Addison-Wesley. All rights reserved.,26-51,单位根检验 DF检验,Dickey and Fuller 发明了一种检验方法DF检验。 该方法,对原方程做了一个小小的变形:原来的检验内容 “H0: r = 1; H1: r 1”,变形为:“H0: (r -1)= 0; H1: (r -1) 0”,Copyright 2006 Pearson Addison
10、-Wesley. All rights reserved.,26-52,单位根检验 DF检验,为了检验,我们可以构造 “t-统计量”;但它不再服从t分布;幸好,Dickey 和 Fuller 确定了正确的 critical values.,Copyright 2006 Pearson Addison-Wesley. All rights reserved.,26-53,DickeyFuller t-test Asymptotic Critical Values,Copyright 2006 Pearson Addison-Wesley. All rights reserved.,26-54,单
11、位根检验 ADF检验,DF检验要求 vt 不存在序列相关。 如果我们担心 vt 存在序列相关, 则可以用ADF检验(Augmented DickeyFuller test.),单位根检验 ADF检验,The Augmented DickeyFuller test 在检验的回归方程中,加入了 DZ的滞后值.如果是年度数据,我们通常只引入一到二阶滞后量; 如果是季度数据,我们通常引入四阶滞后量;,Copyright 2006 Pearson Addison-Wesley. All rights reserved.,26-56,单位根检验 ADF检验,关于滞后阶数,EVIEWS可以自动给出;注意:
12、ADF 检验所用的“临界值”与 DF 检验的临界值是不一样的。,单位根检验,0,-1,Critical value,:-1; :-1;,正常情况下-1总是负值,4.平稳性检验(总结),如果要对时间序列进行如下形式的回归:首先,需要对所有的变量进行单位根检验,如何应对伪回归?,平稳性检验 差分模型 协整模型 误差纠正模型,5. 差分后再做回归,有的非平稳序列在经过一阶差分后,就会变得平稳了。具有此特征的非平稳序列称为“一阶单整”,表示为I(1)。以此逻辑可以定义: “二阶单整”, I(2)。,Copyright 2006 Pearson Addison-Wesley. All rights re
13、served.,25-60,5. 差分后再做回归,The Granger and Newbold strategy: 如果自变量X与因变量Y都是同阶单整, 则可先通过差分的方式将变量做平稳化处理, 然后再进行回归。,Copyright 2006 Pearson Addison-Wesley. All rights reserved.,25-61,5.差分后再做回归,不足之处: 有许多情况下,差分后的变量没有明确的经济意义。特别是二阶及以上的差分; 使数据变少; X的变化幅度要小于x的变化,从而降低估计量的有效性; 差分会导致残差出现序列自相关;,如何应对伪回归?,平稳性检验 差分模型 协整模型
14、 误差纠正模型,6. 建立协整模型,“伪回归”并不是总存在! 当X与Y具有某种共同的趋势时,它们之间的回归关系就是真实的!,Copyright 2006 Pearson Addison-Wesley. All rights reserved.,25-64,Real per Capita GDP and Real per Capita Consumption, 19481998,协整(Cointegration),协整 (Cointegration),当Y 和 X 都是I(1)序列,即1阶单整序列; 如果存在一组非零的常数(,),使得Y 和 X据此的线性组合(Y+X),是I(0)的序列,即平稳序
15、列; 那么称Y 与 X之间具有协整关系。,6. 建立协整模型,如何找到一组非零的常数构建原始变量的线性组合呢? 答案:最常用的,依然是回归法。即用X对Y进行回归来确定!(EG两步法) 当然,还有其他方法,比如,Johansen极大似然法,6. 建立协整模型,EG两步法: 例如,当估计出回归方程之后Y与X的线性组合就是:判断这个组合是否平稳,等同于判断残差et是否平稳。,案例2: 检验中国居民人均消费水平CPC与人均国内生产总值GDPPC的协整关系。,已知CPC与GDPPC都是I(2)序列,它们的回归式如下:,R2=0.9981,通过对该式计算的残差序列作ADF检验,得适当检验模型,(-4.47
16、) (3.93) (3.05),t=-4.47-3.75=ADF0.05,拒绝存在单位根的假设,残差项是稳定的,因此中国居民人均消费水平与人均GDP是(2,2)阶协整的,说明了该两变量间存在长期稳定的“均衡”关系。,协整 (Cointegration ),一般性定义:当Y 和 X 都是I(r)序列; 如果存在一组非零的常数(,),使得Y 和 X据此的线性组合(Y+X),是I(r-1)的序列,那么称Y 与 X之间具有协整关系。 ?有争议!,7.误差修正模型 ( Error Correction Model ),Copyright 2006 Pearson Addison-Wesley. All
17、rights reserved.,27-74,The Drunk and Her Dog,考虑醉妇和她的狗; 二者都是随机漫步; 但彼此都不愿离开对方太远; 我们认为二者之间呈协整关系;,27-75,The Drunk and Her Dog,我们还可以对醉妇和狗的行为建立如下模型: a1 和 a2 称为“调整速度”speeds of adjustment.,Copyright 2006 Pearson Addison-Wesley. All rights reserved.,27-76,The Drunk and Her Dog,方程中的第二项称为“误差校正机制”(error correct
18、ion mechanisms) (Yt-1 Zt-1)体现了前一期“Y与Z的真实状态”与“二者之间长期均衡关系”的偏离; 在这里,长期均衡关系就是: Yt = Zt,Copyright 2006 Pearson Addison-Wesley. All rights reserved.,27-77,The Drunk and Her Dog,一般而言, Y与Z的长期均衡关系, 并不会总是体现为:Yt = Zt 。实际上,这种所谓长期均衡关系就是二者之间的协整关系(如果它存在的话)!,更具一般性的“ECM误差修正模型”,更具一般性的“ECM误差修正模型”,Y 和 X分别以 gy 和 gx 的速度,
19、向着它们之间的长期均衡关系调整。,更具一般性的“ECM误差修正模型”,其中, g(Yt-1 b1Xt-1) 就是误差修正机制;,更具一般性的“ECM误差修正模型”,当随机项存在“序列自相关”时,我们需要在模型中引入“解释变量”与“被解释变量”的滞后项:,7.误差修正模型 ( Error Correction Model ),协整模型度量序列之间的长期均衡关系而ECM模型则解释序列的短期波动关系,案例,对1978年2002年中国农村居民家庭人均纯收入对数序列 和生活消费支出对数序列 构造ECM模型,案例:,拟合长期协整关系拟合短期波动(ECM模型)其中,,扩展:格兰杰因果检验,回归分析只能解释相
20、关关系;理论与实践中,需要了解因果关系;Granger(1969)和Sims(1972)提出的因果关系的检验法。,扩展:格兰杰因果检验,Sims(1972)研究了:究竟是货币量决定了名义收入的大小,还是名义收入决定了货币量的大小。,扩展:格兰杰因果检验,基本思想如下:如果变量X 有助于对变量Y的预测,则称X 是Y 的格兰杰原因,或者称X格兰杰引起Y。,扩展:格兰杰因果检验,首先,检验“ X 不是引起Y 变化的原因”的原假设。 接着,检验“Y 不是引起 X变化的原因”的原假设。 其可能结果有四种: 互相没有因果关系; 单向的因果关系; 互为因果;,扩展:格兰杰因果检验,检验“ X 不是引起Y 变化的原因”的原假设。 首先,对X 和Y进行平稳性检验。因为,该检验只适用于平稳性变量之间。,扩展:格兰杰因果检验,检验“ X 不是引起Y 变化的原因”的原假设。 其次,估计下列回归模型进行:然后对 H0:1= 2 = p =0 进行联合检验,扩展:格兰杰因果检验,是鸡生蛋,还是蛋生鸡?失败是成功之母吗?,扩展:格兰杰因果检验,格兰杰因果检验存在的问题: 对滞后项的选择非常敏感; 只能对时间序列进行检验,无法对截面数据检验; 不是真正意义上的因果关系。,