1、第十一章多元时间序列分析,本章结构,VAR协整误差修正模型,学习目的:研究序列之间的关系,多元时间序列,多元时间序列,自协方差阵:,多元时间序列,Ljung-Box 检验,VAR(1) 模型,VAR(p)模型,其他还有VMA,VARMA等模型具体见教材第8章。,单整,单整的概念如果序列平稳,说明序列不存在单位根,这时称序列为零阶单整序列,简记为 假如一个时间序列至少需要进行d 阶差分才能实现平稳,说明原序列存在d个单位根,这时称原序列为d 阶单整序列,简记为,单整的性质,若 ,对任意非零实数a, b,有若 ,对任意非零实数a, b,有若 , 独立,对任意非零实数a, b,有若 , 独立,对任意
2、非零实数a, b,有,经济理论指出,某些经济变量间确实存在着长期均衡关系,这种均衡关系意味着经济系统不存在破坏均衡的内在机制,如果变量在某时期受到干扰后偏离其长期均衡点,则均衡机制将会在下一期进行调整以使其重新回到均衡状态。 假设X与Y间的长期“均衡关系”由式描述,长期均衡,该均衡关系意味着:给定X的一个值,Y相应的均衡值也随之确定为0+1X。,在t-1期末,存在下述三种情形之一:Y等于它的均衡值:Yt-1= 0+1Xt ;Y小于它的均衡值:Yt-1 0+1Xt ;,在时期t,假设X有一个变化量Xt,如果变量X与Y在时期t与t-1末期仍满足它们间的长期均衡关系,即上述第一种情况,则Y的相应变化
3、量为:,vt=t-t-1,如果t-1期末,发生了上述第二种情况,即Y的值小于其均衡值,则t期末Y的变化往往会比第一种情形下Y的变化大一些;反之,如果t-1期末Y的值大于其均衡值,则t期末Y的变化往往会小于第一种情形下的Yt 。可见,如果Yt=0+1Xt+t正确地提示了X与Y间的长期稳定的“均衡关系”,则意味着Y对其均衡点的偏离从本质上说是“临时性”的。一个重要的假设就是:随机扰动项t必须是平稳序列。如果t有随机性趋势(上升或下降),则会导致Y对其均衡点的任何偏离都会被长期累积下来而不能被消除。,协整,协整检验一、协整概念与定义在经济运行中,虽然一组时间序列变量都是随机游走,但它们的某个线性组合
4、却可能是平稳的,在这种情况下,我们称这两个变量是平稳的,既存在协整关系。其基本思想是,如果两个(或两个以上)的时间序列变量是非平稳的,但它们的某种线性组合却表现出平稳性,则这些变量之间存在长期稳定关系,即协整关系。我们将给出协整这一重要概念。一般而言,协整是指两个或两个以上同阶单整的非平稳时间序列的组合是平稳时间序列,则这些变量之间的关系的就是协整的。,协整在金融计量中的主要应用,目前,协整模型已经成为重要的金融计量模型,在经济研究中得到普遍或广泛的应用。通过检验经济序列之间是否存在协整关系,来判断对应变量间是否存在经济意义上的“均衡”关系。在此,我们对协整模型在金融计量中的应用主要总结如下几
5、个方面:(一)金融发展和经济增长之间关系检验 (二)期货价格和现货价格之间关系的检验(三)货币需求理论的实证检验(四)购买力平价理论的检验,例,总统的支持率与国家的经济运行状况达到一种平衡状态。(Ostrom and Smith 1992). 具体地,如果经济运行状况良好,但是支持率不高时,一般支持率会升高;反之,如果经济状况不好,但是支持率很高的话,一般支持率会降到平衡水平。,具体模型,In Ostrom and Smiths (1992) model:At = Xt + (At-1 - Xt-1) + twhere At = approvalXt = quality of life out
6、come,协整的概念,假定自变量序列为 ,响应变量序列为 ,如果 与 是同阶单整的。则可以构造回归模型 其中,回归残差序列 平稳,我们称响应序列 与自变量序列 之间具有协整关系。,如果两个变量都是单整变量,只有当它们的单整阶数相同时,才可能协整;如果它们的单整阶数不相同,就不可能协整。,例,对1978年2002年中国农村居民家庭人均纯收入对数序列lnxt和生活消费支出对数序列lnyt进行协整关系检验。,中国农村居民家庭人均纯收入和生活消费支出序列,例 时序图,对数序列时序图,构造回归模型,模型选择一元线性模型估计方法最小二乘估计模型拟合,残差序列单位根检验,我们可以以91.55%(10.084
7、5)的把握断定残差序列平稳且具有一阶自相关性,最终拟合模型,一般的,如果序列X1t,X2t,Xkt都是d阶单整,存在向量=(1,2,k),使得Zt=XT I(d-b), 其中,b0,X=(X1t,X2t,Xkt)T,则认为序列X1t,X2t,Xkt是(d,b)阶协整,记为XtCI(d,b),为协整向量(cointegrated vector)。如果两个变量都是单整变量,只有当它们的单整阶数相同时,才可能协整;如果它们的单整阶数不相同,就不可能协整。,3个以上的变量,如果具有不同的单整阶数,有可能经过线性组合构成低阶单整变量。,(d,d)阶协整是一类非常重要的协整关系,它的经济意义在于:两个变量
8、,虽然它们具有各自的长期波动规律,但是如果它们是(d,d)阶协整的,则它们之间存在着一个长期稳定的比例关系。例如,中国CPC和GDPPC,它们各自都是2阶单整,如果它们是(2,2)阶协整,说明它们之间存在着一个长期稳定的比例关系,从计量经济学模型的意义上讲,建立如下居民人均消费函数模型是合理的。,尽管两个时间序列是非平稳的,也可以用经典的回归分析方法建立回归模型。,从这里,我们已经初步认识到:检验变量之间的协整关系,是非常重要的。 而且,从变量之间是否具有协整关系出发选择模型的变量,其数据基础是牢固的,其统计性质是优良的。,协整检验,对于协整的定义,有四个重要特征值得注意:(1)协整只涉及非平
9、稳变量的线性组合。从理论上而言,在一组非平稳变量中,极有可能存在着非线性的长期均衡关系。(2)协整只涉及阶数相同的单整变量。如果变量的单整阶数不同,则按照通常的学术意义,可以认为它们不存在协整关系。(3)如果 有n个非平稳序列,则有n-1个线性独立的协整向量。协整向量的个数称为 的协整秩。显然,若 只包含两个变量,则最多只有一个独立的协整向量。(注意可能的共线性)(4)大多数协整的相关研究集中在每个变量只有一个单位根的情况,其原因在于古典回归分析或时间序列分析是建立在变量是 的条件下,而极少数的经济变量是单整阶数大于1的变量。,协整检验,假设条件原假设:多元非平稳序列之间不存在协整关系备择假设
10、:多元非平稳序列之间存在协整关系检验步骤建立响应序列与输入序列之间的回归模型 对回归残差序列进行平稳性检验,一、协整检验E-G检验二、协整检验JJ检验,协整检验,1、两变量的Engle-Granger检验,为了检验两变量Yt,Xt是否为协整,Engle和Granger于1987年提出两步检验法,也称为EG检验。 第一步,用OLS方法估计方程 Yt=0+1Xt+t并计算非均衡误差,得到:,称为协整回归(cointegrating)或静态回归(static regression)。,非均衡误差的单整性的检验方法仍然是DF检验或者ADF检验。需要注意是,这里的DF或ADF检验是针对协整回归计算出的误
11、差项,而非真正的非均衡误差。而OLS法采用了残差最小平方和原理,因此估计量是向下偏倚的,这样将导致拒绝零假设的机会比实际情形大。于是对t平稳性检验的DF与ADF临界值应该比正常的DF与ADF临界值还要小。,MacKinnon(1991)通过模拟试验给出了协整检验的临界值,例 检验中国居民人均消费水平CPC与人均国内生产总值GDPPC的协整关系。,已知CPC与GDPPC都是I(2)序列,已知它们的回归式,R2=0.9981,对该式计算的残差序列作ADF检验,适当检验模型为:,(-4.47) (3.93) (3.05) LM(1)=0.00 LM(2)=0.00,t=-4.47-3.75=ADF0
12、.05,拒绝存在单位根的假设,残差项是平稳的。因此中国居民人均消费水平与人均GDP是(2,2)阶协整的,说明了该两变量间存在长期稳定的“均衡”关系。,2、多变量协整关系的检验扩展的E-G检验,多变量协整关系的检验要比双变量复杂一些,主要在于协整变量间可能存在多种平稳的线性组合。 假设有4个I(1)变量Z、X、Y、W,它们有如下的长期均衡关系:非均衡误差项t应是I(0)序列:,然而,如果Z与W,X与Y之间分别存在长期均衡关系:则非均衡误差项v1t、v2t一定是平稳序列I(0)。于是它们的线性组合也可能是平稳的。例如可能是I(0)序列。,由于vt像t一样,也是Z、X、Y、W四个变量的线性组合,由此
13、vt式也成为该四变量的另一平稳线性组合。(1, -0, -1, -2, -3)是对应于t式的协整向量,(1, -0-0, -1, 1, -1)是对应于vt式的协整向量。,检验程序:对于多变量的协整检验过程,基本与双变量情形相同,即需检验变量是否具有同阶单整性,以及是否存在平稳的线性组合。在检验是否存在平稳的线性组合时,需通过设置一个变量为被解释变量,其他变量为解释变量,进行OLS估计并检验残差序列是否平稳。如果不平稳,则需更换被解释变量,进行同样的OLS估计及相应的残差项检验。,当所有的变量都被作为被解释变量检验之后,仍不能得到平稳的残差项序列,则认为这些变量间不存在(d,d )阶协整。检验残
14、差项是否平稳的DF与ADF检验临界值要比通常的DF与ADF检验临界值小,而且该临界值还受到所检验的变量个数的影响。,MacKinnon(1991)通过模拟试验得到的不同变量协整检验的临界值。,3、高阶单整变量的Engle-Granger检验,E-G检验是针对2个及多个I(1)变量之间的协整关系检验而提出的。在实际宏观经济研究中,经常需要检验2个或多个高阶单整变量之间的协整关系,虽然也可以用E-G两步法,但是残差单位根检验的分布同样已经发生改变。,二、协整检验JJ检验,1、 JJ检验的原理 Johansen于1988年,以及与Juselius一起于1990年提出了一种用向量自回归模型进行检验的方
15、法,通常称为Johansen检验,或JJ检验,是一种进行多重I(1)序列协整检验的较好方法。,Johansen协整检验,Engle-Granger两步法有三个缺点,首先,数据的有限性导致有限样本在单位根和协整检验时有缺陷;第二,可能会导致联立因果偏差 。第三,该方法无使对出现在第一步的真实的协整关系进行假设检验。Johansen方法是建立在矩阵秩和特征根之间关系的基础上的,考虑多元时间序列模型VAR,VARMA等。,没有移动平均项的向量自回归模型表示为:,将y的协整问题转变为讨论矩阵的性质问题,于是, 将yt中的协整检验变成对矩阵的分析问题。这就是JJ检验的基本原理。,两种检验方法:特征值轨迹
16、检验最大特征值检验,2. JJ检验的预备工作,第一步,用OLS分别估计下式中的每个方程,计算残差,得到残差矩阵S0,为一个(MT)阶矩阵。,第二步,用OLS分别估计下式中的每一个方程,计算残差,得到残差矩阵S1,也为一个(MT)阶矩阵。,第三步,构造上述残差矩阵的积矩阵:,第四步,计算有序特征值和特征向量。,第五步,设定似然函数。,3. JJ检验之一特征值轨迹检验,服从Johansen分布。被称为特征值轨迹统计量。,嵌套检验,,一直检验下去,直到出现第一个不显著的(Mr)为止,说明存在r个协整向量。这r个协整向量就是对应于最大的r个特征值的经过正规化的特征向量。,4. JJ检验之一最大特征值检
17、验,该统计量被称为最大特征值统计量。于是该检验被称为最大特征值检验。,由 Johansen和Juselius于1990年计算得到 Johansen分布临界值表。,5. JJ检验实例,国内生产总值GDP、居民消费总额CONSR、政府消费总额CONSP、资本形成总额INV取对数后为I(1)序列。即lnGDP、lnCONSR、lnCONSP、lnINV。对它们之间的协整关系进行检验。,两种方法的结论是一致的。,JJ检验中的几个具体问题,能否适用于高阶单整序列?JJ检验只能用于2个或多个I(1)变量的协整检验。对于多个高阶单整序列,采用差分或对数变换等将其变为I(1)序列,显然是可行的。但是,这时协整
18、以至均衡的经济意义发生了变化,已经不反映原序列之间的结构关系。,如何选择截距和时间趋势项?分别考虑CE和VAR中是否有截距和时间趋势项作为假设显著性检验重新检验对协整关系检验结果无显著影响(检验统计量发生变化,但临界值同时发生变化),如何在多个协整关系中作出选择?一般选择对应于最大特征值的第1个协整关系从应用的目的出发选择,格兰杰因果检验,一、经济变量间的因果关系经济生活中,常常会遇到的一类问题就是一个变量的变化是否为另一个变量的原因。例如,是货币供应量的变化引起GDP的变化,还是GDP的变化和货币供应量都是内生决定的;货币量的波动是否与收入之间存在某种内在因果关联等等。只有确定了这些问题,我
19、们才能更好的做好经济预测工作。要回答这些问题,常常用到的一种方法就是经济变量间的因果检验法。因果关系(causal relationship)最早是由Granger提出的。Granger 因果性表示了时间序列之间的领先与滞后关系,只是时间上的因果关系,重在影响方向的确认,而非完全的因果关系。,格兰杰因果检验,二、格兰杰因果检验 格兰杰因果检验(Granger Causality Test)的基本思想是: 对于经济变量X和Y,若X的变化引起了Y的变化,X的变化应当在Y的变化之前。即若认为“X是引起Y变化的原因”,就必须满足两个条件:(1)X应当有助于预测Y,即在Y关于X的过去值的回归中,增添X的
20、过去值作为独立变量应当显著地增加模型回归的解释能力;(2)Y不应当有助于X预测,其原因是若X有助于预测Y,Y也有助预测X,则可能存在一个或几个其它的变量,它们是引起X变化的原因,也是引起Y变化的原因。,格兰杰因果检验的实现,(1)单位根检验检验变量之间是否存在协整关系以及因果关系的前提是检验各变量是否服从单位根过程,即变量序列是否是一阶单整过程(integrated of order1),记作 。常用的单位根检验方法是ADF(augmented Dickey-Fuller)检验。(2)协整检验对于存在单位根的两组或两组以上的时间序列,如果它们的线性组合是平稳的 过程,则它们之间存在协整关系。对
21、于服从 过程的变量的协整检验。根据Engle和Granger在1987年提出基于回归残差的两步法进行检验法,我们对香港恒生指数(HSI)和香港股票市场卖空交易额(SS)之间的关系进行研究,以验证两者之间是否存在所谓的协整关系。(3)格兰杰因果关系检验,格兰杰因果检验,要检验这两个条件是否成立,我们需要检验一个变量对预测另一个变量有无解释能力的原假设,即检验X是否是引起Y变化的原因。完成这一检验,需要进行如下步骤:步骤1:为检验“X不是引起Y变化的原因”的原假设,利用OLS法估计回归模型。 步骤2:根据各回归的残差平方和计算F统计量,检验系数满足假设 : 。 步骤3:利用F统计量检验原假设 。,
22、例,香港市场引入卖空机制股市冲击效应的实证分析选取变量为香港恒生指数(HSI)和股票卖空交易额(SS)两组变量,以验证香港市场卖空机制对股市的冲击效应。时间区间为1999年1月至2003年12月的60个月。检验步骤如下:(1)单位根检验(2)协整检验(3)因果关系检验,从检验结果中可以发现,在香港股票市场中,恒生指数的变动与股票卖空交易额之间既并不存在所谓的协整关系,也不存在因果引致关系。对于这样的检验结果,我们可以作出这样的解释:即卖空机制的推出对于整个香港股票市场而言,没有造成市场的大幅度波动,即便市场出现异常波动,这一波动也不是由于卖空机制本身造成的。,建立协整关系的方法,E-G两步法:
23、通常用于检验两变量之间的协整关系。(Engle and Granger 1987)2. Johansen检验:对于多变量之间的协整关系则采用Johansen检验。 Johansen基于VARs 的协整方法(Johansen 1988)提出。,E-G两步法,具体分为以下两个步骤:第一步是应用OLS对两个同阶单整的变量建立下列方程 这一模型称为协整回归,称为协整参数,并得到相应的残差序列:第二步检验 序列的平稳性。(单位根检验,或者CRDW检验,cointegration regression Dubin Watson test),伪回归,如果对非平稳性数据进行回归,则在回归结果中,我们可能会发现
24、R2很高,t值也极高,这似乎表示变量之间存在着很好的拟合关系。但是,同时会发现杜宾-沃森d值偏低。这时,则可能存在伪回归(spurious regressions)现象发生。即回归结果是不正确的。Granger和 Newbold曾经提出一个良好的经验规则:当 时,所估计的回归就有谬误之嫌。 有时候时间序列的高度相关仅仅是因为两者同时随时间有或上或下变动的趋势,并没有真正的联系。这种情况就称为伪回归。,例,上证指数A股和B股、SZA深综指之间的协整关系检验我们选取上证指数A股(SHA)和B股(SHB)、深综指(SZA)为检验对象,数据区间为2003年12月1日至2005年12月1日。从图中我们可
25、以看出,上海A股市场、B股市场与深圳A股市场之间存在一定的共同变化趋势。,误差修正模型(ECM),一般差分模型的问题,对于非稳定时间序列,可通过差分的方法将其化为稳定序列,然后才可建立经典的回归分析模型。,模型只表达了X与Y间的短期关系,而没有揭示它们间的长期关系。关于变量水平值的重要信息将被忽略。,误差项t不存在序列相关, t是一个一阶移动平均时间序列,因而是序列相关的。,误差修正模型(ECM),ECM模型的说明误差修正模型,就是解决两个经济变量的短期失衡问题,这种方法日益被越来越多的实证研究所应用。通过误差修正机制,在一定期间的失衡部门可以在下一期得到纠正。ECM的基本思想是:若变量之间存
26、在协整关系,则表明这些变量间存在着长期均衡的关系,而这种长期均衡关系是在短期波动过程中不断调整下实现的。误差修正模型常常作为协整回归模型的补充模型出现协整模型度量序列之间的长期均衡关系,而ECM模型则解释序列的短期波动关系,误差修正模型,此假定经济变量 和 之间的长期关系为:其中, 和 为估计常数。 是 对 的长期弹性。两边取对数,可得到: 或 当变量 处于非均衡时,等式两边便存在一个差额,即: 以此来衡量两个经济变量之间的偏离程度。这里, 表示的t-1期的非均衡误差。,响应序列的当期波动 主要会受到三方面短期波动的影响输入序列的当期波动上一期的误差纯随机波动,误差修正模型,误差修正模型,是一
27、种具有特定形式的计量经济学模型.,由于现实经济中很少处在均衡点上,假设具有(1, 1)阶分布滞后形式,Y的变化决定于X的变化以及前一时期的非均衡程度。一阶误差修正模型(first-order error correction model)的形式:,若(t-1)时刻Y大于其长期均衡解0+1X,ecm为正,则(-ecm)为负,使得Yt减少;若(t-1)时刻Y小于其长期均衡解0+1X ,ecm为负,则(-ecm)为正,使得Yt增大。体现了长期非均衡误差对短期变化的控制。,复杂的ECM形式,例如:,误差修正模型的优点:如: a)一阶差分项的使用消除了变量可能存在的趋势因素,从而避免了虚假回归问题; b
28、)一阶差分项的使用也消除模型可能存在的多重共线性问题; c)误差修正项的引入保证了变量水平值的信息没有被忽视; d)由于误差修正项本身的平稳性,使得该模型可以用经典的回归方法进行估计,尤其是模型中差分项可以使用通常的t检验与F检验来进行选取;等等。,误差修正模型的建立,Granger 表述定理(Granger representaion theorem) Engle 与 Granger 1987年提出 如果变量X与Y是协整的,则它们间的短期非均衡关系总能由一个误差修正模型表述。,模型中没有明确指出Y与X的滞后项数,可以是多阶滞后;由于一阶差分项是I(0)变量,因此模型中允许采用X的非滞后差分项
29、Xt 。,建立误差修正模型,需要: 首先对变量进行协整分析,以发现变量之间的协整关系,即长期均衡关系,并以这种关系构成误差修正项。 然后建立短期模型,将误差修正项看作一个解释变量,连同其它反映短期波动的解释变量一起,建立短期模型,即误差修正模型。,Engle-Granger两步法 第一步,进行协整回归(OLS法),检验变量间的协整关系,估计协整向量(长期均衡关系参数); 第二步,若协整性存在,则以第一步求到的残差作为非均衡误差项加入到误差修正模型中,并用OLS法估计相应参数。 需要注意的是:在进行变量间的协整检验时,如有必要可在协整回归式中加入趋势项,这时,对残差项的稳定性检验就无须再设趋势项
30、。 另外,第二步中变量差分滞后项的多少,可以残差项序列是否存在自相关性来判断,如果存在自相关,则应加入变量差分的滞后项。,经济理论指出,居民消费支出是其实际收入的函数。 以中国国民核算中的居民消费支出经过居民消费价格指数缩减得到中国居民实际消费支出时间序列(C); 以支出法GDP对居民消费价格指数缩减近似地代表国民收入时间序列(GDP)。 时间段为19782000(表9.3.3),例 中国居民消费的误差修正模型,(1)对数据lnC与lnGDP进行单整检验,容易验证lnC与lnGDP是一阶单整的,它们适合的检验模型如下:,(3.81)(-4.01) (2.66) (2.26) (2.54) LM
31、(1)=0.38 LM(2)=0.67 LM(3)=2.34 LM(4)=2.46,首先,建立lnC与lnGDP的回归模型,(2)检验lnC与lnGDP的协整性,并建立长期均衡关系,(0.30) (57.48) R2=0.994 DW=0.744,发现有残关项有较强的一阶自相关性。考虑加入适当的滞后项,得lnC与lnGDP的分布滞后模型,(1.63) (6.62) (4.92) (-2.17) R2=0.994 DW=1.92 LM(1)=0.00 LM(2)=2.31,自相关性消除,因此可初步认为是lnC与lnGDP的长期稳定关系。,残差项的稳定性检验:,(-4.32) R2=0.994 D
32、W=2.01 LM(1)=0.04 LM(2)=1.34,t=-4.32-3.64=ADF0.05 说明lnC与lnGDP是(1,1)阶协整的,下式即为它们长期稳定的均衡关系:,以稳定的时间序列,(3)建立误差修正模型,做为误差修正项,可建立如下,误差修正模型:,(6.96) (2.96) (-1.91) (-3.15) R2=0.994 DW=2.06 LM(1)=0.70 LM(2)=2.04,由式,可得lnC关于lnGDP的长期弹性: (0.698-0.361)/(1-0.622)=0.892;由(*)式可得lnC关于lnGDP的短期弹性:0.686,(*),用打开误差修正项括号的方法直
33、接估计误差修正模型,适当估计式为:,(1.63)(6.62) (-2.99) (2.88) R2=0.791 =0.0064 DW=1.93 LM(2)=2.31 LM(3)=2.78,写成误差修正模型的形式如下,由上式知,lnC关于lnGDP的短期弹性为0.698,长期弹性为0.892。 可见两种方法的结果非常接近。,(4)预测,由式,给出1998年关于长期均衡点的偏差:,=ln(18230)-0.152-0.698ln(39008)-0.662ln(17072) +0.361ln(36684)= 0.0125,由式,预测1999年的短期波动: lnC99=0.686(ln(41400)-ln(39008)+0.784(ln(18230)-ln(17072) -0.484(ln(39008)-ln(36684)-1.1630.0125= 0.048,于是,按照式,预测的结果为: lnC99=0.698(ln(41400)-ln(39008)-0.378(ln(18230)-0.405 -0.892ln(39008)=0.051,以当年价计的1999年实际居民消费支出为39334亿元,用居民消费价格指数(1990=100)紧缩后约为19697亿元,两个预测结果的相对误差分别为2.9%与2.6%。,于是,