1、 9 3协整与误差修正模型 一 长期均衡关系与协整二 协整检验三 误差修正模型 一 长期均衡关系与协整 0 问题的提出 经典回归模型 classicalregressionmodel 是建立在稳定数据变量基础上的 对于非稳定变量 不能使用经典回归模型 否则会出现虚假回归等诸多问题 由于许多经济变量是非稳定的 这就给经典的回归分析方法带来了很大限制 但是 如果变量之间有着长期的稳定关系 即它们之间是协整的 cointegration 则是可以使用经典回归模型方法建立回归模型的 例如 中国居民人均消费水平与人均GDP变量的例子中 因果关系回归模型要比ARMA模型有更好的预测功能 其原因在于 从经济
2、理论上说 人均GDP决定着居民人均消费水平 而且它们之间有着长期的稳定关系 即它们之间是协整的 cointegration 经济理论指出 某些经济变量间确实存在着长期均衡关系 这种均衡关系意味着经济系统不存在破坏均衡的内在机制 如果变量在某时期受到干扰后偏离其长期均衡点 则均衡机制将会在下一期进行调整以使其重新回到均衡状态 假设X与Y间的长期 均衡关系 由式描述 1 长期均衡 式中 t是随机扰动项 该均衡关系意味着 给定X的一个值 Y相应的均衡值也随之确定为 0 1X 在t 1期末 存在下述三种情形之一 1 Y等于它的均衡值 Yt 1 0 1Xt 2 Y小于它的均衡值 Yt 1 0 1Xt 在
3、时期t 假设X有一个变化量 Xt 如果变量X与Y在时期t与t 1末期仍满足它们间的长期均衡关系 则Y的相应变化量由式给出 式中 vt t t 1 实际情况往往并非如此 如果t 1期末 发生了上述第二种情况 即Y的值小于其均衡值 则Y的变化往往会比第一种情形下Y的变化 Yt大一些 反之 如果Y的值大于其均衡值 则Y的变化往往会小于第一种情形下的 Yt 可见 如果Yt 0 1Xt t正确地提示了X与Y间的长期稳定的 均衡关系 则意味着Y对其均衡点的偏离从本质上说是 临时性 的 因此 一个重要的假设就是 随机扰动项 t必须是平稳序列 显然 如果 t有随机性趋势 上升或下降 则会导致Y对其均衡点的任何
4、偏离都会被长期累积下来而不能被消除 式Yt 0 1Xt t中的随机扰动项也被称为非均衡误差 disequilibriumerror 它是变量X与Y的一个线性组合 因此 如果Yt 0 1Xt t式所示的X与Y间的长期均衡关系正确的话 式表述的非均衡误差应是一平稳时间序列 并且具有零期望值 即是具有0均值的I 0 序列 从这里已看到 非稳定的时间序列 它们的线性组合也可能成为平稳的 例如 假设Yt 0 1Xt t式中的X与Y是I 1 序列 如果该式所表述的它们间的长期均衡关系成立的话 则意味着由非均衡误差 式给出的线性组合是I 0 序列 这时我们称变量X与Y是协整的 cointegrated 如果
5、序列 X1t X2t Xkt 都是d阶单整 存在向量 1 2 k 使得Zt XT I d b 其中 b 0 X X1t X2t Xkt T 则认为序列 X1t X2t Xkt 是 d b 阶协整 记为Xt CI d b 为协整向量 cointegratedvector 协整 在中国居民人均消费与人均GDP的例中 该两序列都是2阶单整序列 而且可以证明它们有一个线性组合构成的新序列为0阶单整序列 于是认为该两序列是 2 2 阶协整 由此可见 如果两个变量都是单整变量 只有当它们的单整阶数相同时 才可能协整 如果它们的单整阶数不相同 就不可能协整 三个以上的变量 如果具有不同的单整阶数 有可能经过
6、线性组合构成低阶单整变量 例如 如果存在 并且 那么认为 d d 阶协整是一类非常重要的协整关系 它的经济意义在于 两个变量 虽然它们具有各自的长期波动规律 但是如果它们是 d d 阶协整的 则它们之间存在着一个长期稳定的比例关系 例如 前面提到的中国CPC和GDPPC 它们各自都是2阶单整 并且将会看到 它们是 2 2 阶协整 说明它们之间存在着一个长期稳定的比例关系 从计量经济学模型的意义上讲 建立如下居民人均消费函数模型 从协整的定义可以看出 变量选择是合理的 随机误差项一定是 白噪声 即均值为0 方差不变的稳定随机序列 模型参数有合理的经济解释 这也解释了尽管这两时间序列是非稳定的 但
7、却可以用经典的回归分析方法建立回归模型的原因 从这里 我们已经初步认识到 检验变量之间的协整关系 在建立计量经济学模型中是非常重要的 而且 从变量之间是否具有协整关系出发选择模型的变量 其数据基础是牢固的 其统计性质是优良的 二 协整检验 1 两变量的Engle Granger检验 为了检验两变量Yt Xt是否为协整 Engle和Granger于1987年提出两步检验法 也称为EG检验 第一步 用OLS方法估计方程Yt 0 1Xt t并计算非均衡误差 得到 称为协整回归 cointegrating 或静态回归 staticregression 的单整性的检验方法仍然是DF检验或者ADF检验 由
8、于协整回归中已含有截距项 则检验模型中无需再用截距项 如使用模型1 进行检验时 拒绝零假设H0 0 意味着误差项et是平稳序列 从而说明X与Y间是协整的 需要注意是 这里的DF或ADF检验是针对协整回归计算出的误差项 而非真正的非均衡误差 t进行的 而OLS法采用了残差最小平方和原理 因此估计量 是向下偏倚的 这样将导致拒绝零假设的机会比实际情形大 于是对et平稳性检验的DF与ADF临界值应该比正常的DF与ADF临界值还要小 MacKinnon 1991 通过模拟试验给出了协整检验的临界值 表9 3 1是双变量情形下不同样本容量的临界值 例9 3 1检验中国居民人均消费水平CPC与人均国内生产
9、总值GDPPC的协整关系 在前文已知CPC与GDPPC都是I 2 序列 而 2 10中已给出了它们的回归式 R2 0 9981 通过对该式计算的残差序列作ADF检验 得适当检验模型 4 47 3 93 3 05 LM 1 0 00LM 2 0 00 t 4 47 3 75 ADF0 05 拒绝存在单位根的假设 残差项是稳定的 因此中国居民人均消费水平与人均GDP是 2 2 阶协整的 说明了该两变量间存在长期稳定的 均衡 关系 2 多变量协整关系的检验 扩展的E G检验 多变量协整关系的检验要比双变量复杂一些 主要在于协整变量间可能存在多种稳定的线性组合 假设有4个I 1 变量Z X Y W 它
10、们有如下的长期均衡关系 其中 非均衡误差项 t应是I 0 序列 然而 如果Z与W X与Y间分别存在长期均衡关系 则非均衡误差项v1t v2t一定是稳定序列I 0 于是它们的任意线性组合也是稳定的 例如 由于vt象 式中的 t一样 也是Z X Y W四个变量的线性组合 由此 式也成为该四变量的另一稳定线性组合 1 0 1 2 3 是对应于 式的协整向量 1 0 0 1 1 1 是对应于 式的协整向量 一定是I 0 序列 对于多变量的协整检验过程 基本与双变量情形相同 即需检验变量是否具有同阶单整性 以及是否存在稳定的线性组合 在检验是否存在稳定的线性组合时 需通过设置一个变量为被解释变量 其他变
11、量为解释变量 进行OLS估计并检验残差序列是否平稳 如果不平稳 则需更换被解释变量 进行同样的OLS估计及相应的残差项检验 当所有的变量都被作为被解释变量检验之后 仍不能得到平稳的残差项序列 则认为这些变量间不存在 d d 阶协整 检验程序 同样地 检验残差项是否平稳的DF与ADF检验临界值要比通常的DF与ADF检验临界值小 而且该临界值还受到所检验的变量个数的影响 表9 3 2给出了MacKinnon 1991 通过模拟试验得到的不同变量协整检验的临界值 2 多变量协整关系的检验 JJ检验 Johansen于1988年 以及与Juselius于1990年提出了一种用极大或然法进行检验的方法
12、通常称为JJ检验 高等计量经济学 清华大学出版社 2000年9月 P279 282 E views中有JJ检验的功能 三 误差修正模型 前文已经提到 对于非稳定时间序列 可通过差分的方法将其化为稳定序列 然后才可建立经典的回归分析模型 如 建立人均消费水平 Y 与人均可支配收入 X 之间的回归模型 1 误差修正模型 式中 vt t t 1 差分 X Y成为平稳序列 建立差分回归模型 如果Y与X具有共同的向上或向下的变化趋势 1 如果X与Y间存在着长期稳定的均衡关系Yt 0 1Xt t且误差项 t不存在序列相关 则差分式 Yt 1 Xt t中的 t是一个一阶移动平均时间序列 因而是序列相关的 然
13、而 这种做法会引起两个问题 2 如果采用差分形式进行估计 则关于变量水平值的重要信息将被忽略 这时模型只表达了X与Y间的短期关系 而没有揭示它们间的长期关系 因为 从长期均衡的观点看 Y在第t期的变化不仅取决于X本身的变化 还取决于X与Y在t 1期末的状态 尤其是X与Y在t 1期的不平衡程度 另外 使用差分变量也往往会得出不能令人满意回归方程 例如 使用 Yt 1 Xt t回归时 很少出现截距项显著为零的情况 即我们常常会得到如下形式的方程 在X保持不变时 如果模型存在静态均衡 staticequilibrium Y也会保持它的长期均衡值不变 但如果使用 式 即使X保持不变 Y也会处于长期上升
14、或下降的过程中 Why 这意味着X与Y间不存在静态均衡 这与大多数具有静态均衡的经济理论假说不相符 可见 简单差分不一定能解决非平稳时间序列所遇到的全部问题 因此 误差修正模型便应运而生 误差修正模型 ErrorCorrectionModel 简记为ECM 是一种具有特定形式的计量经济学模型 它的主要形式是由Davidson Hendry Srba和Yeo于1978年提出的 称为DHSY模型 为了便于理解 我们通过一个具体的模型来介绍它的结构 假设两变量X与Y的长期均衡关系为 Yt 0 1Xt t由于现实经济中X与Y很少处在均衡点上 因此实际观测到的只是X与Y间的短期的或非均衡的关系 假设具有
15、如下 1 1 阶分布滞后形式 该模型显示出第t期的Y值 不仅与X的变化有关 而且与t 1期X与Y的状态值有关 由于变量可能是非平稳的 因此不能直接运用OLS法 对上述分布滞后模型适当变形得 或 式中 如果将 中的参数 与Yt 0 1Xt t中的相应参数视为相等 则 式中括号内的项就是t 1期的非均衡误差项 式表明 Y的变化决定于X的变化以及前一时期的非均衡程度 同时 式也弥补了简单差分模型 Yt 1 Xt t的不足 因为该式含有用X Y水平值表示的前期非均衡程度 因此 Y的值已对前期的非均衡程度作出了修正 称为一阶误差修正模型 first ordererrorcorrectionmodel 式
16、可以写成 知 一般情况下 1 由关系式 1 得0 1 可以据此分析ecm的修正作用 其中 ecm表示误差修正项 由分布滞后模型 1 若 t 1 时刻Y大于其长期均衡解 0 1X ecm为正 则 ecm 为负 使得 Yt减少 2 若 t 1 时刻Y小于其长期均衡解 0 1X ecm为负 则 ecm 为正 使得 Yt增大 体现了长期非均衡误差对的控制 其主要原因在于变量对数的差分近似地等于该变量的变化率 而经济变量的变化率常常是稳定序列 因此适合于包含在经典回归方程中 需要注意的是 在实际分析中 变量常以对数的形式出现 于是 1 长期均衡模型Yt 0 1Xt t中的 1可视为Y关于X的长期弹性 l
17、ong runelasticity 2 短期非均衡模型Yt 0 1Xt 2Xt 1 Yt 1 t中的 1可视为Y关于X的短期弹性 short runelasticity 如具有季度数据的变量 可在短期非均衡模型Yt 0 1Xt 2Xt 1 Yt 1 t中引入更多的滞后项 更复杂的误差修正模型可依照一阶误差修正模型类似地建立 引入二阶滞后的模型为 经过适当的衡等变形 可得如下二阶误差修正模型 引入三阶滞后项的误差修正模型与 式相仿 只不过模型中多出差分滞后项 Yt 2 Xt 2 多变量的误差修正模型也可类似地建立 如三个变量如果存在如下长期均衡关系 则其一阶非均衡关系可写成 于是它的一个误差修正
18、模型为 1 Granger表述定理误差修正模型有许多明显的优点 如a 一阶差分项的使用消除了变量可能存在的趋势因素 从而避免了虚假回归问题 b 一阶差分项的使用也消除模型可能存在的多重共线性问题 c 误差修正项的引入保证了变量水平值的信息没有被忽视 d 由于误差修正项本身的平稳性 使得该模型可以用经典的回归方法进行估计 尤其是模型中差分项可以使用通常的t检验与F检验来进行选取 等等 因此 一个重要的问题就是 是否变量间的关系都可以通过误差修正模型来表述 2 误差修正模型的建立 如果变量X与Y是协整的 则它们间的短期非均衡关系总能由一个误差修正模型表述 0 1 式中 t 1是非均衡误差项或者说成
19、是长期均衡偏差项 是短期调整参数 就此问题 Engle与Granger1987年提出了著名的Grange表述定理 Grangerrepresentaiontheorem 对于 1 1 阶自回归分布滞后模型Yt 0 1Xt 2Xt 1 Yt 1 t 如果Yt I 1 Xt I 1 那么 的左边 Yt I 0 右边的 Xt I 0 因此 只有Y与X协整 才能保证右边也是I 0 首先对变量进行协整分析 以发现变量之间的协整关系 即长期均衡关系 并以这种关系构成误差修正项 然后建立短期模型 将误差修正项看作一个解释变量 连同其它反映短期波动的解释变量一起 建立短期模型 即误差修正模型 注意 由于 Y
20、lagged Y X t 1 t0 1中没有明确指出Y与X的滞后项数 因此 可以是多个 同时 由于一阶差分项是I 0 变量 因此模型中也允许使用X的非滞后差分项 Xt Granger表述定理可类似地推广到多个变量的情形中去 因此 建立误差修正模型 需要 由协整与误差修正模型的的关系 可以得到误差修正模型建立的E G两步法 第一步 进行协整回归 OLS法 检验变量间的协整关系 估计协整向量 长期均衡关系参数 第二步 若协整性存在 则以第一步求到的残差作为非均衡误差项加入到误差修正模型中 并用OLS法估计相应参数 需要注意的是 在进行变量间的协整检验时 如有必要可在协整回归式中加入趋势项 这时 对
21、残差项的稳定性检验就无须再设趋势项 另外 第二步中变量差分滞后项的多少 可以残差项序列是否存在自相关性来判断 如果存在自相关 则应加入变量差分的滞后项 2 Engle Granger两步法 3 直接估计法 也可以采用打开误差修整模型中非均衡误差项括号的方法直接用OLS法估计模型 但仍需事先对变量间的协整关系进行检验 如对双变量误差修正模型 可打开非均衡误差项的括号直接估计下式 这时短期弹性与长期弹性可一并获得 需注意的是 用不同方法建立的误差修正模型结果也往往不一样 经济理论指出 居民消费支出是其实际收入的函数 以中国国民核算中的居民消费支出经过居民消费价格指数缩减得到中国居民实际消费支出时间
22、序列 C 以支出法GDP对居民消费价格指数缩减近似地代表国民收入时间序列 GDP 时间段为1978 2000 表9 3 3 例9 3 2中国居民消费的误差修正模型 1 对数据lnC与lnGDP进行单整检验 容易验证lnC与lnGDP是一阶单整的 它们适合的检验模型如下 3 81 4 01 2 66 2 26 2 54 LM 1 0 38LM 2 0 67LM 3 2 34LM 4 2 46 首先 建立lnC与lnGDP的回归模型 2 检验lnC与lnGDP的协整性 并建立长期均衡关系 0 30 57 48 R2 0 994DW 0 744 发现有残关项有较强的一阶自相关性 考虑加入适当的滞后项
23、 得lnC与lnGDP的分布滞后模型 1 63 6 62 4 92 2 17 R2 0 994DW 1 92LM 1 0 00LM 2 2 31 自相关性消除 因此可初步认为是lnC与lnGDP的长期稳定关系 残差项的稳定性检验 4 32 R2 0 994DW 2 01LM 1 0 04LM 2 1 34 t 4 32 3 64 ADF0 05说明lnC与lnGDP是 1 1 阶协整的 式即为它们长期稳定的均衡关系 以稳定的时间序列 3 建立误差修正模型 做为误差修正项 可建立如下 误差修正模型 6 96 2 96 1 91 3 15 R2 0 994DW 2 06LM 1 0 70LM 2
24、2 04 由 式 可得lnC关于lnGDP的长期弹性 0 698 0 361 1 0 622 0 892 由 式可得lnC关于lnGDP的短期弹性 0 686 下面用打开误差修正项括号的方法直接估计误差修正模型 适当估计式为 1 63 6 62 2 99 2 88 R2 0 791 0 0064DW 1 93LM 2 2 31LM 3 2 78 写成误差修正模型的形式如下 由 式知 lnC关于lnGDP的短期弹性为0 698 长期弹性为0 892 可见两种方法的结果非常接近 4 预测 由 式 给出1998年关于长期均衡点的偏差 ln 18230 0 152 0 698ln 39008 0 66
25、2ln 17072 0 361ln 36684 0 0125 由 式 预测1999年的短期波动 lnC99 0 686 ln 41400 ln 39008 0 784 ln 18230 ln 17072 0 484 ln 39008 ln 36684 1 163 0 0125 0 048 于是 按照 式 预测的结果为 lnC99 0 698 ln 41400 ln 39008 0 378 ln 18230 0 405 0 892ln 39008 0 051 以当年价计的1999年实际居民消费支出为39334亿元 用居民消费价格指数 1990 100 紧缩后约为19697亿元 因此 两个预测结果的相对误差分别为2 9 与2 6 于是