1、1,第九章 向量自回归和误差修正模型,传统的经济计量方法是以经济理论为基础来描述变量关系的模型。但是,经济理论通常并不足以对变量之间的动态联系提供一个严密的说明,而且内生变量既可以出现在方程的左端又可以出现在方程的右端使得估计和推断变得更加复杂。为了解决这些问题而出现了一种用非结构性方法来建立各个变量之间关系的模型。本章所要介绍的向量自回归模型(vector autoregression,VAR)和向量误差修正模型(vector error correction model,VEC)就是非结构化的多方程模型。,2,向量自回归(VAR)是基于数据的统计性质建立模型,VAR模型把系统中每一个内生变
2、量作为系统中所有内生变量的滞后值的函数来构造模型,从而将单变量自回归模型推广到由多元时间序列变量组成的“向量”自回归模型。VAR模型是处理多个相关经济指标的分析与预测最容易操作的模型之一,并且在一定的条件下,多元MA和ARMA模型也可转化成VAR模型,因此近年来VAR模型受到越来越多的经济工作者的重视。,9.1 向量自回归理论,3,VAR(p) 模型的数学表达式是 (9.1.1)其中:yt是 k 维内生变量列向量,xt 是d 维外生变量列向量,p是滞后阶数,T是样本个数。kk 维矩阵1, p 和 kd 维矩阵 H 是待估计的系数矩阵。t 是 k 维扰动列向量,它们相互之间可以同期相关,但不与自
3、己的滞后值相关且不与等式右边的变量相关,假设 是 t 的协方差矩阵,是一个(kk)的正定矩阵。式(9.1.1)可以展开表示为,9.1.1 VAR模型的一般表示,4,(9.1.2),即含有 k 个时间序列变量的VAR(p)模型由 k 个方程组成。,5,其中, ci , aij , bij 是要被估计的参数。也可表示成:,例如:作为VAR的一个例子,假设工业产量(IP)和货币供应量(M1)联合地由一个双变量的VAR模型决定。内生变量滞后二阶的VAR(2)模型是:,6,一般称式(9.1.1)为非限制性向量自回归模型(unrestricted VAR)。冲击向量 t 是白噪声向量,因为 t 没有结构性
4、的含义,被称为简化形式的冲击向量。,为了叙述方便,下面考虑的VAR模型都是不含外生变量的非限制向量自回归模型,用下式表示 或,其中:,(9.1.5),7,如果行列式det(L)的根都在单位圆外,则式(9.1.5)满足稳定性条件,可以将其表示为无穷阶的向量动平均(VMA()形式 (9.1.6)其中,8,对VAR模型的估计可以通过最小二乘法来进行和极大似然估计法,在特定条件下,两者的估计系数是完全相同的。当随机扰动项满足独立同分布(iid.N(0,),可以证明最小二乘法和极大似然法估计的系数结果一致。所以如果VAR模型的随机扰动项满足上述条件,则可以对VAR模型中的每个方程分别进行OLS估计,获得
5、的系数是有效的一致估计值。另外即使跨等式的随机扰动项存在相关性,但只要各个等式扰动项自身不存在序列相关,那么OLS也可以给出有效的估计值。,9,注意,由于任何序列相关都可以通过增加更多的yt 的滞后而被消除,所以扰动项序列不相关的假设并不要求非常严格。,10,例9.1 我国货币政策效应实证分析的VAR模型 为了研究货币供应量和利率的变动对经济波动的长期影响和短期影响及其贡献度,采用我国1995年1季度2007年4季度的季度数据,并对变量进行了季节调整。设居民消费价格指数为CPI_90 (1990年1季度=1)、居民消费价格指数增长率为CPI 、实际GDP的对数ln(GDP/CPI_90) 为l
6、n(gdp) 、实际M1的对数ln(M1/CPI_90) 为ln(m1) 和实际利率rr (一年期存款利率R-CPI )。,11,利用VAR(p)模型对 ln(gdp) , ln(m1) 和 rr,3个变量之间的关系进行实证研究,其中实际GDP和实际M1以对数差分的形式出现在模型中,而实际利率没有取对数。,12,EViews软件中VAR模型的建立和估计,1建立VAR模型 为了创建一个VAR对象,应选择Quick/Estimate VAR或者选择Objects/New object/VAR或者在命令窗口中键入var。便会出现下图的对话框(以例9.1为例):,13,可以在对话框内添入相应的信息:
7、(1) 选择模型类型(VAR Type): 无约束向量自回归(Unrestricted VAR)或者向量误差修正(Vector Error Correction)。无约束VAR模型是指VAR模型的简化式。,(2) 在Estimation Sample编辑框中设置样本区间,14,(3) 输入滞后信息 在Lag Intervals for Endogenous编辑框中输入滞后信息,表明哪些滞后变量应该被包括在每个等式的右端。这一信息应该成对输入:每一对数字描述一个滞后区间。例如,滞后对 1 4表示用系统中所有内生变量的1阶到4阶滞后变量作为等式右端的变量。 也可以添加代表滞后区间的任意数字,但都要
8、成对输入。例如: 2 4 6 9 12 12即为用24阶,69阶及第12阶滞后变量。,15,(4) 在Endogenous Variables编辑栏中输入相应的内生变量 (5) 在Exogenous Variables编辑栏中输入相应的外生变量 EViews允许VAR模型中包含外生变量,其中 xt 是 d 维外生变量向量 , kd 维矩阵 H 是要被估计的系数矩阵。可以在Exogenous Variables编辑栏中输入相应的外生变量。系统通常会自动给出常数 c 作为外生变量。 其余两个菜单(Cointegration 和 Restrictions)仅与VEC模型有关,将在下面介绍。,16,2
9、VAR估计的输出 VAR对象的设定框填写完毕,单击OK按纽,EViews将会在VAR对象窗口显示如下估计结果:,17,表中的每一列对应VAR模型中一个内生变量的方程。对方程右端每一个变量,EViews会给出系数估计值、估计系数的标准差(圆括号中)及t-统计量(方括号中)。例如,在D(log(M1_SA_P)的方程中RR_SA(-1)的系数是-0.002187。 同时,有两类回归统计量出现在VAR对象估计输出的底部:,18,输出的第一部分显示的是每个方程的标准OLS回归统计量。根据各自的残差分别计算每个方程的结果,并显示在对应的列中。 输出的第二部分显示的是VAR模型的回归统计量。,19,残差的
10、协方差的行列式值(自由度调整)由下式得出: 其中 m 是VAR模型每一方程中待估参数的个数,不做自由度调整的残差协方差行列式计算中不减 m。 是 k 维残差列向量。通过假定服从多元正态(高斯)分布计算对数似然值: AIC和SC两个信息准则的计算将在后文详细说明。,20,例9.1结果如下: 尽管有一些系数不是很显著,我们仍然选择滞后阶数为2。3个方程拟合优度分别为: 可以利用这个模型进行预测及下一步的分析。,21,同时,为了检验扰动项之间是否存在同期相关关系,可用残差的同期相关矩阵来描述。用ei 表示第 i 个方程的残差,i =1,2,3。其结果如表9.1所示。 表9.1 残差的同期相关矩阵,2
11、2,从表中可以看到实际利率rr、实际M1的ln(m1) 方程和实际GDP的ln(gdp)方程的残差项之间存在的同期相关系数比较高,进一步表明实际利率、实际货币供给量(M1)和实际GDP之间存在着同期的影响关系,尽管得到的估计量是一致估计量,但是在本例中却无法刻画它们之间的这种同期影响关系。,23,9.1.2 结构VAR模型(SVAR),在式(9.1.1)或式(9.1.3)中,可以看出,VAR模型并没有给出变量之间当期相关关系的确切形式,即在模型的右端不含有当期的内生变量,而这些当期相关关系隐藏在误差项的相关结构之中,是无法解释的,所以将式(9.1.1)和式(9.1.3)称为VAR模型的简化形式
12、。本节要介绍的结构VAR模型(Structural VAR,SVAR),实际是指VAR模型的结构式,即在模型中包含变量之间的当期关系。,24,1两变量的SVAR模型,为了明确变量间的当期关系,首先来研究两变量的VAR模型结构式和简化式之间的转化关系。如含有两个变量(k=2)、滞后一阶(p=1)的VAR模型结构式可以表示为下式,(9.1.8),25,在模型(9.1.8)中假设: (1)随机误差 uxt 和 uzt 是白噪声序列,不失一般性,假设方差 x2 = z2 =1 ; (2)随机误差 uxt 和 uzt 之间不相关,cov(uxt , uzt )=0 。,式(9.1.8)一般称为一阶结构向
13、量自回归模型(SVAR(1)。,26,它是一种结构式经济模型,引入了变量之间的作用与反馈作用,其中系数 c12 表示变量 zt 的单位变化对变量 xt 的即时作用,21表示 xt-1的单位变化对 zt 的滞后影响。虽然 uxt 和 uzt 是单纯出现在 xt 和 zt 中的随机冲击,但如果 c21 0,则作用在 xt 上的随机冲击 uxt 通过对 xt 的影响,能够即时传到变量 zt 上,这是一种间接的即时影响;同样,如果 c12 0,则作用在 zt 上的随机冲击 uzt 也可以对 xt 产生间接的即时影响。冲击的交互影响体现了变量作用的双向和反馈关系。,27,为了导出VAR模型的简化式方程,
14、将上述模型表示为矩阵形式 该模型可以简单地表示为,(9.1.9),28,假设 C0可逆,可导出简化式方程为 其中,(9.1.10),29,从而可以看到,简化式扰动项 t 是结构式扰动项 ut 的线性组合,因此代表一种复合冲击。因为 uxt 和 uzt 是不相关的白噪声序列,则可以断定上述 1t 和 2t 也是白噪声序列,并且均值和方差为,30,同期的 1t 和 2t 之间的协方差为 从式(9.1.11)可以看出当 c12 0 或 c21 0 时,VAR模型简化式中的扰动项不再像结构式中那样不相关,正如例9.1中的表9.1所显示的情况。当 c12 = c21 = 0 时,即变量之间没有即时影响,
15、上述协方差为0,相当于对C0矩阵施加约束。,(9.1.11),31,2多变量的SVAR模型,下面考虑k个变量的情形,p阶结构向量自回归模型SVAR(p)为,(9.1.13),其中: , ,32,可以将式(9.1.13)写成滞后算子形式,(9.1.14),其中:C(L) = C0 1L 2L2 pLp ,C(L)是滞后算子L的 kk 的参数矩阵,C0 Ik。需要注意的是,本书讨论的SVAR模型,C0 矩阵均是主对角线元素为1的矩阵。如果 C0 是一个下三角矩阵,则SVAR模型称为递归的SVAR模型。,33,用时间序列模型来分析影响关系的一种思路,是考虑扰动项的影响是如何传播到各变量的。下面先根据
16、两变量的VAR(2)模型来说明脉冲响应函数的基本思想。,9.4.1 脉冲响应函数的基本思想,(9.4.1),其中,ai,bi,ci,di 是参数,t = ( 1t , 2t ) 是扰动项,假定是具有下面这样性质的白噪声向量:,34,(9.4.2),假定上述系统从期开始活动,且设 x-1=x-2= z-1=z-2= 0,又设于第期给定了扰动项 10 =1,20 =0,并且其后均为,即 1t =2t =0 (t 1,2,),称此为第期给 x 以脉冲。,35,下面讨论 xt 与 zt 的响应,t = 0 时: 将其结果代入式(9.4.1) ,当t = 1时,再把此结果代入式(9.4.1) ,当t =
17、2时,继续这样计算下去,设求得结果为称为由 x 的脉冲引起的 x 的响应函数。同时所求得,36,称为由 x 的脉冲引起的 z 的响应函数。 当然,第期的脉冲反过来,从 10 =0,20 =1 出发,可以求出由 z 的脉冲引起的 x 的响应函数和 z 的响应函数。因为以上这样的脉冲响应函数明显地捕捉对冲击的效果,所以同用于计量经济模型的冲击乘数分析是类似的。,37,本例选择钢铁行业及其主要的下游行业的销售收入数据做为各行业的需求变量,利用脉冲响应函数分析各下游行业自身需求的变动对钢铁行业需求的影响。 分别用 y1 表示钢材销售收入;y2 表示建材销售收入 y3 表示汽车销售收入;y4 表示机械销
18、售收入;y5 表示家电销售收入。样本区间为1999年1月2002年12月,所采用数据均作了季节调整,指标名后加上后缀sa,并进行了协整检验,存在协整关系,这表明,所选的各下游行业的销售收入与钢铁工业的销售收入之间具有长期的均衡关系。,例9.4 钢铁行业的需求对下游相关行业变化的响应,38,脉冲响应函数在EViews软件中的实现 为了得到脉冲响应函数,先建立一个VAR模型,然后在VAR工具栏中选择View/Impulse Response或者在工具栏选择Impulse,并得到下面的对话框,有两个菜单:Display 和 Impulse Definition。,39,1. Display菜单提供下
19、列选项: (1) 显示形式(Display Format) 选择以图或表来显示结果。如果选择Combined Graphs 则Response Standard Error选项是灰色,不显示标准误差。而且应注意:输出表的格式是按响应变量的顺序显示,而不是按脉冲变量的顺序。,(2) 显示信息(Display Information) 输入产生冲击的变量(Impulses)和希望观察其脉冲响应的变量(Responses)。可以输入内生变量的名称,也可以输入变量的对应的序数。,40,例如,如果VAR模型以GDP、M1、CPI的形式定义,则既可以以: GDP CPI M1 的形式输入,也可以以 1 3
20、 2 的形式输入。输入变量的顺序仅仅影响结果的显示。 还应定义一个确定响应函数轨迹的期间的正整数。如果想显示累计的响应,则需要单击Accumulate Response选项。对于稳定的VAR模型,脉冲响应函数应趋向于0,且累计响应应趋向于某些非0常数。,41,(3) 脉冲响应标准差(Response Standard Error) 提供计算脉冲响应标准误差的选项。解析的或Monte Carlo标准误差对一些Impulse选项和误差修正模型(VEC)一般不一定有效。若选择了Monte Carlo,还需在下面的编辑框确定合适的迭代次数。 如果选择表的格式,被估计的标准误差将在响应函数值下面的括号内
21、显示。如果选择以多图来显示结果,曲线图将包括关于脉冲相应的正负(+/-)两个标准偏离带。在Combined Graphs中将不显示标准误差偏离带。,42,2. Impulse Definition菜单提供了转换脉冲的选项: (1) Residual-One Unit 设置脉冲为残差的一个单位的冲击。这个选项忽略了VAR模型残差的单位度量和相关性,所以不需要转换矩阵的选择。这个选项所产生的响应函数是VAR模型相对应VMA()模型的系数。,(2) Residual-One Std.Dev 设置脉冲为残差的一个标准偏差的冲击。这个选项忽略了VAR模型残差的相关性。,43,(3) Cholesky分解
22、 用残差协方差矩阵的Cholesky因子的逆来正交化脉冲。这个选项为VAR模型的变量强加一个次序,并将所有影响变量的公共因素归结到在VAR模型中第一次出现的变量上。注意:如果改变变量的次序,将会明显地改变响应结果。可以在Cholesky Ordering 的编辑框中重新定义VAR模型中变量的次序。,44,Cholesky分解有2种选择: a. 有自由度调整(d.f.adjustment):在估计的残差协方差矩阵利用Cholesky 因子时进行小样本的自由度修正。具有自由度修正的残差协方差矩阵的第(i, j)元素的计算是按下列公式计算的: 其中m是VAR模型中每一个方程中待估计参数的个数。 b.
23、 没有自由度调整(no d.f.adjustment):估计残差协方差矩阵的第(i, j) 元素的计算是按下列公式计算的:,45,(5) 结构分解(Structural Decomposition) 用结构因子分解矩阵估计的正交转换矩阵。如果没有先估计一个结构因子分解矩阵,或者没有对模型施加约束,这个选项不能用。,(4) 广义脉冲(Generalized Impulses) 描述Pesaran和Shin(1998)构建的不依赖于VAR模型中变量次序的正交的残差矩阵。应用按上面的Cholesky顺序计算的第j个变量的Cholesky因子得到第j个变量的扰动项的广义脉冲响应。,46,(6) 用户指
24、定(User Specified) 这个选项允许用户定义脉冲。建立一个包含脉冲的矩阵(或向量),并在编辑框中输入矩阵的名字。如果VAR模型中有k个内生变量,则脉冲矩阵必须是k行和1列或k列的矩阵,每一列代表一个脉冲向量。 例如:一个有k(= 3)个变量的VAR模型,希望同步对第一个变量有一个正的一个单位的冲击,给第二个变量一个负的一个单位的冲击,可以建立一个31的脉冲矩阵 S ,其值分别为:1,1,0。在编辑框中键入矩阵的名字: S。,47,例9.4建立5变量的VAR(3)模型,下面分别给各下游行业销售收入一个冲击(选择广义脉冲) ,得到关于钢材销售收入的脉冲响应函数图。在下列各图中,横轴表示
25、冲击作用的响应期间数(单位:月度),纵轴表示钢材销售收入(亿元),实线表示脉冲响应函数,代表了钢材销售收入对相应的行业销售收入的冲击的反应,虚线表示正负两倍标准差偏离带 。,48,y1:钢材; y2:建材; y3:汽车; y4:机械; y5:家电,49,从第一个图中可以看出,当在本期给建材行业销售收入一个正冲击后,钢材销售收入在前4期内小幅上下波动之后在第6期达到最高点( =12.03,即在第6期 y1 对 y2 的响应是12.03) ;从第9期以后开始稳定增长。这表明建材行业受外部条件的某一冲击后,经市场传递给钢铁行业,给钢铁行业带来同向的冲击,而且这一冲击具有显著的促进作用和较长的持续效应
26、。 从第二幅图中可以看出,当在本期给汽车行业销售收入一个正冲击后,钢材销售收入在前5期内会上下波动;从第5期以后开始稳定增长( =1.76)。这表明汽车行业的某一冲击也会给钢铁行业带来同向的冲击,即汽车行业销售收入增加会在5个月后对钢材的销售收入产生稳定的拉动作用。,50,从第三幅图中可以看出,机械行业销售收入的正冲击经市场传递也会给钢材销售收入带来正面的影响,并且此影响具有较长的持续效应。从第四幅图中可以看出当在本期给家电行业销售收入一个正冲击后,也会给钢材销售收入带来正面的冲击,但是冲击幅度不是很大。,综上所述,由于市场化程度、政府保护政策等各方面的原因,使得各下游相关行业的外部冲击会通过
27、市场给钢铁行业带来不同程度的影响,但是都是同向的影响。政府可以利用这种现象,对市场进行有区别、有重点的调整,减少盲目的重复建设项目。,回归分析中考虑一个变量依赖于另一个变量,但这不一定意味着因果关系。 格兰杰因果检验的思想:时间不会倒退,即,如果事件A在事件B之前发生,那么可能是A导致了B,但不可能是B导致了A,换言之,过去的事件能够导致今天事件的发生,未来的事件却不能。Example:考虑两个变量:GNP和货币供给M。它们相互之间有着分布滞后的影响。换句话说,这里存在着时间序列滞后关系。那么,我们是否可以确定这两个变量之间因果关系的方向呢?,经济学中的因果检验:格兰杰检验,为了阐明这一点,格
28、兰杰提出了一个简单的方法对因果关系进行了检验。格兰杰检验基本原理 格兰杰因果关系检验假设, 有关GDP或M变量的预测信息, 全部包含在这两个变量的时间序列之中。格兰杰检验首先对以下回归进行估计: (17.14.1) (17.14.2),其中假定干扰项 和 不相关。 方程(17.14.1)假拟当前GNP与GNP自身及M的过去值有关方程(17.14.2)假拟当前M与M自身以及GNP的过去值有关在模型中GNP 和M可以用 和 。 分别读作GNP点和M点, ( 表示GNP的增长率; 表示货币供给的增长率)。,讨论情形:1.如果(17.14.1)中滞后M系数的估计量作为一个群体在统计上异于零点(即 ),
29、 并且(17.14.2)中的滞后GNP系数的估计量的集合不是统计上异于零的(即 ),则表明有从M到GNP的单向因果关系。,2.反之,如果(17.14.1)中的滞后M的系数集不是统计上异于零的(即 ),而(17.14.2)中的滞后GNP的系数集却是统计上异于零的(即 ),则表明有从GNP到M的单向因果关系。 3.如果M和GNP的系数集在两个 回归中都是统计上异于零的,则表示有反馈或双向因果关系。,4.最后,如果M和GNP的系数集在两个回归中都不是统计上显著的,就表示两者之间各自的独立性。结论更为一般的,由于将来不能预测过去,如果变量X是变量Y的(格兰杰)原因,则X的变化应先于Y的变化。 因此,在
30、做Y对其他变量(包括自身的过去值)的回归时,如果引入X的过去或滞后值能显著地改进对Y的预测,我们就可以说X是Y的(格兰杰)原因。 类似地定义Y是X的(格兰杰)原因。,格兰杰检验步骤: 以GNP-M一例加以说明 Step1:将当前的GNP对所有的滞后GNP项以及其他变量(如果有的话)做回归,但在这一回归中不包括M的滞后变量。这是一个受约束的回归。从而得到受约束的残差平方 RSSR Step2:现在做含有M滞后项的回归,这是一个无约束的回归,由此回归得到无约束的残差平方 。,Step3:原假设是: ,即M的滞后项不属于此回归。Step4:为了检验此假设,我们利用F检验: 它遵循自由度为m和(n-k)的F分布。m 等于 滞后项M的个数,k是无约束回归中待估参数的个数。Step5:如果在选定的显著性水平上计算的F值超过临界F值,则拒绝原假设,这样M的滞后项就属于此回归。这是M导致GNP的另一说法。若计算的F值不超过临界F值,则接受原假设,即M不是GNP的(格兰杰)原因,Step6:为了检验模型(17.14.2),即检验GNP是否是M的(格兰杰)原因,可重复步骤1至5. Eviews中提供格兰杰因果检验,因而你可以发现在Eviews中可以轻而易举的完成该检验。 举例说明格兰杰因果检验,