1、1时间序列模型时间序列分析方法由 Box-Jenkins (1976) 年提出。它适用于各种领域的时间序列分析。时间序列模型不同于经济计量模型的两个特点是: 这种建模方法不以经济理论为依据,而是依据变量自身的变化规律,利用外推机制描述时间序列的变化。 明确考虑时间序列的非平稳性。如果时间序列非平稳,建立模型之前应先通过差分把它变换成平稳的时间序列,再考虑建模问题。时间序列模型的应用:(1)研究时间序列本身的变化规律(建立何种结构模型,有无确定性趋势,有无单位根,有无季节性成分,估计参数) 。(2)在回归模型中的应用(预测回归模型中解释变量的值) 。(3)时间序列模型是非经典计量经济学的基础之一
2、(不懂时间序列模型学不好非经典计量经济学) 。分节如下:1随机过程、时间序列定义2时间序列模型的分类3自相关函数与偏自相关函数4建模步骤(识别、参数估计、诊断检验、案例分析)5回归与时间序列组合模型6季节时间序列模型(案例分析)2.1 随机过程、时间序列为什么在研究时间序列之前先要介绍随机过程?就是要把时间序列的研究提高到理论高度来认识。时间序列不是无源之水。它是由相应随机过程产生的。只有从随机过程的高度认识了它的一般规律。对时间序列的研究才会有指导意义。对时间序列的认识才会更深刻。自然界中事物变化的过程可以分成两类。一类是确定型过程,一类是非确定型过程。确定型过程即可以用关于时间 t 的函数
3、描述的过程。例如,真空中的自由落体运动过程,电容器通过电阻的放电过程,行星的运动过程等。非确定型过程即不能用一个(或几个)关于时间 t 的确定性函数描述的过程。换句话说,对同一事物的变化过程独立、重复地进行多次观测而得到的结果是不相同的。例如,对河流水位的测量。其中每一时刻的水位值都是一个随机变量。如果以一年的水位纪录作为实验结果,便得到一个水位关于时间的函数 xt。这个水位函数是预先不可确知的。只有通过测量才能得到。而在每年中同一时刻的水位纪录是不相同的。随机过程:由随机变量组成的一个有序序列称为随机过程,记为x (s, t) , sS , tT 。其中 S 表示样本空间,T 表示序数集。对
4、于每一个 t, tT, x (, t ) 是样本空间 S 中的一个随机变量。对于每一个 s, sS , x (s, ) 是随机过程在序数集 T 中的一次实现。x11, x21, , xT-11, xT1x12, x22, , xT-12, xT2 随机过程 x1s, x2s, , xT-1s, xTs 样本空间2随机过程简记为 xt 或 xt。随机过程也常简称为过程。随机过程一般分为两类。一类是离散型的,一类是连续型的。如果一个随机过程x t对任意的 tT 都是一个连续型随机变量,则称此随机过程为连续型随机过程。如果一个随机过程 xt对任意的 tT 都是一个离散型随机变量,则称此随机过程为离散
5、型随机过程。本书只考虑离散型随机过程。连续型 严(强)平稳过程随机过程 平稳的离散型 宽平稳过程非平稳的严(强)平稳过程:一个随机过程中若随机变量的任意子集的联合分布函数与时间无关,即无论对 T 的任何时间子集(t 1, t 2, , tn)以及任何实数 k, (ti + k) T, i = 1, 2, , n 都有F( x(t1) , x(t2), , x(tn) ) = F(x(t1 + k), x(t2 + k), , x(tn + k) )成立,其中 F() 表示 n 个随机变量的联合分布函数,则称其为严平稳过程或强平稳过程。严平稳意味着随机过程所有存在的矩都不随时间的变化而变化。严平
6、稳的条件是非常严格的,而且对于一个随机过程,上述联合分布函数不便于分析和使用。因此希望给出不象强平稳那样严格的条件。若放松条件,则可以只要求分布的主要参数相同。如只要求从一阶到某阶的矩函数相同。这就引出了宽平稳概念。如果一个随机过程 m 阶矩以下的矩的取值全部与时间无关,则称该过程为 m 阶平稳过程。比如E x(ti) = E x(ti + k) = 1, L2 71(在单位圆外)或 1 0,从而得 2 + 1 0 时,L1, L2 为不等实数根。 2, 1 的值位于过阻尼区(自相关函数呈指数衰减) 。(3) 当 12 + 4 2 1。由上式可看出一个平稳的 AR(p)过程可以转换成一个无限阶
7、的移动平均过程(p 个无穷级数之和) 。保证 AR(p) 过程平稳的一个必要但不充分的条件是 p 个自回归系数之和要小于 1,即1,j = 1,2,q 成立。而 Hj -1 是特征方程 L) = (1 H1 L) ( 1 H2 L) (1 Hq L) = 0 的根,所以 MA(q)过程具有10可逆性的条件是特征方程 L) = 0 的根必须在单位圆之外。 (因为 x t = L) ut 是平稳的,如果变换成 L)-1 xt = ut 后,变得不平稳,显然失去可逆性。 )注意,对于无限阶的移动平均过程xt = i u t -i = ut (1+1 L + 2 L 2 + ) (2.12)0i(其方
8、差为Var(xt) = i2 Var (ut i) = u2 (2.13)0i 0i很明显虽然有限阶移动平均过程都是平稳的,但对于无限阶移动平均过程还须另加约束条件才能保证其平稳性。这条件就是x t的方差必须为有限值,即 0i2MA(q) 过程中最常见的是一阶移动平均过程,xt = (1+ 1 L) ut (2.14)其具有可逆性的条件是(1 + 1L) = 0 的根(绝对值)应大于 1,即 |1/ 1| 1, 或| 1| 1。当| 1| 1 时,MA(1)过程(2.14)应变换为ut = (1+ 1L) 1 xt = (1 - 1L + 12L2 - 13L3 + ) xt (2.15)这是
9、一个无限阶的以几何衰减特征为权数的自回归过程。MA(1)过程分析。-4-3-2-10123204608102014601820MA()图 2.3 MA(1)过程(file:5gener1,x5)E(x t) = E(ut) + E( 1 ut - 1) = 0 Var(xt) = Var(ut) + Var( 1 ut 1) = (1+ 12 ) u2自回归与移动平均过程的关系 一个平稳的 AR(p)过程(1 - 1L - 2L2 - - pLp ) xt = ut可以转换为一个无限阶的移动平均过程,xt = (1 - 1L - 2L2 - - pLp )-1 u t = L)-1 ut 一个
10、可逆的 MA(q)过程11xt = (1 + 1L + 2 L2 + + q Lq ) ut = L) ut可转换成一个无限阶的自回归过程,(1 + 1L + 2 L2 + + q Lq)-1 xt = L) -1 xt = ut对于 AR(p)过程只需考虑平稳性问题,条件是 L) = 0 的根(绝对值)必须大于 1。不必考虑可逆性问题。对于 MA(q)过程,只需考虑可逆性问题,条件是 L) = 0 的根(绝对值)必须大于1,不必考虑平稳性问题。(3)自回归移动平均过程由自回归和移动平均两部分共同构成的随机过程称为自回归移动平均过程,记为ARMA(p, q), 其中 p, q 分别表示自回归和
11、移动平均部分的最大阶数。ARMA( p, q) 的一般表达式是xt = 1xt-1 + 2xt-2 + p xt-p + ut + 1ut-1 + 2 ut-2 + .+ q ut-q (2.16)即(1 - 1L - 2 L2 - - p Lp ) xt = (1 + 1 L + 2 L2+ + q Lq ) ut或 (L) xt = (L) ut (2.17)其中 (L) 和 (L) 分别表示 L 的 p, q 阶特征多项式。ARMA(p, q) 过程的平稳性只依赖于其自回归部分,即 (L) = 0 的全部根取值在单位圆之外(绝对值大于 1) 。其可逆性则只依赖于移动平均部分,即 (L)
12、= 0 的根取值应在单位圆之外。-4-2024204608102014601820ARM-30-20-10010204608102014601820ARIM图 2.4 ARMA(1,1) 过程(file :5gener1,x7) 图 2.5 ARIMA(1,1,1) 过程实际中最常用的是 ARMA(1, 1)过程。xt - 1xt-1 = ut + 1 ut - 1 (2.18)或(1 - 1 L)x t =(1 + 1 L)u t很明显只有当 1 1 1 和 1 1 1 时,上述模型才是平稳的,可逆的。(4)单整自回归移动平均过程以上介绍了三种平稳的随机过程。对于 ARMA 过程(包括 AR
13、 过程) ,如果特征方程(L) = 0 的全部根取值在单位圆之外,则该过程是平稳的;如果若干个或全部根取值在单位圆之内,则该过程是强非平稳的。例如,12xt = 1.3 xt-1 + ut(特征方程的根 = 1/ 1.3 = 0.77)上式两侧同减 xt-1 得xt = 0.3 xt-1 + ut仍然非平稳。除此之外还有第三种情形,即特征方程的若干根取值恰好在单位圆上。这种根称为单位根,这种过程也是非平稳的。下面介绍这种重要的非平稳随机过程。假设一个随机过程含有 d 个单位根,其经过 d 次差分之后可以变换为一个平稳的自回归移动平均过程。则该随机过程称为单整自回归移动平均过程。伯克斯詹金斯积数
14、十年理论与实践的研究指出,时间序列的非平稳性是多种多样的,然而幸运的是经济时间序列常常具有这种特殊的线性齐次非平稳特性(即参数是线性的,xt 及其滞后项都是一次幂的) 。对于一个非季节性经济时间序列常常可以用含有一个或多个单位根的随机过程模型描述。考虑如下模型 (L)d yt = (L) ut (2.19)其中 (L) 是一个平稳的自回归算子。即 (z) = 0 的根都大于 1。 (L)表示可逆的移动平均算子。若取xt = d yt (2.20)则(2.19)可表示为 (L) xt = (L) ut (2.21)说明 yt 经过 d 次差分之后,可用一个平稳的、可逆的 ARMA 过程 xt 表
15、示。随机过程 yt 经过 d 次差分之后可变换为一个以 (L)为 p 阶自回归算子, (L)为 q 阶移动平均算子的平稳、可逆的随机过程,则称 yt 为(p, d, q)阶单整(单积)自回归移动平均过程,记为 ARIMA (p, d, q)。这种取名的目的是与以后各章中的称谓相一致。ARIMA过程也称为综合自回归移动平均过程。其中 (L) d 称为广义自回归算子。(2.19) 是随机过程的一般表达式。当 p 0, d = 0, q 0 时, (2.19)变成 ARMA (p, q)过程,d = 0, p = 0, q 0 时,ARIMA 过程变成 AM(q)过程;而当 p = d = q =
16、0 时,ARIMA 过程变成白噪声过程。做 d yt = xt 的逆运算yt = S d xt (2.22)其中 S 是无限累加(积分)算子。当 d = 1 时,S x t 定义如下S xt = = (1 + L + L2 + )xt = (1 L)-1 xt = -1 xt = yt. (2.23)tii则S = (1 L)-1 = -1 (2.24)单整(单积)与差分互为逆运算。例 5:以 yt = yt-1 + xt, y0 = 0 为例, xt中元素的逐步叠加,得到的是 yt 序列。而 yt的差分运算得到的是x t序列。y1 = x1y2 = x2 + x1y3 = x3 +x2 +
17、x113yt-1 = xt-1 + + x3 +x2 + x1yt = xt + xt-1 + + x3 +x2 + x1可见 S 是 的逆运算。 (2.23)表明随机过程 xt 经过逐步叠加之后可以得到 yt。每次叠加类似于连续函数的一次积分,这就是为什么称 AR1MA 过程为单整自回归移动平均过程。“单整”在这里就是积分的意思。现在容易理解,随机游走过程(2.3)就是由白噪声过程累加一次而得到的。给出若干具体的非平稳随机过程如下:1. ARIMA (0, 1, 1)过程yt = ut + 1 ut 1 = (1 + 1L)ut其中 p = 0,d = 1,q = 1, (L) = 1, (
18、L) = 1+ 1 L。2. ARIMA(1, 1, 0)过程yt - 1yt 1 = u t其中 p = 1,d = 1,q = 0, (L) = 1 - 1 L, (L) = 1。3.ARIMA(1,1,1)过程yt - 1yt -1 = ut + 1 ut -1或(1 - 1 L)yt 1= (1 + 1L) ut其中 p = 1, d = 1, q = 1, (L) = 1 - 1 L, (L) = 1+ 1 L。对于非季节经济时间序列 p, d, q 的取值很少有大于 2 的情景。这些参数的常见取值是0、1 和 2。(5)Wold 分解定理:任何协方差平稳过程 xt,都可以被表示为x
19、t - - dt = ut + 1 ut-1+ 2 ut-2 + + = 0jjtu其中 表示 xt 的期望。d t 表示 xt 的线性确定性成分,如周期性成分、时间 t 的多项式和指数形式等,可以直接用 xt 的滞后值预测。 0 = 1, 。u t 为白噪声过程。u t 表02jj示用 xt 的滞后项预测 xt 时的误差。ut = xt - E(xt xt-1, xt-2 , )称为 xt 的线性非确定性成分。当 dt = 0 时,称 xt 为纯线性非确定性过程。0jjtWold 分解定理由 Wold 在 1938 年提出。Wold 分解定理只要求过程 2 阶平稳即可。从原理上讲,要得到过程
20、的 Wold 分解,就必须知道无限个 j 参数,这对于一个有限样本来说是不可能的。实际中可以对 j 做另一种假定,即可以把 (L)看作是 2 个有限特征多项式的比,(L) = = =0jj)(LpqL.12注意,无论原序列中含有何种确定性成分,在前面介绍的模型种类和后面介绍的自相关函数、偏自相关函数中都假设在原序列中已经剔除了所有确定性成分,是一个纯的随机14过程(过程中不含有任何确定性成分) 。如果一个序列如上式,xt = + dt + ut + 1 ut-1+ 2 ut-2 + +则所有研究都是在(x t - - dt)的基础上进行。例如前面给出的各类模型中都不含有均值项、时间趋势项就是这
21、个道理。下面以漂移项非零的平稳过程为例,介绍漂移项与均值的关系。设有漂移项的平稳ARMA(2,1)过程如下,xt = 0.05 + 0.2 xt-1 + 0.4 xt-2 + ut + 0.3 ut-1 (2.27)漂移项等于 0.05。则 xt 的期望是E(xt)-0.2 E(xt-1)-0.4 E(xt-2) = (1- 0.2 -0.4)E(xt) = (1)E(xt) =0.05 = E(xt) =0.05 / (1) = 0.05 / (1- 0.2 -0.4) =0.05 / 0.4 = 0.125 (2.28)其中 0.05 是漂移项,0.4 = (1- 0.2 -0.4) =
22、(1) 是自回归特征多项式当 L=1 时的值。这就是漂移项与均值的关系。(2.27)式可以表示为(xt -0.125)= 0.2 (xt-1 -0.125) + 0.4 (xt-2 -0.125) + ut + 0.3 ut-1 (2.29)这是因为上式化简后得xt = 0.125 (1- 0.2 -0.4) + 0.2 xt-1 + 0.4 xt-2 + ut + 0.3 ut-1 = 0.05 + 0.2 xt-1 + 0.4 xt-2 + ut + 0.3 ut-1 (2.30)与(2.27)式相同,所以有关系式 (1) = (1- 0.2 -0.4) 0.125 = 0.05 = 。比
23、较(2.27)和(2.29)式,可见结论,任何漂移项非零的平稳过程都可以通过对序列先退均值,然后建立 ARMA 模型研究。所以前面给出的四类模型不失一般性。下图是 y 和 y+8 两个序列的时序图。序列 y+8 当然可以通过先减均值,然后对 y 建立模型。因为序列 y 和 y+8 的结构相同,只不过均值相异而已。-505101525075101251017520YY+8用一般表达式叙述这个问题。设有漂移项非零的平稳 ARMA(p,q)过程如下, (L) xt = + (L) ut (2.31)则过程 xt 的期望是E(xt) = / (1) = / (1- 1- 2 - - p) = (2.3
24、2)这就是漂移项与均值的关系。(2.31)式可以表示为 (L) (xt - ) = (L) ut (2.33)这是因为上式可以写为 (L) xt = (1) + (L) ut = + (L) ut (2.30)其中根据(2.32)式,有 (1) =。(2.31)与(2.33)式等价,所以任何漂移项非零的平稳过程都可以通过对序列先退均值(或确定性成分) ,然后建立 ARMA 模型研究。前面给出的四类模型不失一般性。如何判别其是自回归过程还是移动平均过程?如何判别其过程的阶数呢?如何通过一个时间序列研究其过程的平稳性呢?15-4-2024204608102014601820AR(1)-4-3-2-10123204608102014601820MA()