1、9.2 随机时间序列分析模型 一、时间序列模型的基本概念及其适用性 二、随机时间序列模型的平稳性条件 三、随机时间序列模型的识别 四、随机时间序列模型的估计 五、随机时间序列模型的检验 经典计量经济学模型与时间序列模型 确定性时间序列模型与随机性时间序列模型 一、时间序列模型的基本概念及其适用性 1、时间序列模型的基本概念 随机时间序列模型( time series modeling)是指仅用它的过去值及随机扰动项所建立起来的模型,其一般形式为 Xt=F(Xt-1, Xt-2, , ?t) 建立具体的时间序列模型,需解决如下三个问题: (1)模型的具体形式 (2)时序变量的滞后期 (3)随机扰
2、动项的结构 例如,取线性方程、一期滞后以及白噪声随机扰动项( ?t =?t) ,模型将是一个 1 阶自回归过程 AR(1): Xt=?Xt-1+ ?t 这里, ?t 特指一白噪声。 一般的 p 阶自回归过程 AR(p)是Xt=?1Xt-1+ ?2Xt-2 + + ?pXt-p + ?t (*) 将纯 AR(p)与纯 MA(q)结合,得到一个一般的自回归移动平均(autoregressive moving average)过程 ARMA(p,q): 经典回归模型的问题: 迄今为止,对一个时间序列 Xt 的变动进行解释或预测,是通过某个单方程回归模型或联立方程回归模型进行的,由于它们以因果关系为基
3、础,且具有一定的模型结构,因此也常称为结构式模型(structural model) 。 然而,如果 Xt 波动的主要原因可能是我们无法解释的因素,如气候、消费者偏好的变化等,则利用结构式模型来解释 Xt 的变动就比较困难或不可能,因为要取得相应的量化数据,并建立令人满意的回归模型是很困难的。 有时,即使能估计出一个较为满意的因果关系回归方程,但由于对某些解释变量未来值的预测本身就非常困难,甚至比预测被解释变量的未来值更困难,这时因果关系的回归模型及其预测技术就不适用了。 例如,时间序列过去是否有明显的增长趋势,如果增长趋势在过去的行为中占主导地位,能否认为它也会在未来的行为里占主导地位呢?
4、或者时间序列显示出循环周期性行为,我们能否利用过去的这种行为来外推它的未来走向? 随机时间序列分析模型,就是要通过序列过去的变化特征来预测未来的变化趋势。 使用时间序列分析模型的另一个原因在于: 如果经济理论正确地阐释了现实经济结构,则这一结构可以写成类似于 ARMA(p,q)式的时间序列分析模型的形式。 例如,对于如下最简单的宏观经济模型: 这里,Ct、It、Yt 分别表示消费、投资与国民收入。 Ct 与 Yt 作为内生变量,它们的运动是由作为外生变量的投资 It 的运动及随机扰动项?t 的变化决定的。 上述模型可作变形如下: 两个方程等式右边除去第一项外的剩余部分可看成一个综合性的随机扰动
5、项,其特征依赖于投资项 It 的行为。 如果 It 是一个白噪声,则消费序列 Ct 就成为一个 1 阶自回归过程 AR(1),而收入序列 Yt 就成为一个(1,1)阶的自回归移动平均过程 ARMA(1,1)。 二、随机时间序列模型的平稳性条件 自回归移动平均模型( ARMA)是随机时间序列分析模型的普遍形式,自回归模型(AR)和移动平均模型(MA)是它的特殊情况。 关于这几类模型的研究,是时间序列分析的重点内容:主要包括模型的平稳性分析、模型的识别和模型的估计。 考虑 p 阶自回归模型 AR(p)Xt=?1Xt-1+ ?2Xt-2 + + ?pXt-p +?t (*) 引入滞后算子(lag o
6、perator )L: LXt=Xt-1, L2Xt=Xt-2, , LpXt=Xt-p (*)式变换为 (1-?1L- ?2L2-?pLp)Xt=?t AR(1)模型的平稳性条件。 而 AR(1)的特征方程 又由于 由平稳性的定义,该方差必须是一不变的正数,于是有 ?1+?2 1, ?2-?1 1, |?2| 1 对应的特征方程 1-?1z-?2z2=0 的两个根 z1、z2 满足: z1z2=-1/?2 , z1+z2 =-?1/?2 对高阶自回模型 AR(p)来说,多数情况下没有必要直接计算其特征方程的特征根,但有一些有用的规则可用来检验高阶自回归模型的稳定性: 对于移动平均模型 MR
7、(q): Xt=?t - ?1?t-1 - ?2?t-2 - ? - ?q?t-q 其中?t 是一个白噪声,于是 由于 ARMA (p,q)模型是 AR(p)模型与 MA(q)模型的组合: Xt=?1Xt-1+ ?2Xt-2 + + ?pXt-p + ?t - ?1?t-1 - ?2?t-2 - ? - ?q?t-q 最后 (1)一个平稳的时间序列总可以找到生成它的平稳的随机过程或模型; (2)一个非平稳的随机时间序列通常可以通过差分的方法将它变换为平稳的,对差分后平稳的时间序列也可找出对应的平稳随机过程或模型。 因此,如果我们将一个非平稳时间序列通过 d 次差分,将它变为平稳的,然后用一个平
8、稳的 ARMA(p,q)模型作为它的生成模型,则我们就说该原始时间序列是一个自回归单整移动平均(autoregressive integrated moving average)时间序列,记为ARIMA(p,d,q)。 例如,一个 ARIMA(2,1,2)时间序列在它成为平稳序列之前先得差分一次,然后用一个 ARMA(2,2)模型作为它的生成模型的。 当然,一个 ARIMA(p,0,0)过程表示了一个纯 AR(p)平稳过程;一个 ARIMA(0,0,q)表示一个纯 MA(q)平稳过程。 三、随机时间序列模型的识别 所谓随机时间序列模型的识别,就是对于一个平稳的随机时间序列,找出生成它的合适的随
9、机过程或模型,即判断该时间序列是遵循一纯 AR 过程、还是遵循一纯 MA 过程或 ARMA 过程。 所使用的工具主要是时间序列的自相关函数(autocorrelation function,ACF)及偏自相关函数(partial autocorrelation function, PACF ) 。 1、AR(p)过程 (1)自相关函数 ACF 1 阶自回归模型 AR(1) Xt=?Xt-1+ ?t 的 k 阶滞后自协方差为: Xt=?1Xt-1+ ?2Xt-2 + ?t 该模型的方差?0 以及滞后 1 期与 2 期的自协方差?1, ?2 分别为 一般地,p 阶自回归模型 AR(p) Xt=?1
10、Xt-1+ ?2Xt-2 + ?pXt-p + ?t 其中:1/zi 是 AR(p)特征方程?(z)=0 的特征根,由 AR(p)平稳的条件知,|zi| 1; 因此,当 1/zi 均为实数根时,?k 呈几何型衰减(单调或振荡) ; 当存在虚数根时,则一对共扼复根构成通解中的一个阻尼正弦波项,?k 呈正弦波衰减。 (2)偏自相关函数 从 Xt 中去掉 Xt-1的影响,则只剩下随机扰动项?t,显然它与 Xt-2 无关,因此我们说Xt 与 Xt-2 的偏自相关系数为零,记为 在实际识别时,由于样本偏自相关函数 rk*是总体偏自相关函数?k*的一个估计,由于样本的随机性,当 k p 时,rk*不会全为
11、 0,而是在 0 的上下波动。但可以证明,当 k p 时,rk*服从如下渐近正态分布: rk*N(0,1/n) 式中 n 表示样本容量。 因此,如果计算的 rk*满足 对 MA(1)过程 MA(1)过程可以等价地写成?t 关于无穷序列 Xt,Xt-1,的线性组合的形式: 其自协方差系数为 与 MA(1)相仿,可以验证 MA(q)过程的偏自相关函数是非截尾但趋于零的。 ARMA(p,q)的自相关函数,可以看作 MA(q)的自相关函数和 AR(p)的自相关函数的混合物。 当 p=0 时,它具有截尾性质; 当 q=0 时,它具有拖尾性质; 当 p、q 都不为 0 时,它具有拖尾性质 从识别上看,通常
12、: ARMA(p,q)过程的偏自相关函数(PACF)可能在 p 阶滞后前有几项明显的尖柱(spikes) ,但从 p 阶滞后项开始逐渐趋向于零; 而它的自相关函数(ACF)则是在 q 阶滞后前有几项明显的尖柱,从 q 阶滞后项开始逐渐趋向于零。 四、随机时间序列模型的估计 AR(p)、MA(q)、ARMA(p,q)模型的估计方法较多,大体上分为 3 类: (1)最小二乘估计; (2)矩估计; (3)利用自相关函数的直接估计。 下面有选择地加以介绍。 AR(p)模型的 Yule Walker 方程估计 利用实际时间序列提供的信息,首先求得自相关函数的估计值 MA(q)模型的矩估计 (1)MA(1
13、)模型的直接算法 对于 MA(1)模型, (*)式相应地写成 (2)MA(q)模型的迭代算法 第二步,将第一次迭代值代入(*)式,计算出第二次迭代值 ARMA(p,q)模型的矩估计 第二步,改写模型,求?1,?2,?,?q 以及?2 的估计值 AR(p)的最小二乘估计 为了与AR(p)模型的 Yule Walker 方程估计进行比较,将(*)改写成: 解该方程组,得到: 需要说明的是,在上述模型的平稳性、识别与估计的讨论中,ARMA(p,q)模型中均未包含常数项。 五、模型的检验 由于 ARMA(p,q)模型的识别与估计是在假设随机扰动项是一白噪声的基础上进行的,因此,如果估计的模型确认正确的
14、话,残差应代表一白噪声序列。 如果通过所估计的模型计算的样本残差不代表一白噪声,则说明模型的识别与估计有误,需重新识别与估计。 在实际检验时,主要检验残差序列是否存在自相关。 2、AIC 与 SBC 模型选择标准 另外一个遇到的问题是,在实际识别 ARMA(p,q)模型时,需多次反复偿试,有可能存在不止一组(p,q)值都能通过识别检验。 显然,增加 p 与 q 的阶数,可增加拟合优度,但却同时降低了自由度。因此,对可能的适当的模型,存在着模型的“简洁性”与模型的拟合优度的权衡选择问题。 其中,n 为待估参数个数(p+q+可能存在的常数项) ,T 为可使用的观测值,RSS 为残差平方和(Resi
15、dual sum of squares) 。 在选择可能的模型时,AIC 与 SBC 越小越好 显然,如果添加的滞后项没有解释能力,则对 RSS 值的减小没有多大帮助,却增加待估参数的个数,因此使得 AIC 或 SBC 的值增加。 需注意的是:在不同模型间进行比较时,必须选取相同的时间段。 由第一节知:中国支出法 GDP 是非平稳的,但它的一阶差分是平稳的,即支出法 GDP是 I(1)时间序列。 可以对经过一阶差分后的 GDP 建立适当的 ARMA(p,q)模型。 记 GDP 经一阶差分后的新序列为GDPD1,该新序列的样本自相关函数图与偏自相关函数图如下: 图形:样本自相关函数图形呈正弦线型衰减波,而偏自相关函数图形则在滞后两期后迅速趋于 0。因此可初步判断该序列满足 2 阶自回归过程 AR(2)。 设序列 GDPD1 的模型形式为 有时,在用回归法时,也可加入常数项。 本例中加入常数项的回归为: 模型检验 用建