1、 - 1 - 单位根检验以及 平稳时间序列建模 - 2 - 目录 一、DF 统计 量及DF 检验3 二、ADF 检验5 三、例题6 - 3 - 由于虚假回归问题的存在,所以在进行回归模型拟合时,必须先检验各序列的平稳性。 单位根检验 ( 由Dickey-Fuller 1979 年提出)是指检验序列中是 否存在单位根。单位 根检验方法有多种, 这里主要介绍 DF 和 ADF 检验。 介绍这种检验方法之前, 先讨论 DF 统计 量的分布特征。 一、DF 统计 量 及DF 检验 1 、DF 统计 量 以1 阶自回归序列为例: t t t a x x + = 1 1 该序列的特征方程为: 0 1 =
2、当特征根 1 在单位圆内时,该序列平稳,反之,该序列为非平稳序列。所以可以通过检 验特征根是在单位圆内还是单位圆外 (或上) , 来检验序列的平稳性, 这种检验就称为单位根 检验。 由于现实生活中绝大多数序列都是非平稳序列,所以单位跟检验的原假设定位: 原假设 0 H :序列 t x 非平稳;备择假设 1 H :序列 t x 平稳 检验统计量为t 统计量: ) ( ) ( 1 1 1 1 S t = ,其中, 1 为参数 1 的最小二乘估计, = = T t t T x S S 1 1 2 2 1 ) ( , 1 ( 1 1 1 2 = = T x x S T t t t T ) 当 1 =0
3、 时, ) ( 1 t 的极限分布为标准正态分布; 当 1 | | 1 时, ) ( 1 t 的渐进分布为标准正态分布, 但当 1 | | 1 = 时, ) ( 1 t 的渐进分布不再是 正态分布。 记 ) ( 1 1 1 S = 该统计量称为DF 检验统计量,它的极限分布为 = 1 0 2 1 0 1 1 ) ( ) ( ) ( ) ( 1 dr r W r dW r W S 极限 ,其 中 ) (r W 为自由度为 r 的维纳过程。 所谓维纳过程具有如下 性质: (1) 1) N(0 ) 1 ( , W - 4 - (2) r) N(0 ) r ( 2 , W (3) ) 1 ( /r )
4、 ( 2 2 r W DF 检验为单边检验,当显著性水平取为 时,记 为DF 检验的 分位点,则 当 时,拒绝原假设,认为序列显著平稳,否则,接受原假设,认为序列非平稳。 在实际检验中,若H0 不能被拒绝,说明序列是非平稳序列(起码为一阶非平稳序列)。 接下来应该继续检验多阶差分之后的序列的平稳性直至结论为平稳为止。 2 、DF 检验 的 等价 表达 在等式 t t t a x x + = 1 1 两边同时减去 1 t x 得到 t t t t a x x x + = 1 1 1 ) 1 ( 。 DF 检验等价为如下检验: 1 0 0 1 1 0 = = 其中: : : H H相应的DF 检验
5、统计量为: ) ( S = ,其中 ) ( S 为参数 的样本标准差。 3 、DF 检验 的 三种 类型 第一种:无常数均值、无趋势的1 阶自回归过程: t t t x x + = 1 1第二种:有常数均值、无趋势的1 阶自回归过程: t t t x x + + = 1 1此种情况下,可以通过最小二乘法可以得到两个未知参数的估计值,通过检验特征根的 性质,可以考察中心化序列 u x t 的平稳性。 假设检验如下: 原假设 0 H :序列 u x t 非平稳即 1 | | 1 ; 备择假设 1 H :序列 u x t 平稳即 1 | | 1 ; 第三种:有常数均值、有线性趋势的1 阶自回归过程:
6、 t t t x t x + + + = 1 1此种情况下,可以通过最小二乘法可以得到三个未知参数的估计值,通过检验特征根的 性质,可以考察中心化序列 t u x t 的平稳性。 假设检验如下: - 5 - 原假设 0 H :序列 t u x t 非平稳即 1 | | 1 ; 备择假设 1 H :序列 t u x t 平稳即 1 | | 1 ; 二、ADF 检验 DF 检验只适用于1 阶自回归过程的平稳性检验, 为了使DF 检验能适用于AR(p)过程的平 稳性检验, 需要对 DF 检验进行一定的修正, 得到增广DF 检 验( augmented DickeyFuller), 简记为ADF。 1
7、 、ADF 检验 的原理 对于AR(p)过程,如果其特征方程的所有特征根都在单位圆内,则序列 t x 平稳,如果 有一个特征根存在且为1,则序列非平稳,且自回归系数之和恰好等于1。证明如下: 1 0 1 0 2 1 1 1 1 1 = + + + = = = p p p p p 因此,对于AR(p)过程我们可以通过检验自回归系数之和是否等于1 来检验序列的平稳 性。作如下假设检验: 1 0 0 2 1 1 0 + + + = = p H H 其中: : :ADF 检验统计量: ) ( S = ,其中 ) ( S 为参数 的样本标准差。 2 、ADF 检验 的三种 类型 第一种:无常数均值、无趋
8、势的p 阶自回归过程: t p t p t t x x x + + + = 1 1第二种:有常数均值、无趋势的p 阶自回归过程: t p t p t t x x x + + + + = 1 1第三种:有常数均值、有线性趋势的p 阶自回归过程: t p t p t t x x t x + + + + + = 1 1 - 6 - 三、例题 用Eviews5.1 来分析1964 年到1999 年中国纱产量的时间序列 年份 纱产量 年份 纱产量 1964 97 1982 335.4 1965 130 1983 327 1966 156.5 1984 321.9 1967 135.2 1985 353.
9、5 1968 137.7 1986 397.8 1969 180.5 1987 436.8 1970 205.2 1988 465.7 1971 190 1989 476.7 1972 188.6 1990 462.6 1973 196.7 1991 460.8 1974 180.3 1992 501.8 1975 210.8 1993 501.5 1976 196 1994 489.5 1977 223 1995 542.3 1978 238.2 1996 512.2 1979 263.5 1997 559.8 1980 292.6 1998 542 1981 317 1999 567 1、
10、建立时间序列文件。 在eviews 中建立工作文件,选择 filenewworkfile,输入1 到40。 点击fileimport,导入excel 文件,并取名为sha。 2、检验原时间序列的平稳性。 平稳序列的时序图应该显示出序列始终围绕一个常数值波动,且波动的范围不大。如果 观察序列的时序图显示出该序列有明显的趋势或周期,那它通常不是平稳序列。 绘制序列sha 的时间序列图: 选中sha 序列, 并点击主菜单QuickGraph 选择其中的折 线图(Line graph)就可作图,如下图3-1: - 7 - 0 100 200 300 400 500 600 5 10 15 20 25
11、30 35 40 SHA3 1 从图可以看出,纱产量呈现波动中上升的趋势,显然不平稳,所以不是一个平稳序列。 这一结论,还可以通过单位根检验(ADF 检验)进一步说明。 点击quickseries statisticsunit root test,输入sha 点击ok,结果如下表3-2: 3 2 从表中看出t 统计量为-0.016384,其 P值比显著性 水平大, 所以要接受原假设, 认 为序列sha 是非平稳序列。 - 8 - 3、对原时间序列进行平稳化处理。 从折线图可以看出原序列可能存在线性增长趋势,所以在eviews 中输入命令:series sha1=d(sha,1),生成一阶差分序
12、列sha1,并绘制该序列的折线图,如下图3-3: -40 -20 0 20 40 60 5 10 15 20 25 30 35 40 SHA13 3 sha1 序列的时间序列图始终围绕一个常数值波动, 因此可以认为该序列是平稳序列。 同 样的,用单位根检验法进行检验得到表3-4,原假设是序列非平稳,该结果显示P值为 0.0001,比显著性 水平小,所以要拒绝原假设,认为sha1 序列是平稳的。 3 4 - 9 - 继续在eviews 中输入命令:series sha2=d(sha,2),即生成二阶差分生序列sha2, 按照同样的方法绘制该序列的折线图并做单位根检验,得到下图3-5 和表3-6:
13、 -100 -50 0 50 100 05 10 15 20 25 30 35 40 SHA23 5 3 6 sha2 的时间序列图也是始终围绕一个常数值波动,而从单位根检验法进行检验的结果, 可以看到P值比显著性 水平小, 仍然拒绝原假设, 认为sha2 序列是也平稳的, 并且比sha1 序列更加平稳。因此用序列sha2 建模更好。 4、绘制序列sha2 的ACF、PACF 序列,初步定阶。 点击quickseries statisticscorrelogram,输入sha2,点击ok,结果如表3-7: - 10 - 3 7 可以看出ACF 和PACF 都是拖尾的, 所以考虑用Pandit-
14、Wu 方法分别建立ARMA (2,1) , ARMA (4,3)模型,从中选出最优的一个。 5、初步建模并估计参数。 点击quickestiminate equation 输入:sha1 ar(1)ar(2)ma(1)得到下表3-8: 3 8 - 11 - 输入sha1 ar(1) ar(2) ar(3)ar(4)ma(1)ma(2)ma(3)得到下表3-7: 3 9 6、模型适应性检验 即检验剩余序列是否为白噪声序列。原假设是剩余序列是相互独立的白噪声序列。分别 在上述两个结果窗口中点击viewresidual correlation LM test,得到以下结果 3- 10 - 12 -
15、3- 11 结果显示F 统计量分别为0.074663 和2.980282,相应的P-值分别为0.928247 和 0.072552,均大于显著性水平 ,所以要接受原假设,认为剩余序列是白噪声序列,两个模 型都通过了检验。 但根据AIC 准则,由表3-8 和3-9 知ARMA(2,1)的AIC=9.202282,ARMA(4,3)的 AIC=9.302502,所以我们选择ARMA(2,1)模型对sha2 序列进行建模。 最终对序列sha2 建立的模型为: 1 2 1 989931 . 0 048617 . 0 236716 . 0 + + = t t t t t a a x x x 还原到原序列sha 的序列的模型为: 1 2 1 989931 . 0 95138 . 0 236716 . 2 + = t t t t t a a x x x 7、预测