1、时间序列分析 西安交通大学经济与金融学院统计系 赵春艳 本课程内容体系: 第一章:平稳时间序列分析导论 第二章:平稳时间序列分析的基础知识 第三章:平稳时间序列模型的建立 第四章:协整理论导论 第五章:单位根过程 第六章:单位根过程的假设检验 第七章:协整理论 参考书目: 1、陆懋祖,高等时间序列经济计量学,上海人民出版社,1999 年版; 2、王振龙主编,时间序列分析,中国统计出版社,2000; 3、王耀东等编,经济时间序列分析,上海财经大学出版社,1996; 4、马薇,协整理论与应用,南开大学出版社,2004; 5、王少平,宏观计量的若干前沿理论与应用,南开大学出版社,2003。 第一章
2、平稳时间序列分析导论 一、时间序列 1、含义:指被观察到的依时间为序排列的数据序列。2、特点: (1)现实的、真实的一组数据,而不是数理统计中做实验得到的。既然是真实的,它就是反映某一现象的统计指标,因而,时间序列背后是某一现象的变化规律。 (2)动态数据。 二、时间序列分析 1、 时间序列分析:是一种根据动态数据揭示系统动态结构和规律的统计方法。其基本思想:根据系统的有限长度的运行记录(观察数据) ,建立能够比较精确地反映序列中所包含的动态依存关系的数学模型,并借以对系统的未来进行预报(王振龙) 2、计量经济学中的建模方法和思想 3、理论依据:尽管影响现象发展的因素无法探求,但其结果之间却存
3、在着一定的联系,可以用相应的模型表示出来,尤其在随机性现象中。 三、确定性时间序列分析与随机性时间序列分析 时间序列依据其特征,有以下几种表现形式,并产生与之相适应的分析方法: (1)长期趋势变化 受某种基本因素的影响,数据依时间变化时表现为一种确定倾向,它按某种规则稳步地增长或下降。 使用的分析方法有:移动平均法、指数平滑法、模型拟和法等; (2)季节性周期变化 受季节更替等因素影响,序列依一固定周期规则性的变化,又称商业循环。 采用的方法:季节指数; (3)循环变化 周期不固定的波动变化。(4)随机性变化 由许多不确定因素引起的序列变化。它所使用的分析方法就是我们要讲的时间序列分析。 确定
4、性变化分析 趋势变化分析 周期变化分析 循环变化分析 时间序列分析 随机性变化分析 AR、MA、ARMA 模型 四、发展历史 1、时间序列分析奠基人: 20 世纪 40 年代分别由 Norbort Wiener 和 Andrei Kolemogoner 独立给出的,他们对发展时间序列的参数模型拟和和推断过程作出了贡献,提供了与此相关的重要文献,促进了时间序列分析在工程领域的应用。 2、时间序列分析在经济领域的应用 20 世纪 70 年代, ins 发表专著时间序列分析:预测和控制 ,使时间序列分析的应用成为可能。 3、现代时间序列分析的发展趋势 (1)单位根检验(2)协整检验 2003 年度诺
5、贝尔经济学奖的获得者是美国经济学家罗伯特.恩格尔和英国经济学家克莱夫.格兰杰。 获奖原因:“今年的获得者发明了处理许多经济时间序列两个关键特性的统计方法:时间变化的变更率和非平稳性。 ”两人是时间序列经济学的奠基人。 时间变化的变更率指方差随时间变化而变化的频率,这主要是指恩格尔在 1982年发表的条件异方差模型(ARCH) ,最初主要用于研究英国的通货膨胀问题,后来广泛用作金融分析的高级工具; 传统的计量经济学研究中,通常假定经济数据和产生这些数据的随机过程是平稳的。格兰杰的贡献主要是在非平稳过程假定下所进行的严格计量模型的建立。 (协整检验) 第二章 平稳时间序列分析的基础知识第一节 随机
6、序列 一、随机过程 1、定义: 在数学上,随机过程被定义为一组随机变量,即, 2、特征 (1)随机过程是随机变量的集合 (2)构成随机过程的随机变量是随时间产生的,在任意时刻,总有随机变量与之相对应。 二、随机序列(时间序列) 1、当 时,即时刻 t 只取整数时,随机过程 可写成 此类随机过程 称为随机序列,也成时间序列。 可见 (1)随机序列是随机过程的一种,是将连续时间的随机过程等间隔采样后得到的序列; (2)随机序列也是随机变量的集合,只是与这些随机变量联系的时间不是连续的、而是离散的。 三、时间序列的分布、均值、协方差 函数 1、分布函数 (1)一维分布函数:随机序列中每个随机变量的分
7、布函数. F1(z) ,F2(z) , Ft-1(z) , Ft(z) (2)二维分布函数:随机序列中任意两个随机变量的联合分布函数 Fi,j(zi,zj).i,j=,-2,-1,0,1,2, (3)柯尔莫哥洛夫定理与有限维概率分布 柯尔莫哥洛夫定理表明,一个随机序列的特征,可以用它的有限维分布表示出来。 2、均值函数 对随机序列中的任一随机变量取期望。 当 t 取遍所有可能整数时,就形成了离散时间的函数 ut 称 ut 为时间序列的均值函数。 3、自协方差函数和自相关函数 自相关函数: 当 t,s 取遍所有可能的整数时,就形成了时间序列的自相关函数,它描述了序列的自相关结构。它的本质等同于相
8、关系数。 第二节 平稳时间序列 一、平稳时间序列 1、定义:时间序列zt是平稳的。如果zt有有穷的二阶中心矩,而且满足: (1)ut= Ezt =c; (2)r(t,s) = E(zt-c)(zs-c) = r(t-s,0) 则称zt是平稳的。 含义: a 有穷二阶矩意味着期望和自协方差存在; b 平稳时间序列任意时刻所对应的随机变量的均值相等; c 自协方差函数只与时间间隔有关,而与时间起点无关。 二、平稳时间序列的均值、自协方差和自相关函数 1、均值函数:平稳时间序列均值为常数,为分析方便,假定 E zt=0,当均值不为零时,给每个值减去均值后再求均值,即等于 0。 2、自协方差函数:平稳
9、时间序列的自协方差仅与时间间隔有关,而与具体时刻无关,所以,自协方差函数仅表明时间间隔即可。 3、自相关函数 k 平稳时间序列自协方差仅与时间隔有关,当间隔为 零时,自协方差应相等: 4、自协方差与自相关函数的性质 (1) rk=r-k k= -k k、k 仅是时间先后顺序上的差异,它们代表的间隔是相同的。 (2) 三、偏自相关函数(PACF) 1、偏自相关函数用来考察扣除 zt 和 zt+k 之间 zt+1 , zt+2, zt+k-1 影响之后的 zt 和 zt+k 之间的相关性。 2、偏自相关函数的定义 设zt为零均值平稳序列, zt+1 , zt+2, zt+k-1 对 zt 和zt+
10、k 的线性估计为: kk 表示偏自相关函数,则: 3、PACF的涵义 设有 zt+1,zt+2 ,zt+3 4、pacf 的推导 四、 随机序列的特征描述 (1)样本均值 (2)样本自协方差函数 (3)样本自相关函数 (4)样本偏自相关函数 例 1、设动态数据 16,12,15,10,9,17,11,16,10,14,求样本均值、样本自相关函数(SACF)和偏自相关函数(SPACF) (各求前三项) 第三节 线性平稳时间序列模型 一、自回归过程(A R (p)) 1、 2、AR(P)模型的 ACF、PACF 特征 以 AR(1)为例 例: 计算结果表明,ACF 逐渐衰减,但不等于零;PACF
11、在 k=1 后,与零接近,是截尾的。 结论:ACF 呈指数衰减,是拖尾的;PACF 在一步后为零,是截尾的。 二、滑动平均模型(MA(q)) 1、形如 zt=at-?1at-1- ?2at-2 - ?qat-q 模型为滑动平均模型, 其中,简化形式 zt=?(B)at ?(B)= 1-?1B- ?2B2 - ?qBq,满足?(B)= 0 的根在单位圆外,即?B? 1,此时该过程是可逆的。 2、MA 模型的 ACF及 PACF (3)PACF 例:用 zt=(1-0.5B)at 模拟产生 250 个观察值,at 为白噪声序列,得到序列自相关和偏自相关函数如下: 可见,ACF 在一步后截尾,PAC
12、F 是拖尾的。 结论:MA(q)的 ACF 是截尾的,PACF 是拖尾的。 三、自回归滑动平均模型(AR M A (p, q)) 1、 2、ARMA(p,q)的 ACF 和 PACF (2)ACF、PACF 均是拖尾的 例:(1-0.9B)zt=(1-0.5B)at 模拟产生 250 个观察值,ACF、PACF 如下表所示: 本节介绍了三类模型的形式、特性及自相关和偏自相关函数的特征,现绘表如下: 第三章 平稳时间序列模型的建立 第一节 模型识别与定阶 一、模型识别 1、含义:对一个观察序列,选择一个与其实际过程相吻合的模型结构。 2、方法:利用序列的 acf、pacf 识别。判断截尾、拖尾的
13、主观性较大,只是初步识别。 二、模型定阶 (一)a c f、p a c f 方法 (1)M A (q): Bartlett 公式:当 k q 时,N 充分大, (2)AR(P): (二)残差方差图: (1)残差:在多元回归 y=a1x1+ a2x2+.+ an x n +at,存在自变量 x 的选择问题。如果 x 选择不够,模型拟合不足,表现为 y 与? 差异较大;若 x 选择多,则过度拟合,y 与?差异减小速度很慢。 将(y- ?)称为残差,多元回归就是利用此确定模型的自变量,即新增或减少变量是否会显著影响残差。 (2)将该思想应用到时间序列模型定阶上。 (3)利用?a2 的变化规律,确定模
14、型阶数。 随着模型阶数的增大,分母减小; 分子在不足拟合时,一直减小,速度较快;过拟合时,分子虽减小,但速度很慢,几乎不变。 ?a2 取决于分子、分母减小的速度。 在不足拟合时, ?a2 一直减小;过拟合时,?a2 却增大。 选择?a2 的最低点为模型的最优阶数。 (三)F 检验定阶法: (1)F 分布: (2)用 F 分布检验两个回归模型是否有显著差异。(3)对于 ARMA(p,q)模型定阶 例如:在 ARMA(p,q)和 ARMA(p-1,q-1)选择。 例:每隔 20 分钟进行一次观察的造纸过程入口开关调节器的观察值(第 241 页,18) 1、series Mean S.D Max Min z 32.02 0.74 34 30.7 令 z1=z