1、河南财经政法大学应用时间序列分析实验手册应用时间序列分析实验手册2目 录目 录 2第一章 Eviews 的基本操作 3第二章 时间序列的预处理 .6一、平稳性检验 .6二、纯随机性检验 13第三章 平稳时间序列建模实验教程 14一、模型识别 14二、模型参数估计 18三、模型的显著性检验 21四、模型优化 23第四章 非平稳时间序列的确定性分析 24一、趋势分析 24二、季节效应分析 39三、综合分析 44第五章 非平稳序列的随机分析 50一、差分法提取确定性信息 50二、ARIMA 模型 63三、季节模型 683第一章 Eviews 的基本操作The Workfile(工作簿) Workfi
2、le 就像你的一个桌面,上面放有许多 Objects,在使用 Eviews 时首先应该打开该桌面,如果想永久保留 Workfile 及其中的内容,关机时必须将该Workfile 存到硬盘或软盘上,否则会丢失。 (一) 、创建一个新的 Workfile 打开 Eviews 后,点击 file/new/workfile,弹出一个 workfile range 对话框(图 1) 。图 1该对话框是定义 workfile 的频率,该频率规定了 workfile 中包含的所有objects 频率。也就是说,如果 workfile 的频率是年度数据,则其中的 objects 也是年度数据,而且 objec
3、ts 数据范围小于等于 workfile 的范围。 例如我们选择年度数据(Annual) ,在起始日(Start date) 、终止日(End date)分别键入 1970、1998 ,然后点击 OK,一个新的 workfile 就建立了(图2) 。4图2在workfile 窗口顶部,有一些主要的工具按钮,使用这些按钮可以存储workfile、改变 样本范围、存取object、生成新的变量等操作,稍后我们会详细介绍这些按钮的功能。 在新建的 workfile 中已经存在两个 objects,即 c 和 residual。c 是系数向量、residual 是残差序列,当估计完一个模型后,该模型的
4、系数、残差就分别保存在c 和 residual 中。workfile窗口中主要按钮的功能: 1.PROCS(处理): Procs按钮包含sample (样本)、change workfile range(改变工作簿范围)、generate series(生成序列)、sort series(对序列排序)、import (导入数据)、export(导出数据)六个功能,其中sample 和generate 已出现在workfile窗口顶部。sample(样本)的功能是改变样本的范围,但不能超过工作簿范围(workfile range)。如果样本范围需要超过工作簿范围,先修改工作簿范围,然后再改变样本
5、范围。 例如点击proc/sample/OK,弹出一个对话框(图3),在上面空白处键入新的样本范围1980至1990,注意中间要空格,点击 OK,这样样本范围改变了。 5图3change workfile range(改变工作簿范围)功能是改变当前 workfile的范围,其操作与样本范围的改变相似。一般是在模型建好后,外推预测时需要改变样本或工作薄范围。generate series功能是在现有变量的基础上,生成新的变量。如点击proc /generate/OK或直接点击窗口顶部的 GENR,弹出一个对话框。sort series 功能是对序列排序。Import 功能是从其他软件中(如 EX
6、CEL)导入数据。 Export功能与Import 相反,是将Eviews 数据输出到其他软件中,具体操作与Import相似。2、OBJECTS(对象):该按钮功能主要是对Objects进行操作,包括新建、存取、删除、重新命名、复制等。点击Objects,出现下拉菜单,菜单中包含很多功能,其中一些功能以按钮形式出现在workfile窗口顶部,如 fetch(取出)、store(存储)、delete(删除)。3、SAVE(保存 ):功能是将当前workfile保存在硬盘或软盘。如果是新建的workfile ,会弹出一个对话框,需要指明存放的位置及文件名。如果是原有的workfile,不会出现对话
7、框,点击SAVE,作用是随时保存该workfile。建议在使用Eviews 时,应经常点击 SAVE按钮,避免电脑出现故障,而丢失未能保存的内容。这里需要提醒的是,SAVE按钮与STORE按钮的区别。SAVE按钮保存的是整个workfile ,而STORE存储的是个别 Object。(二)、打开已经存在的workfile双击Eviews图标,进入 Eviews主画面。点击File/New/Workfile/click ,弹出对话框,给出要打开的workfile 所在路径及文件名,点击 OK,则所需的workfile就被打开。(三)、workfile频率的设定各种频率的输入方法如下:1、Annu
8、al:直接输入年份,如1998;若是20世纪内,则可只输入年份的后两个字,如98表示1998年。2、Semi-Annual:格式与Annual 一样。3、Quarterly :年份全称或后两个字接冒号(或空格),再接季度,如1992:1(或1992 1),表示1992年第一季度。4、Monthly:年份全称或后面两个字接冒号(或空格),再接月度序号,如1990:1(或1990 1)。5、Daily:格式为“月度序号:日期:年份”,如9:2:2002表示2002年9月2日。6、Weekly:格式与Daily相似,也是“月度序号:日期:年份”,但这里的日期是某个星期的某一天,当给定起始日时,系统会
9、自动推算终止日期。6第二章 时间序列的预处理一、平稳性检验时序图检验和自相关图检验(一)时序图检验 根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及周期特征。例 2.1检验 1949 年1998 年北京市每年最高气温的平稳性1.在 Eviews 软件中打开案例数据7图 1:打开外来数据8图 2:打开数据文件夹中案例数据文件夹中数据文件中序列的名称可以在打开的时候输入,或者在打开的数据中输入图 3:打开过程中给序列命名9图 4:打开数据2.绘制时序图可以如下图所示选择序列然后点 Quick 选择 Scatter
10、 或者 XYline;绘制好后可以双击图片对其进行修饰,如颜色、线条、点等图 1:绘制散点图10图 2:年份和气温的散点图334353637383940415056065707580859095QW图 3:年份和气温的散点图(二)自相关图检验11例 2.2导入数据,方式同上;在 Quick 菜单下选择自相关图,对 QW 原列进行分析;可以看出自相关系数始终在零周围波动,判定该序列为平稳时间序列。图 1:序列的相关分析图 2:输入序列名称图 3:选择相关分析的对象12图 4:序列的相关分析结果:1. 可以看出自相关系数始终在零周围波动,判定该序列为平稳时间序列 2.看 Q 统计量的 P 值:该统
11、计量的原假设为 X 的 1 期,2 期k 期的自相关系数均等于 0,备择假设为自相关系数中至少有一个不等于 0,因此如图知,该 P 值都5%的显著性水平,所以接受原假设,即序列是纯随机序列,即白噪声序列(因为序列值之间彼此之间没有任何关联,所以说过去的行为对将来的发展没有丝毫影响,因此为纯随机序列,即白噪声序列。) 有的题目平稳性描述可以模仿书本 33 页最后一段。(三)平稳性检验还可以用:单位根检验:ADF,PP 检验等;非参数检验:游程检验13图 1:序列的单位根检验图 2:单位根检验的方法选择14图 3:ADF 检验的结果:如图,单位根统计量 ADF= -8.294675 小于 EVIE
12、WS 给出的显著性水平 1%-10%的 ADF 临界值,所以不接受原假设,该序列是平稳的。二、纯随机性检验计算 Q 统计量,根据其取值判定是否为纯随机序列。例 2.2 的自相关图中有 Q 统计量,其 P 值在 K=6、12 的时候均比较大,不能拒绝原假设,认为该序列是白噪声序列。另外,小样本情况下,LB 统计量检验纯随机性更准确。15第三章 平稳时间序列建模实验教程一、模型识别1.打开数据(某地区连续 74 年的谷物产量(单位:千吨) )图 1:打开数据2.绘制趋势图并大致判断序列的特征图 2:绘制序列散点图16图 3:输入散点图的变量图 4:序列的散点图173.绘制自相关和偏自相关图图 1:
13、在数据窗口下选择相关分析图 2:选择变量图 3:选择对象18图 4:序列相关图4.根据自相关图和偏自相关图的性质确定模型类型和阶数如果样本(偏) 自相关系数在最初的 d 阶明显大于两倍标准差范围,而后几乎 95的自相关系数都落在 2 倍标准差的范围以内,而且通常由非零自相关系数衰减为小值波动的过程非常突然。这时,通常视为( 偏) 自相关系数截尾。截尾阶数为 d。本例: 自相关图显示延迟 6 阶之后,自相关系数全部衰减到 2 倍标准差范围内波动,这表明序列明显地短期相关。但序列由显著非零的相关系数衰减为小值波动的过程相当连续,相当缓慢,该自相关系数可视为不截尾 偏自相关图显示除了延迟 1 阶的偏
14、自相关系数显著大于 2 倍标准差之外,其它的偏自相关系数都在 2 倍标准差范围内作小值随机波动,而且由非零相关系数衰减为小值波动的过程非常突然,所以该偏自相关系数可视为一阶截尾 所以可以考虑拟合模型为 AR(1)自相关系数 偏相关系数 模型定阶拖尾 P 阶截尾 AR(p)模型q 阶截尾 拖尾 MA(q)模型拖尾 拖尾 ARMA(p,q)模型具体判别什么模型看书 58 到 62 页的图例。19。 。 )1(MA)(ar B*)P(ARB*)2(RqMAR*)(M)()(11ttX t2t tPtX二、模型参数估计根据相关图模型确定为 AR(1),建立模型估计参数在 ESTIMATE 中按顺序输入
15、变量 x c x(-1)或者 x c AR(1) 选择 LS 参数估计方法,查看输出结果,看参数显著性,该例中两个参数都显著。细心的同学可能发现两个模型的 c 取值不同,这是因为前一个模型的 c 为截距项;后者的 c 则为序列期望值,两个常数的含义不同。图 1:建立模型20图 2:输入模型中变量,选择参数估计方法图 3:参数估计结果21图 4:建立模型图 5:输入模型中变量,选择参数估计方法22图 6:参数估计结果 t372564.01845.0txBAR模 型 :三、模型的显著性检验检验内容:整个模型对信息的提取是否充分;参数的显著性检验,模型结构是否最简。23图 1:模型残差24图 2:残
16、差的平稳性和纯随机性检验对残差序列进行白噪声检验,可以看出 ACF 和 PACF 都没有显著异于零,Q 统计量的 P 值都远远大于 0.05,因此可以认为残差序列为白噪声序列,模型信息提取比较充分。常数和滞后一阶参数的 P 值都很小,参数显著;因此整个模型比较精简,模型较优。四、模型优化当一个拟合模型通过了检验,说明在一定的置信水平下,该模型能有效地拟合观察值序列的波动,但这种有效模型并不是唯一的。当几个模型都是模型有效参数显著的,此时需要选择一个更好的模型,即进行优化。优化的目的,选择相对最优模型。优化准则:最小信息量准则(An Information Criterion) 指导思想 似然函
17、数值越大越好 未知参数的个数越少越好 AIC 准则的缺陷在样本容量趋于无穷大时,由 AIC 准则选择的模型不收敛于真实模型,它通常比真实模型所含的未知参数个数要多 但是本例中滞后二阶的参数不显著,不符合精简原则,不必进行深入判断。)(2)ln未 知 参 数 个 数AICl未 知 参 数SB25第四章 非平稳时间序列的确定性分析第三章介绍了平稳时间序列的分析方法,但是自然界中绝大多数序列都是非平稳的,因而对非平稳时间序列的分析跟普遍跟重要,人们创造的分析方法也更多。这些方法分为确定性时序分析和随机时序分析两大类,本章主要介绍确定性时序分析方法。一个序列在任意时刻的值能够被精确确定(或被预测) ,
18、则该序列为确定性序列,如正弦序列、周期脉冲序列等。而某序列在某时刻的取值是随机的,不能给以精确预测,只知道取某一数值的概率,如白噪声序列等。Cramer 分解定理说明每个序列都可以分成一个确定序列加一个随机序列,平稳序列的两个构成序列均平稳,非平稳时间序列则至少有一部分不平稳。本章先分析确定性序列不平稳的非平稳时间时间序列的分析方法。确定性序列不平稳通常显示出非常明显的规律性,如显著趋势或者固定变化周期,这种规律性信息比较容易提取,因而传统时间序列分析的重点在确定性信息的提取上。常用的确定性分析方法为因素分解。分析目的为:克服其他因素的影响,单纯测度某一个确定性因素的影响;推断出各种因素彼此之
19、间作用关系及它们对序列的综合影响。一、趋势分析绘制序列的线图,观测序列的特征,如果有明显的长期趋势,我们就要测度其长期趋势,测度方法有:趋势拟合法、平滑法。(一) 趋势拟合法1. 线性趋势拟合例 4.1:以 1964-1999 年中国纱年产量数据为例进行分析。26图 1:导入数据图 2:绘制线图,序列有明显的上升趋势长期趋势具备线性上升的趋势,所以进行序列对时间的线性回归分析。27图 3:序列销售额(y)对时间(t)进行线性回归分析图 4:回归参数估计和回归效果评价可以看出回归参数显著,模型显著,回归效果良好,序列具有明显线性趋势。图 5:运用模型进行预测28图 6:预测效果(偏差率、方差率等)图 7:绘制原序列和预测序列的线图29图 8:原序列和预测序列的线图图 9:残差序列的曲线图30可以看出残差序列具有平稳时间序列的特征,我们可以进一步检验剔除了长期趋势后的残差序列的平稳性,第三章知识这里不在叙述。2.曲线趋势拟合例 4.2:对爱荷华州 1948-1979 年非农产品季度收入数据为例进行拟合。图 1:导入数据图 2:绘制曲线图