1、时间序列分析及其SPSS操作,教师:韩艳敏 电话:13676798448(668448),一、 时间序列分析概述,时间序列是按时间顺序排列的、随时间变化且相互关联的数据序列。分析时间序列的方法构成数据分析的一个重要领域,即时间序列分析.,时间序列根据所研究的依据不同,可有不同的分类1按研究对象多少分: 一元时间序列和多元时间序列; 2按时间连续性分:离散时间序列和连续时间序列;,3按序列的统计特性分:平稳时间序列和非平稳时间序列; 4按时间序列分布规律分:高斯型和非高斯型时间序列.,时间序列,时间序列分析发展的两个阶段,主要内容: 平稳时间序列分析Box-Jenkins (1976) 非平稳时
2、间序列分析Engle-Granger(1987) 时间序列模型不同于经济计量模型的两个特点是: - 这种建模方法不以经济理论为依据,而是依据变量自身的变化规律,利用外推机制描述时间序列的变化。 - 明确考虑时间序列的平稳性。如果时间序列非平稳,建立模型之前应先通过差分或者协整把它变换成平稳的时间序列,再考虑建模问题。,2,如果一个时间序列的概率分布与时间 t 无关,则称该序列为严格的(狭义的)平稳时间序列。,如果序列的一、二阶矩存在,且对任意时刻 t 满足:(1)均值为常数(2)方差为常数(3)协方差为时间间隔k的函数,则称该序列为宽平稳时间序列,也叫广义平稳时间序列。以后所研究的时间序列主要
3、是宽平稳时间序列.,平稳时间序列,平稳过程例1i.i.d序列,一个最简单的随机时间序列是独立同分布标准正态分布序列:,平稳过程例2自回归过程,AR(1),3,1 确定性时间序列分析方法概述,时间序列预测技术就是通过对预测目标自身时间序列的处理,来研究其变化趋势的。一个时间序列往往是以下几类变化形式的叠加或耦合。,(1)长期趋势变动。是指时间序列朝着一定的方向持续上升或下降,或停留在某一水平上的倾向,它反映了客观事物的主要变化趋势。(2)季节变动。,(3)循环变动。通常是指周期为一年以上,由非季节因素引起的涨落起伏波形相似的波动。,(4)不规则变动。通常它分为突然变动和随机变动。,时间序列数据的
4、分解,通常用 Tt 表示长期趋势项,St 表示季节变动趋势项,Ct 表示循环变动趋势项,Rt 表示随机干扰项。常见的确定性时 间序列模型有以下几种类型:,加法模型乘法模型混合模型,yt = Tt + St + Ct + Rtyt = Tt St Ct Rtyt = Tt St + Rt , yt = St + Tt Ct Rt,t,其中 yt 是观测目标的观测记录,E ( R t ) = 0 , E ( R 2 ) = 2如果在预测时间范围以内,无突然变动且随机变动的方差2较小,并且有理由认为过去和现在的演变趋势将继续发展到未来时,可用一些经验方法进行预测,具体方法如下:4,5,设观测序列为y
5、1,yT,取移动平均的项数 NT一次移动平均值计算公式,1. 移动平均法,6,当预测目标的基本趋势是在某一水平上下波动时,可用一次移动平均方法建立预测模型:,二次移动平均,其预测标准误差为,7,最近N期序列值的平均值作为未来各期的预测结果。一般N取值范围:5N200。当历史序列的基本趋势变化不大且序列中随机变动成分较多时,N的取值应较大一些。否则N的取值应小一些。在有确定的季节变动周期的资料中,移动平均的项数应取周期长度。选择最佳N值的一个有效方法是,比较若干模型的预测误差。均方预测误差最小者为好.当预测目标的基本趋势与某一线性模型相吻合时,常用二次移动平均法,但序列同时存在线性趋势与周期波动
6、时,可用趋势移动平均法建立预测模型:y T + m = a T + b T m , m = 1 , 2 ,其中,),(1) T,(2) T,(1) T,(2) T,(M,a T = 2M, M, bT =, M,2 N 1,例1 某企业1月11月份的销售收入时间序列如下表所示。取N=4,试用简单一次滑动平均法预测第12月份的销售收入,并计算预测的标准误差.,Matlab程序y=533.8 574.6 606.9 649.8 705.1 772.0 816.4 892.7 963.9 1015.1 1102.7; temp=cumsum(y);% 求累积和 mt=(temp(4:11)-0 te
7、mp(1:7)/4; y12=mt(end) ythat=mt(1:end-1); fangcha=mean(y(5:11)-ythat).2); sigma=sqrt(fangcha),结果temp =1.0e+003 *0.5338 1.1084 1.7153 2.3651 3.0702 3.8422,4.6586 5.5513 6.5152 7.5303,8.6330,mt = 591.2750 634.1000 683.4500 735.8250 796.5500861.2500 922.0250 993.6000y12 = 993.6000ythat = 591.2750 634.1
8、000 683.4500 735.8250 796.5500861.2500 922.0250fangcha = 2.2654e+004sigma = 150.512110,11,2. 指数平滑法,一次移动平均实际上认为最近N期数据对未来值影响相同,都加权1/N;而N期以前的数据对未来值没有影响,加权为0。但二次及更高次移动平均数的权数却不是1/N,且次数越高,权数的结构越复杂,但永远保持对称的权数,即两端项权数小,中间项权数大,不符合一般系统的动态性。一般说来历史数据对未来值的影响是随时间间隔的增长而递减的。所以更切合实际的方法应是对各期观测值依时间顺序进行加权平均作为预测值。指数平滑法可满
9、足这一要求,而且具有简单的递推形式. 指数平滑的基本公式, ,(1 ),(1 )2 ,设观测序列为y1,yT,为加权系数,01,一次指数 平滑公式为:,假定历史序列无限长,则有,由于加权系数序列呈指数函数衰减,加权平均又能消除或减弱随机干扰的影响,所以称为一次指数平滑. 一次指数平滑预测:12,表明St(1)是全部历史数据的加权平均,加权系数分别为,一次指数平滑,13,类似地有,二次指数平滑公式三次指数平滑公式,P 次指数平滑公式,利用指数平滑公式可以建立指数平滑预测模型。原则上说,不管序列的基本趋势多么复杂,总可以利用高次指数平滑公式建立一个逼近很好的模型,但计算量很大。因此用的较多的是几个
10、低阶指数平滑预测模型。,1) 一次指数平滑预测,2) 二次指数平滑预测:(适用线性趋势数列)Brown单系数线性平滑预测,指数平滑预测,3) 三次指数平滑预测:(适用于二次曲线趋势数列)Brown单系数二次式平滑预测,由于指数平滑公式是递推计算公式,必须确定初始值,可以取前35个数据的算术平均值作为初始值。.,16,指数平滑预测模型以时刻 t 为起点,综合历史序列信息,对未来进行预测。,选择合适的加权系数是提高预测精度的关键环节。据经验,的取值范围一般以0.10.3为宜。,值愈大,加权系数序列衰减速度愈快,所以取值大小起着控制参加平均的历史数据个数的作用。值愈大意味着采用的数据愈少。因此可得到
11、选择值的一些基本准则。,(1)如果序列的基本趋势比较稳,预测偏差由随机因素造成,则值应取小一些,以减少修正幅度,使预测模型能包含更多历史数据的信息。(2)如果预测目标的基本趋势已发生系统地变化,则值应取得大一些。这样,可以偏重新数据的信息对原模型进行大幅度修正,以使预测模型适应预测目标的新变化.,例2 下表数据是某股票在8个连续交易日的收盘价,试用一次指数平滑法预测第9个交易日的收盘价(初始值S0(1)=y1,=0.4),19,Matlab 程序alpha=0.4;y=16.41 17.62 16.15 15.54 17.24 16.83 18.14 17.05;s1(1)=y(1);for
12、i=2:8s1(i)=alpha*y(i)+(1-alpha)*s1(i-1);endyhat9=s1(end)sigma=sqrt(mean(s1(1:end-1)-y(2:end).2)运行结果,s1 =16.4100,yhat9 = 17.1828,sigma = 0.9613,Matlab 程序clc,clearalpha=0.4;y=16.41 17.62 16.15 15.54 17.24 16.83 18.14 17.05;s1(1)=y(1);for i=2:8s1(i)=alpha*y(i)+(1-alpha)*s1(i-1);ends2=y(1);for i=2:8s2(i
13、)=alpha*s1(i)+(1-alpha)*s2(i-1);enda8=2*s1(8)-s2(8)b8=alpha/(1-alpha)*(s1(8)-s2(8)yhat9=a8+b8yhat(1)=y(1)for i=2:8yhat(i)=s1(i-1)+1/(1-alpha)*(s1(i-1)-s2(i-1);endtemp=sum(yhat-y).2);sigma=sqrt(temp/6),运行结果:a8 =17.3801b8 = 0.1315yhat9 =17.5116yhat =16.4100sigma =1.2054预测结果不如一次指数平滑法预测的预测结果。21,46,二、平稳时
14、间序列模型,这里的平稳是指宽平稳,其特性是序列的统计特性不随 时间平移而变化,即均值和协方差不随时间的平移而变化。主要有下面几种模型:1. 自回归模型(Auto Regressive Model),简称AR模型2. 移动平均模型(Moving Average Model),简称MA模型3. 自回归移动平均模型(Auto RegressiveMoving Average Model)简称ARMA模型,假设时间序列 Xt 仅与 Xt-1,Xt-2,Xt-n有线性关系,而在Xt-1,Xt-2,Xt-n已知条件下,Xt与Xt-j ( j = n+1,n+2,)无关,t 是一个独立于Xt-1,Xt-2,
15、Xt-n的白噪声序列,,可见AR(n)系统的响应 Xt 具有n阶动态性。AR(n)模型 通过把 Xt 中的依赖于Xt-1,Xt-2,Xt-n 的部分消除掉后,使 得具有 n 阶动态性的序列 Xt 转化为独立的序列 t。因此拟 合AR(n)模型的过程也就是使相关序列独立化的过程.,(1)一般自回归模型AR(n),48,如果一个系统在 t 时刻的响应 Xt,与其以前时刻 t-1,t-2,的响应 Xt-1 ,Xt-2,无关,而与其以前时刻 t-1,t-2,t-m 进入系统的扰动 t-1 ,t-2,t-m 存在着一定的相关关系,那么这一类系统为MA(m)系统.,(2)移动平均模型MA(m),如:MA(
16、1)模型:Yt=0.1+t0.3 t1,其中t是白噪声过程,49,一个系统,如果它在时刻 t 的响应 Xt,不仅与其以前时刻的自身值有关,而且还与其以前时刻进入系统的扰动存在一定的依存关系,那么,这个系统就是自回归移动平均系统.ARMA(n, m)模型:,对于平稳系统来说,由于AR、MA、ARMA(n,m)模型都是ARMA(n,n-1)模型的特例,我们以ARMA(n,n-1),模型为一般形式来建立时序模型.,(3)自回归移动平均模型,MA过程,例下面是一个MA(2)模型,计算它的自相关函数,并画图 t=t +0.2t10.1t2 1(121)/(11222)(0.2+0.2*0.1)/(1+0
17、.12+0.22)=0.2 2(2)/(11222)0.1/(1+0.12+0.22)=0.095,ARMA的模型设定与识别,ACF图(识别阶数q),基本结论 MA(q)过程的自相关函数q步截尾,根据自相关函数与偏自相关函数定阶,根据样本自相关函数和样本偏相关函数定阶 一般要求样本长度大于50,才能有一定的精确程度 自相关函数和样本偏相关函数定阶的准则MA(q) AR(p) ARMA(p,q) 自相关函数 q步截尾 拖尾 拖尾 偏相关函数 拖尾 p步截尾 拖尾,ARMA的模型设定与识别,ARIMA(p,d,q)过程和模型,随机过程不平稳:从图形看不重复穿越一条水平线,样本自相关函数收敛速度慢。
18、 差分以后是一个ARMA过程 注意不要过度差分 d表示差分的次数,ARMA的模型设定与识别,MA(1) Yt t 0.5 t1,ARMA的模型设定与识别,MA(q) AR(p) ARMA(p,q) 自相关函数 q步截尾 拖尾 拖尾 偏相关函数 拖尾 p步截尾 拖尾,AR(1) Yt=0.6Yt-1+t,ARMA的模型设定与识别,MA(q) AR(p) ARMA(p,q) 自相关函数 q步截尾 拖尾 拖尾 偏相关函数 拖尾 p步截尾 拖尾,ARMA(1,1) Yt=-0.7Yt-1+t - 0.7 t-1,三、 ARMA的模型设定与识别,ARMA模型的其他识别方法,采用ACF和PACF定阶 AI
19、C或者BIC准则选择,越小越好 一般到特殊,最后显著法(Last significant) Remark:在高频时间序列中(日内数据),条件均值模型可能是MA(1)模型,ARMA的模型设定与识别,ARMA模型的其他识别方法,ACF和PACF定阶 -对纯粹的AR模型或者MA模型可以定阶 -可以判别某个过程为ARMA过程,但不能定阶 -由于估计误差的存在,很难判断拖尾和截尾,这种方法在实际应用中存在缺陷 AIC或者BIC准则选择,越小越好-特别适用于ARMA模型,当然也适用于AR模型或者MA模型 一般到特殊,最后显著法(Last significant) -选择一个高阶的AR模型,逐渐递减,直到最
20、后一个变量显著,这与AR模型PACF定阶异曲同工.,ARMA的模型设定与识别,ARMA模型的估计,AR模型采用OLS法估计 AR模型可采用自相关函数的直接估计 MA模型采用最大似然法估计 ARMA模型采用最大似然法估计,四、ARMA的模型估计与检验,建模步骤,平稳化,采用差分的方法得到平稳的序列 定阶,确定p,q的大小 估计,估计未知参数 检验,检验残差是否是白噪声过程 预测,最后利用模型预测,ARMA模型的建模步骤,三、非平稳时间序列模型,三、非平稳时间序列模型,本章结构,差分运算 ARIMA模型方差齐性变化,主要内容:,实际上我们经常会遇到一些非平稳时间序列,往往会呈现明显的趋势性或周期性
21、,可以通过适当差分等手段,将它化为平稳时间序列,在采用用ARMA(n,m)模型建模。,1. 差分运算,差分方法是一种非常简便、有效的确定性信息提取方法 Cramer分解定理在理论上保证了适当阶数的差分一定可以充分提取确定性信息 差分运算的实质是使用自回归的方式提取确定性信息一阶差分:二阶差分:d阶差分:,差分方式的选择,序列蕴含着显著的线性趋势,一阶差分就可以实现趋势平稳 序列蕴含着曲线趋势,通常低阶(二阶或三阶)差分就可以提取出曲线趋势的影响 对于蕴含着固定周期的序列进行步长为周期长度s的差分运算(季节差分),通常可以较好地提取周期信息,如:季节差分:D阶季节差分:,例5.1,【例1.1】1
22、964年1999年中国纱年产量序列蕴含着一个近似线性的递增趋势。对该序列进行一阶差分运算考察差分运算对该序列线性趋势信息的提取作用,差分前后时序图,原序列时序图,差分后序列时序图,例5.2,尝试提取1950年1999年北京市民用车辆拥有量序列的确定性信息,差分后序列时序图,一阶差分,二阶差分,例5.3,差分运算提取1962年1月1975年12月平均每头奶牛的月产奶量序列中的确定性信息,差分后序列时序图,一阶差分,1阶12步差分,过差分,足够多次的差分运算可以充分地提取原序列中的非平稳确定性信息 但过度的差分会造成有用信息的浪费,2. ARIMA模型,ARIMA模型结构 ARIMA模型性质 AR
23、IMA模型建模 ARIMA模型预测,ARIMA模型结构,使用场合 差分平稳序列拟合 模型结构,ARIMA 模型族,d=0 ARIMA(p,d,q)=ARMA(p,q) P=0 ARIMA(P,d,q)=IMA(d,q) q=0 ARIMA(P,d,q)=ARI(p,d),预测值,等价形式计算预测值,SPSS时间序列分析的特点 SPSS的时间序列分析没有自成一体的单独模块,而是分散在Data、Transform、Analyze、Graph四个功能菜单当中。在Data和Transform中实现对时间序列数据的定义和必要处理,以适应各种分析方法的要求;在Analyze的Time Series中主要提
24、供了四种时间序列的分析方法,包括指数平滑法、自回归法、ARIMA模型和季节调整方法;在Graph中提供了时间序列分析的图形工具,包括序列图(Sequence)、自相关函数和偏自相关函数图等,SPSS16.0将时间序列的图形工具放在Analyze-time series中。另外,也可利用SPSS的谱分析图等模块进行简单的谱分析。,四、时间序列的SPSS操作,1. 数据准备,SPSS的数据准备包括数据文件的建立、时间定义和数据期间的指定。其中数据文件的建立与一般SPSS数据文件的建立方法相同,每一个变量将对应一个时间序列数据,且不必建立标志时间的变量。具体操作这里不再赘述,仅重点讨论时间定义的操作
25、步骤。SPSS的时间定义功能用来将数据编辑窗口中的一个或多个变量指定为时间序列变量,并给它们赋予相应的时间标志,具体操作步骤是:(1)选择菜单:DateDefine Dates,出现窗口:,(2)Cases Are框提供了多种时间形式,可根据数据的实际情况选择与其匹配的时间格式和参数。至此,完成了SPSS的时间定义操作。SPSS将在当前数据编辑窗口中自动生成标志时间的变量。同时,在输出窗口中将输出一个简要的日志,说明时间标志变量及其格式和包含的周期等。数据期间的选取可通过SPSS的样本选取(Select Cases)功能实现。,时间序列的图形化观察及检验,时间序列的图形化及检验目的 通过图形化
26、观察和检验能够把握时间序列的诸多特征,如时间序列的发展趋势是上升还是下降,还是没有规律的上下波动;时间序列的变化的周期性特点;时间序列波动幅度的变化规律;时间序列中是否存在异常点,时间序列不同时间点上数据的关系等。,时间序列的图形化观察工具 序列图(Sequence)一个平稳的时间序列在水平方向平稳发展,在垂直方向的波动性保持稳定,非平稳性的表现形式多种多样,主要特征有:趋势性、异方差性、波动性、周期性、季节性、以及这些特征的交错混杂等。序列图还可用于对序列异常值的探索,以及体现序列的“簇集性”,异常值是那些由于外界因素的干扰而导致的与序列的正常数值范围偏差巨大的数据点。“簇集性”是指数据在一
27、段时间内具有相似的水平。在不同的水平间跳跃性变化,而非平缓性变化。,直方图(Histogram)直方图是体现序列数据分布特征的一种图形,通过直方图可以了解序列的平稳性、正态性等特征。 自相关函数图和偏自相关函数图(ACFPACF)所谓自相关是指序列与其自身经过某些阶数滞后形成的序列之间存在某种程度的相关性。对自相关的测度往往采用自协方差函数和自相关函数。偏自相关函数是在其他序列给定情况下的两序列条件相关性的度量函数。自相关函数图和偏自相关函数图将时间序列各阶滞后的自相关和偏自相关函数值以及在一定置信水平下的置信区间直观的展现出来。各种时间序列的自相关函数图和偏自相关函数图通常有一定的特征和规律
28、:1、白噪声序列的各阶自相关函数和偏自相关函数值在理论上均为0。但实际当中序列多少会有一些相关性,但一般会落在置信区间内,同时没有明显的变化规律。2、具有趋势性的非平稳时间序列,序列的各阶自相关函数值显著不为零,同时随着阶数的增大,函数值呈缓慢下降的趋势;偏自相关函数值则呈明显的下降趋势,很快落入置信区间。,3、异方差的非平稳时间序列,其各阶自相关函数显著不为零,且呈现出正负交错,缓慢下降的趋势;偏自相关函数值也呈正负交错的形式,且下降趋势明显。4、具有周期性的非平稳时间序列,其自相关函数呈明显的周期性波动,且以周期长度及其整数倍数为阶数的自相关和偏自相关函数值均显著不为零。5、非周期的波动性
29、时间序列,自相关函数值会在一定的阶数之后较快的趋于零,而偏自相关函数则会很快的落入到置信区间内。 互相关图对两个互相对应的时间序列进行相关性分析的实用图形工具。互相关图是依据互相关函数绘制出来的。是不同时间序列间不同时期滞后序列的相关性。,时间序列的检验方法 参数检验法参数检验的基本思路是,将序列分成若干子序列,并分别计算子序列的均值、方差、相关函数。根据平稳性假设,当子序列中数据足够多时,各统计量在不同序列之间不应有显著差异。如果差值大于检验值,则认为序列具有非平稳性。,时间序列的图形化观察和检验的基本操作 1 绘制序列图的基本操作 (1)选择菜单GraphSequence。,(2)将需绘图
30、的序列变量选入Variables框中。 (3)在Time Axis Labels框中指定横轴(时间轴)标志变量。该标志变量默认的是日期型变量。 (4)在Transform框中指定对变量进行怎样的变化处理。其中Natural log transform表示对数据取自然对数,Difference表示对数据进行n阶(默认1阶)差分,Seasonally difference表示对数据进行季节差分。 (5)单击Time Lines 按钮定义序列图中需要特别标注的时间点,给出了无标注(No reference Lines)、在某变量变化时标注(Line at each change of)、在某个日期标
31、注(Line at date)三项供选择。 (6)单击Format 按钮定义图形的格式,可选择横向或纵向序列图;对于单变量序列图,可选择绘制线图或面积图,还可选择在图中绘制序列的均值线;对多变量的序列图,可选择将不同变量在同一时间点上的点用直线连接起来。,2绘制自相关函数图和偏自相关函数图的基本操作 (1)选择菜单GraphTimeSeriesAutocorrelations。,(2)将需绘制的序列变量选入Variables框。 (3)在Display框选择绘制哪种图形,其中Autocorrelations表示绘制自相关函数图;Partial autocorrelations表示绘制偏自相关函
32、数图。一般可同时绘制两种图形。 (4)单击Options按钮定义相关参数,其中Maximum Number of Lags表示相关函数值包含的最大滞后期,即时间间隔h。一般情况下可选择两个最大周期以上的数据。在Standard Error Method框中指定计算相关系数标准差的方法,它将影响到相关函数图形中的置信区间。其中Independence model表示假设序列是白噪声的过程;Bartletts approximation表示,根据Bartlett给出的估计自相关系数和偏自相关系数方差的近似式计算方差。该方法适合当序列是一个k-1阶的移动平均过程,且标准差随阶数的增大而增大的情况。
33、(5)选中Display autocorrelation at periodic lags表示只显示时间序列周期整数倍处的相关函数值。一般如果只考虑序列中的周期因素可选中该项。否则该步可略去。,3 绘制互相关图的基本操作 (1)选择菜单GraphTime SeriesCross correlations。 (2)把需绘图的序列变量选择到Variables框中。绘制互相关图时要求两个序列均具有平稳性。,时间序列的预处理,1 时间序列预处理的目的和主要方法 预处理的目的可大致归纳为两个方面:第一,使序列的特征体现得更加明显,利于分析模型的选择;第二,使数据满足于某些特定模型的要求。序列的预处理主要
34、包括以下几个方面: 序列缺失数据的处理 序列数据的变换处理主要包括序列的平稳化处理和序列的平滑处理等。均值平稳化一般采用差分(Difference)处理,方差平稳化一般用Box-Cox变换处理,如取对数、平方根等,差分不一定是相邻项之间的运算,也可以在有一定跨度的时间点之间进行。季节差分(Seasonal difference)就是一个典型的代表。对于既有趋势性又有季节性的序列,可同时进行差分和季节差分处理。时间序列的平滑处理目的是为了消除序列中随机波动性影响。平滑处理的方式很多,常用的有各种移动平均、移动中位数以及这些方法的各种组合等。 中心移动平均法(Centered moving ave
35、rage)计算以当前为中心的时间跨度k范围内数据的移动平均数。 向前移动平均法(Prior moving average)若指定时间跨度为k,则用当前值前面k个数据(注意:不包括当前值)的平均值代替当前值。 移动中位数(Runing medians)它以当前时间点为中心,根据指定的时间跨度k计算中位数。,2 时间序列预处理的基本操作序列缺失数据处理的基本操作 序列数据变换的基本操作 (1)选择菜单TransformCreate Time Series,(2)把待处理的变量选择到New Variable(s)框。 (3)在Name and Function框中选择数据变换法。在Name后输入处理
36、后新生成的变量名,在Function中选择处理方法,在Order后输入相应的阶数,并单击Change按钮。其中的方法除前面介绍的几种外,还包括: Cumulative sum:累加求和,即对当前值和当前值之间的所有数据进行求和,生成原序列的累计值序列。 Lag:数据滞后,即对指定的阶数k,用从当前值向前数到第k个数值来代替当前值。这样形成的新序列将损失前k个数据。 Lead:数据前引。与数据滞后正好相反,即指定的阶数k,从当前值向后数以第k个数值来代替当前值。这样形成的新序列将损失后k个数据。,指数平滑法,指数平滑法的基本操作 由于指数平滑法要求数据中不能存在缺失值,因此在用SPSS进行指数平
37、滑法分析前,应对数据序列进行缺失值填补。SPSS指数平滑法的基本操作步骤如下: (1)选择菜单AnalyzeTime SeriesExponential Smoothing。,(2)把待分析的变量选择到Variables框中。 (3)从Model栏中选择合适的模型。包括简单指数平滑模型、霍特模型、温特模型及用户自定义模型。 (4)单击Parameters按钮进行模型参数设置,在Initial Values框中选择初始值的方式,其中Automatic表示系统自动设置,Custom表示用户手工设置。 在General(Alpha)框中设置简单指数平滑模型的常数。可直接输入的值,也可设定初值和终值以
38、及步长,这样SPSS会通过格点法对多个值逐个建模,得到最优模型; 在General(Alpha)和Trend(Gamma)框中设置Holt双参数模型当中的普通、趋势平滑常数,; 在General(Alpha)、Trend(Gamma)、Seasonal(Delta)框中设置温特模型中的普通、趋势和季节平滑参数,; 选择Display only 10 best models for grid search选项表示:在平滑常数的格点选择完成后仅显示最佳的10个模型。不选择该选项,则每个格点处常数值对应的模型都会被输出。,指数平滑法的应用举例 利用1992年初2002年底共11年彩电出口量(单位:“
39、台”)的月度数据,建立几种指数平滑模型,对彩电出口量的变化趋势进行分析和预测。 首先绘制和观察彩电出口量的序列图 模型一:简单指数平滑模型(适用于比较平稳的序列)首先建立简单指数平滑模型。对平滑参数的选择采用格点(Grid Search)方法,以找出相对最优模型;对于初始值选择自动选择(Automatic)。 模型二:霍特二次平滑模型(适用于有线性趋势的序列)仍然用格点法选择参数,步长为0.01。 模型三:温特线性和季节性指数平滑模型(适用于同时具有趋势性和季节性的序列)同样用格点法选择参数。 模型四:自定义三次指数平滑模型(适用于有非线性趋势的序列),自回归法,1 自回归法的基本思想 利用简
40、单回归分析法进行时间序列分析时,模型要求各期的随机误差项之间是不相关的。在前文的平稳随机过程的定义中也介绍过,只有误差项中不存在任何可利用的信息时,才能够认为模型已经达到了最优。而当误差项之间存在相关性时,一方面常用的估计方法不再具有优良性,普通的简单回归模型存在着较大的缺陷;另一方面也说明模型对序列中的信息没有充分地提取。自回归模型,简写为AR模型,正是针对模型误差项存在相关性的情况而设计的一种改进方法。由于自回归模型只考虑了误差项中的一阶相关性,因此也称为一阶自回归AR(1)模型。,AR(1)模型的一般形式为:其中,模型的主体部分与一般的回归模型完全相同,但是其残差序列不满足一般回归模型要
41、求的残差项之间不存在相关性的Gauss-Markov假设,而是存在着系数为的一阶自相关。,2 自回归法的基本操作 (1)选择菜单AnalyzeTime SeriesAutoregression。 (2)把被解释变量选择到Dependent框中,选择解释 变量到Independent(s)框中。,(3)在Method框中选择参数估计的方法,其中: Exact maximum-likelihood为精确极大似然法、它是一种建立在极大似然估计准则基础上的参数估计方法。一般在大样本下(样本数大于50)有比较优良的参数估计。 Cochrane-Orcutt法是一种在误差序列具有一阶自相关情况下较常用的参
42、数估计方法,它不适用于序列存在缺失值的情况。 Prais-Winsten法是一种适用在一阶自相关情况下的广义最小二乘法,也不适用于存在缺失值的情况。这种方法一般优于Cochrance-Orcutt方法。,(4)单击Option按钮对模型算法进行设置: 在Initial value of autoregressive parameter框后输入自回归模型迭代初始值 。 在Convergence Criteria中指定迭代收敛条件:在Maximum iterations后指定最大跌代次数;在Sum of squares change后指定误差平方和减少达到什么程度时终止迭代。 在Display框中
43、指定输出哪些分析结果请注意,SPSS的自回归分析是针对误差项存在一阶自相关的情况设计的。当序列中存在更高阶的自相关时,就需要使用ARIMA模型。,3 自回归法的应用举例 利用1992年初至2002年底共11年我国激光唱机出口量月度数据,对激光唱机出口量进行分析预测。主要分析过程如下: 首先绘制和观察序列图 模型一:利用趋势外推法建立趋势模型由于序列的趋势并非直线上升,而呈加速上升的态势。因此可首先利用二次曲线进行趋势拟合。以时间及其二次项作为解释变量,并计算DW统计量和预测值以及残差序列。, 模型二:一阶自回归模型(极大似然法)观察该模型的拟合效果是否较趋势外推模型有所改进。 模型三:对数序列
44、自回归模型观察图激光唱机出口量序列图发现,序列除了具有曲线趋势、明显的季节性特征之外,还有一个特征就是序列的波动幅度随时间的推移越来越大。这种波动必然会影响到模型的误差序列,进而使其出现方差不平稳性。从前面讲过的方差非平稳性的处理中我们知道,可通过对序列取对数的方法来消除这种波动性逐渐增大的现象。,ARIMA模型分析,1ARIMA分析的基本思想和模型 ARIMA是自回归移动平均结合(AutoRegressive Integrated Moving Average)模型的简写形式,用于平稳序列或通过差分而平稳的序列分析。ARMA模型也称B-J方法,是一种时间序列预测方法。从字面上可以知道,ARM
45、A模型是自回归模型(AR)和移动平均模型(MA)有效组合和搭配的结果,称为自回归移动平均模型。,ARMA其一般形式为: yt1yt-12yt-2pyt-pet+1et-1+2et-2+qet-q其中,等式左边是模型的自回归部分,非负整数p称为自回归阶数,1,2,p称为自回归系数;等式右边是模型的移动平均部分,非负整数q称为移动平均阶数,1,2,q称为移动平均系数。p,q分别是偏自相关函数值和自相关函数值显著不为零的最高阶数。可以看出,当p0时,模型是纯移动平均模型,记为ARMA(0,q);当q0时,模型是纯自回归模型,记为ARMA(p,0)。ARMA(p,q)模型可用较少的参数对序列进行较好地
46、拟合,其自相关和偏自相关函数均呈现拖尾性。,ARMA模型只适合于对平稳序列的分析。实际应用中的时间序列并非平稳序列,不能直接采用ARMA模型。但通常这些序列可通过变换处理后变为平稳序列。对它们的分析一般应采用自回归移动平均结合ARIMA模型。ARIMA模型又分为ARIMA(p,d,q)模型和ARIMA(p,d,q)(P,D,Q)s模型。ARIMA(p,d,q)模型当序列中存在趋势性时,可通过某些阶数的差分处理使序列平稳化。这样的序列被称为是一种准平稳的序列,而相应的分析模型被概括为ARIMA(p,d,q),其中,d表示平稳化过程中差分的阶数。ARIMA(p,d,q)(P,D,Q)s模型当序列中
47、同时存在趋势性和季节性的周期和趋势时,序列中存在着以季节周期的整数倍为长度的相关性,需要经过某些阶数的逐期差分和季节差分才能使序列平稳化。对这样的准平稳序列的分析模型概括为ARIMA(p,d,q)(P,D,Q)s模型,其中,P,Q为季节性的自回归和移动平均阶数,D为季节差分的阶数,s为季节周期。,2ARIMA分析的基本操作 (1)选择菜单AnalyzeTimeSeriesARIMA,出现窗口,(2)把被解释变量选择到Dependent框中。 (3)如果要对序列进行变换后再进行建模,可在Transform框中选择变换方式。这里提供了自然对数和以10为底的对数两种变换形式。 (4)在Independent(s)框中可选入其他的解释变量,这和前一节的自回归模型相似。但一般情况下ARIMA模型不再引入其他解释变量。 (5)在Model框中对模型的6个参数进行设置,它们分别是ARIMA模型中的p,d,q,P,D,Q,还可以选择模型当中是否包含常数项。 (6)单击Option按钮对模型的算法和输出等进行设置。,