1、时间序列分析,时间序列分析的基本原理 趋势拟合方法季节变动预测,一、时间序列分析的基本原理,(一)时间序列的组合成份 长期趋势(T),是时间序列随时间的变化而逐渐增加或减少的长期变化之趋势。,在时间数列的分析中,可以每小时、每天、每星期、每月、每年或每隔任何一段时间进行测量。尽管时间数列的资料一般呈现随机起伏的形态,但在一段较长的时间内,时间序列仍然呈现逐渐增加或逐渐减少的转变或变化。时间数列的逐渐转变称为时间数列的趋势,这种转变或趋势通常是长期因素影响的结果,如人口总量的变化、人口总体统计特征的变化、方法的变化和顾客偏爱的变化等都是长期因素。,季节变动(S),是时间序列在一年中或固定时间内,
2、呈现出的固定规则的变动。,季节周期:通常以“年”为周期、也有以“月、周、日”为周期的准季节变动。,4,本例给出了1992年第一季度至2008年第三季度我国GDP季度数据(单位:亿元)。,循环变动(S),是指沿着趋势线如钟摆般地循环变动,又称景气循环变动(Business Cycle Movement) 。,尽管一个时间数列可以显示长期趋势,但时间数列的所有未来值不可能准确地落在趋势线上。事实上,时间数列常常呈现环绕趋势线上、下的波动。任何时间间隔超过一年的环绕趋势线上、下的波动都可归结为时间数列的循环成分。如:经济增长中:“繁荣衰退萧条复苏繁荣”商业周期。固定资产或耐用消费品的更新周期等。,不
3、规则变动(I),是指在时间序列中由于随机因素影响所引起的变动。,时间数列的不规则成分是剩余的或“包罗万象”的因素,它用来说明在分离了趋势、循环和季节成分的给定期望值后,时间数列值的真正偏差。不规则成分是由那些影响时间数列的短期的、不可预期的和不重复出现的因素引起的。因为这种成分说明时间数列中的随机变动、所以它是无法预测的,我们不能预测它对时间数列的影响。,(二)时间序列的组合模型 加法模型,假定时间序列是基于四种成份相加而成的。长期趋势并不影响季节变动。若以Y表示时间序列,则加法模型为:Y=T+S+C+I 乘法模型,假定时间序列是基于四种成份相乘而成的。假定季节变动与循环变动为长期趋势的函数。
4、该模型的方程式为:,二、趋势拟合方法,时间序列分析的平滑法主要有三类 :1.移动平均法:设某一时间序列为 y1,y2,yt,则t+1时刻的预测值为: 式中, 为t点的移动平均值,n称为移动时距。,(一)平滑法,移动平均法使用时间数列中最近几个时期数据值的平均数作为下一个时期的预测值。因此,移动平均数的计算公式如下: 使用“移动”项是因为每一时期新的观测值对时间数列都是有用的,用它代替式中最旧的观测值,可计算一个新的平均数。因此,当新的观测值变得有用时,平均数将变化或移动。,2. 滑动平均法 :其计算公式为 式中, 为t点的滑动平均值,L为单侧平滑时距。 若L=1,则上式称为三点滑动平均,其计算
5、公式为 若L=2,则称为五点滑动平均, 其计算公式为,3.指数平滑法 一次指数平滑 为平滑系数。一般时间序列较平稳,取值可小一些一般取(0.05, 0.3) ;若时间序列数据起伏波动比较大,则应取较大的值一般取(0.7, 0.95)。, 高次指数平滑法 一次指数平滑法 二次指数平滑法的预测公式 为 二次指数平滑法的预测公式为其中, 高次指数平滑法 三次指数平滑法的预测公式 为,三种最常用的趋势线 直线型趋势线指数型趋势线 抛物线型趋势线,(二)趋势线法,利用趋势推测法进行预测:例题1,考虑某工厂过去10年的自行车销售量时间数列,资料见表1。第1年销售了21600辆,第2年销售了22900辆,第
6、10年(即最近一年)销售了31400辆。尽管图1显示在过去10年中销售量有上、下波动,但时间数列总的趋势是增长的或向上的。,表1 自行车销售量时间数列,不想关注时间数列的每一时间趋势成分和每一次向上或向下的波动。但趋势成分将反映时间数列的一种逐渐的变动,如这个例子中波动是向上的。在观察了表1中的时间数列资料和图1之后,我们认为在图2中显示的线性趋势,可对时间数列的长期运动提供合理的描述。,图1 自行车销售时间序列图形,图2 用线性函数对自行车销售量的趋势描述,用自行车销售量的资料,来说明应用回归分析确定线性趋势的计算问题。用最小二乘法来发现两个变量的线性关系,建立自行车销售量时间数列的线性趋势
7、的方法。回归分析来估计时间和销售量之间的关系。描述自变量x和因变量y之间线性关系的估计回归方程为:,为了强调在这个预测中自变量是时间这一事实,我们用t来替代式中的x。另外,我们用Tt取代 y ,因此被估计的销售量可表示为时间的函数,其表达式如下:,式中: Ttt期时间数列的趋势值; b0线性趋势的截距; b1线性趋势的斜率; t 时间。,T时间数列的平均值,即:,t的平均值,即,1.自相关性判断 时间序列的自相关,是指序列前后期数值之间的相关关系,对这种相关关系程度的测定便是自相关系数。 测度:设y1,y2,yt,yn,共有n个观察值。把前后相邻两期的观察值一一成对,便有(n1)对数据,即(y
8、1,y2),(y2,y3),(yt,yt+1),(yn-1,yn)。其一阶自相关系数r1为,(三)自回归模型,二阶自相关系数r2为k阶自相关系数为,2.自回归模型的建立 常见的线性自回归模型: 一阶线性自回归预测模型为 二阶线性自回归预测模型为 一般地,p阶线性自回归模型为 在以上各式中, 为待估计的参数值,它们可以通过最小二乘法估计获得。,基本步骤:(1)对原时间序列求移动平均,以消除季节变动和不规则变动,保留长期趋势; (2)将原序列y除以其对应的趋势方程值(或平滑值),分离出季节变动(含不规则变动),即: 季节系数= TSCI/趋势方程值(TC或平滑值)=SI,三、季节性预测法,(3)将
9、月度(或季度)的季节指标加总,以由计算误差导致的值去除理论加总值,得到一个校正系数,并以该校正系数乘以季节性指标从而获得调整后季节性指标。(4)求预测模型,若求下一年度的预测值,延长趋势线即可;若求各月(季)的预测值,需以趋势值乘以各月份(季度)的季节性指标。 求季节变动预测的数学模型(以直线为例)为 式中: 是t+k时预测值,at、bt为方程系数, 为季节性指标。,例 题 某旅游景点20022004年各季度客流量yi(104人次)如下表所示,下面我们用上述步骤,预测该旅游景点2005年各季度的客流量。,解题步骤:,(1)求时间序列的三次滑动平均值,见上表中第5列。(2)求季节性指标:将上表中
10、第4列数据分别除以第5列各对应元素,得相应的季节系数。然后再把各季度的季节系数平均得到季节性指标,见下表。季节性指标之和理论上应等于4。现等于3.9515,需要进行校正。校正方法是:先求校正系数:=4/3.9515=1.0123。然后将表中的第5行,分别乘以,即得校正后的季节性指标(见表第6行)。,(3)用二次指数平滑法,求预测模型系数:取平滑指数 ,分别计算一次指数平滑值和二次指数平滑值,然后在分别计算趋势预测模型的系数和,结果如下表所示。由表可知,预测模型为:式中: 为校正后的季节性指标。,(4)求预测值 。以2004年第4季度为基期,套用公式(3)中预测模型,计算预测2005年各季度的客
11、流量第一季度: = 296.58(104人次)第二季度: = 386.82(104人次)第三季度: = 352.74(104人次)第四季度: = 264.92(104人次) 由此可以计算出2005年全年度的客流量预测值为: 1301.07(104人次),讨论扩展到对同时拥有趋势和季节成分的时间数列进行预测的情形。 剔除季节影响的时间数列称为消除季节影响的时间数列。下面所介绍的方法适用于只有季节影响情形或同时有季节和趋势成分的情形。首先计算季节指数,并用它们得到消除季节影响的资料;然后,如果消除季节影响的资料有明显的趋势,则我们用回归分析估计该资料的趋势成分。,利用趋势和季节成分进行预测:例题2
12、,表1和图1中的是工厂在过去4年中电视机的销售量(单位:千台)。该时间序列是基于长期趋势、季节变动和不规则变动相乘而成的(TSI)。,1、季节指数的计算,首先通过计算滑动平均数,将趋势成分T与季节S及不规则成分I分开,然后使用计算程序,确定每个季度的季节影响。,图2 电视机季节销售量时间数列和中心化的滑动平均数的图形,中心化的滑动平均数,“消除”了时间数列的季节和不规则波动。,表3 电视机销售量时间数列的季节不规则值年季度销售量/千台中心化的滑动平均数=季节不规则值,T*S*I,T,表4中的数值的解释提供了电视机销售的季节成分的一些信息。最佳销售季度是第4季度,它的销售水平比总平均水平高出14
13、%,最差或最低的销售季度是第2季度,它的季度指数为0.84,说明其销售水平比总平均季度销售水平低16%。季节成分符合人们收看电视的直观上的期望,可见在第4季度电视购买轨迹趋势上升,是因为冬季即将到来,人们减少了户外活动。第2季度的低销售量说明因为存在春季和初夏季节活动的大量消费者,人们降低了看电视的兴趣。,2 消除时间数列的季节影响,找出季节指数的目的是为了从时间数列中去掉季节影响。这种过程称为时间数列消除季节影响。调整季节变异后的经济时间数列(消除季节影响的时间数列)常常刊登在一些出版物上,这些出版物有当前商业考察(Survey of Current Business)、华尔街日报和商业周刊
14、等。根据乘法模型的记号,我们有:,用时间数列的每个观察值除以相应的季节指数,则可以对时间数列消除季节影响。,图3 消除季节影响的电视机销售量时间数列表5中是电视机销售量消除季节影响后的时间数列资料。,3、 利用消除季节影响的时间数列确定趋势,尽管图3 中的图形显示过去16个季度的资料有一些上、下的随机波动,但时间数列似乎有一个向上的线性趋势。在这种情形中,所用的资料是消除季节影响的季度销售量数据。因此 ,对于这个线性趋势,估计的销售量被作为时间函数,即: Tt=b0+b1t式中: Ttt期电视机销售量的趋势值; b0趋势线的截距; b1趋势线的斜率;,因此,时间数列的线性趋势成分的表达式为:T
15、t=5.101+0.148t斜率0.148表明,在过去的16个季度中,当消除季节影响之后,公司每个季度销售量平均增长148台。如果我们假设过去16个季度销售资料的趋势对预测未来相当合适,则这个方程可用来推测未来季度时间数列的趋势成分。例如,将t=17代入方程,可得到下一个季度的趋势推测值T17。 T17=5.101+0.14817=7.617因此,由趋势方程产生的下一个季度电视机销售量的推测值为7617台。同样,由趋势方程可分别产生第18、19和20季度的电视机销售量推测值为7765,7913和8016台。,4、季节调整,对同时有长期趋势和季节成分的时间数列,进行预测的最后一步是用季节指数调整趋势推测值。再回到电视机销售量的例子,我们现在已得到了未来4个季度的趋势推测值,下面我们必须用季节影响调整预测值。第5年第1季度(t=17)的季度指数为0.93,因此我们用趋势值(T17=7617)乘以季节指数(0.93),得到这个季度的预测值为76170.93=7084台。 表7给出了1720季度的季度预测值。第4季度有最高销售量,其预测值为9190台;第2季度有最低销售量,其预测值为6523台。,