1、 1 第二讲 时间序列分析 2 1 时间序列成分分析 1.1 时间序列的构成因素 时间序列中的数据(也称为观测值) ,总是由各种不同的影响因素共同作用所至;换一句话说,时间序列中的数据,总是包含着不同的影响因素。我们可以将这些影响因素合并归类为几种不同的类型,并对各种类型因素的影响作用加以测定。对时间序列影响因素的归类,最常见的是归为3类: z 长期趋势(SPSS 的名称为 Smoothed Trend-Cycle,3 缩写stc) , 长期趋势是一种对事物的发展普遍和长期起作用的基本因素。受长期趋势因素的影响,事物表现出在一段相当长的时期内沿着某一方向的持续发展变化。这种变化最常见的是一种向
2、上的发展,对于经济现象而言,通常由各种经济投入(如技术进步、劳动力、资金等)所引起,因此,长期趋势有时也可视作经济成长的因素。 4 z 季节周期因子(SPSS 的名称为 Season Factors Component), 缩写 saf,季节周期也称为季节变动,是一种现象以一定时期(如一年、一月、一周等)为一周期呈现较有规律的上升、下降交替运动的影响因素。通常表现为现象在一年内随着自然季节的更替而发生的较有规律的增减变化(如某些季节性商品的销售额、旅游客流量、各月的降雨量等) 。形成季节周期的原因,5 除了自然因素,也有人为和社会因素。 z 不规则变动因子 (SPSS的名称为Irregular
3、 Component, 缩写 err) 。不规则变动是一种偶然性、随机性、突发性因素。受这种因素影响,现象呈现时大时小、时起时伏、方向不定、难以把握的变动。这种变动不同于前三种变动,它完全无规律可循,无法控制和消除,例如战争、自然灾害等。 【例】 1993 年 1 月至 2000 年 12 月社会消费品月零售总额的各成分图如下。 x01000200030004000time01JAN93 01JUL93 01JAN9401JUL94 01JAN9501JUL95 01JAN96 01JUL96 01JAN97 01JUL97 01JAN98 01JUL98 01JAN99 01JUL99 01
4、JAN00 01JUL00 01JAN011993 年 1 月至 2000 年 12 月社会消费品月零售总额曲线图 6 T0100020003000time01JAN93 01JUL93 01JAN94 01JUL94 01JAN95 01JUL95 01JAN96 01JUL96 01JAN9701JUL97 01JAN98 01JUL98 01JAN99 01JUL99 01JAN00 01JUL00 01JAN01长期趋势成分 7 I9596979899100101102103104time01JAN93 01JAN94 01JAN95 01JAN96 01JAN97 01JAN98 0
5、1JAN99 01JAN00 01JAN01 01JAN02不规则变动因子图 8 S90100110120130time01JAN93 01JAN94 01JAN95 01JAN96 01JAN97 01JAN98 01JAN99 01JAN00 01JAN01 01JAN02季节因子图 9 1.2 时间序列的组合模型 若以Y代表时间序列中的数据(观测值),则 由上述四类因素所决定的组合模型为: Y = T + S + I (加法模型) 在加法模型中,各种影响因素是相互独立的,均为与 Y 同计量单位的绝对量。加法模型中,各因素的分解是根据减法进行(如 Y T = S + I) 。 10 Y =
6、 T S I (乘法模型) 11 在乘法模型中, 只有长期趋势是与Y同计量单位的绝对量;其余因素均为以长期趋势为基础的比率,表现为对于长期趋势的一种相对变化幅度,通常以百分数表示。乘法模型中,各因素的分解是根据除法进行(如 Y / T = S I) 。乘法模型是时间序列构成因素分析的主要模型形式。 1.3 SPSS时间序列成分分解的实现及输出结果 (一) SPSS 时间序列成分分解的实现 为了简单起见,我们先来看一个简单的时间序列例子。表12 1 是 1984 年到 1988 年某机场每个季度通过安全检测门的人数,单位:万人。 第一步:将数据输入SPSS的表格, 记住现在只有一个变量序列,按时
7、间顺序输成一列; 第二步: 定义时间。 通过DATA的菜单, 选择Define Dates定义时间变量(图 1) 。选中后得如下的对话框(图 2) ,选择时间序列的频率,如年度数据,季度数据和月度数据等。 表 1 84 到88年某机场季度过安全检测门的人数 13 t 一季度 二季度 三季度 四季度 1984 318 380 358 423 1985 379 394 412 439 1986 413 458 492 493 1987 461 468 529 575 1988 441 548 561 620 图 1 操作图 14 图 2 操作图 15 16 第三步:进行时间序列的成分分解。通过 A
8、nalyze(分析 )的菜单, 选择Time-Series (时间序列) , 再在Time-Series的菜单选择Seasonal Decomposi tion(季节分解)。如图 3。 图 3 操作图 17 选中后有如下的对话框出现,如图4。 图 4 操作图 18 19 最后, 在【Variable(s)】 (变量)处选择要分析的变量 在【Model】(模型)选择 Multiplicative(乘法模型)或Additive(加法模型) 在【Moving Average Weight 】选择All points equal(等权移动平均)和Endpoints Weigh ted by .5(端点
9、为0.5 为权数的移动平均) 在【Display cesewise listing】处选中,要求列出中间20 计算结构。 完成后,数据文件增加了一些附加变量,如图5。 图5 21 22 (二)输出结果的解释和展示 4 个新的附加变量序列分别是不规则成分(err_1) 、季节调整后的序列(SAS_1) 、季节因子(saf_1)和去掉季节和不规则变动的趋势循环成分(stc_1) 。 (1)saf_1是用 12 2的移动平均方法求出长期趋势的估计,然后用长期趋势去除X,得到的季节因子1; (2)sas_1等于x 除以 saf_1 (x/ saf_1); 1方法可以参看统计学的书籍。统计学书中的时间序
10、列一章均会介绍该方法。 (3)stc_1是由如下的公式给出221 11() ( ) 2( ) 3( )2( ) ( )9ttttttstc sas sas sas sas sas +=+, 22,3, 4,tn=“211() ()()s23()3)tc sas sas sas=+ 121() () ()s1()3nnnn)tc sas sas sas=+2公式比较复杂,作为资料的完整性的需要,给出这些公式,初学的者可以不看。 23 12 21() () () ()2stc stc stc stc=+ 3111() () ()2()2nn nstc stc stc stc=+ )n(4)err_
11、1 等于 SAS_1 除以 stc_1(SAS_1/stc_1) 。 (5)作图 24 Case Number10987654321Value X70060050040030020191817161514131211图6 时间序列原始数据x图 25 Case Number10987654321ValueSeasfactorsforXfromSEASON,MOD_1 MULEQ20191817161514131211U1.081.061.041.021.00.98.96.94.92图7 季节因子saf图 26 Case Number1110987654321Value Trend-cycle f
12、or X from SEASON, MOD_1 MULEQ201918171615141312U600500400300图8 趋势循环stc成分图 27 Case Number1110987654321Value Error for X from SEASON, MOD_1 MUL EQU 41.11.0.9.8201918171615141312图9 不规则因子err图 28 1.4 如何应用这些数据进行预测 29 11.499t+从长期趋势数据stc的图形可以看出,随着时间的变化,呈现出直线的趋势,可以利用趋势数据stc和t,建立线性回归模型 ,预测出趋势的预测值。 337.329stc
13、=表2 预测结果 时间 stc t 趋势的预测值 1984.1 354.09695 1 348.82856 1984.2 359.04997 2 360.32792 30 1984.3 374.44139 3 371.82728 1984.4 388.22155 4 383.32664 1985.1 395.97579 5 394.82600 1985.2 403.62496 6 406.32536 1985.3 409.90770 7 417.82472 1985.4 421.92421 8 429.32408 1986.1 440.51240 9 440.82344 1986.2 458.24312 10. 452.32280