1、1基于小波分析的金融时间序列预测北京邮电大学 陶淼冰、唐子林、白杨目录摘要 11 问题的提出 .22 传统方法及改进的方法 23 模型构造前的准备 33.1 数据的来源 33.2 对数据的处理 .33.2.1 标准化处理 .43.2.2 收益率的定义 .44 模型的建立(WBPAR 模型) .44.1 建模思路 .44.2 对原始数据进行小波分解 .64.2.1 小波分析的基本理论 .64.2.2 小波分解 .94.3 时间子序列的预测 .134.3.1 小波空间变换序列的预测 .134.3.2 尺度空间变换序列的预测 .144.4 预测数据的重构及检验 .165 模型评价及改进方向 195.
2、1 优点: .205.2 缺点及改进方向: .20参考文献 211摘要本文以金融时间序列为研究对象,将小波分析应用于时间序列预测,并以美国 S渐进完全性 , ;=0=2( )伸缩规则性 ;(2)()+1正交基存在性 存在 其中 则 ()0, 使 ()是 0的 标 准正交基 . 称为尺度函数, 称为逼近空间。定理 设 是由尺度函数 生成的多分辨分析,则对任意的 ,函数集 是 的标准正交基。()=2/2 (2/2) 定理 设 是由尺度函数 生成的一个多分辨分析,则下述两尺度方程成 立。7 ()= 2 (2) ( 1式)则 =+ () (2) 定理 定义()= 2 (2), =(1)1 ( 2式)令
3、是由 ()=2/2(2/2)则 是 在 中的正交补空间,+1 +1 即 =+1 +1分解算法假设 f 是我们要处理的时间序列(先假设是一个连续函数) ,可看作 ,2( )但我们测得的信号只是实际信号 的一个近似,设 ,由于 是 空 () 间的标准正交基,故有=()显然 =然而又有 =+1 +1因此=+1,+1.()+1,+1,() ( 3) 式其中 +1,=, +1,=结合(1),(2),(3)式可以得到+1,=2+1=2 2+1,= 2+1=2+2 2 (4)式类似的不断这样分解下去,可以将 分解为 空间上的函数 与+1 +2 +28空间上的函数 ,并得到相应的尺度系数 及相应的小波系+2
4、+2 +2,数 最终可以得到 的分解式(分解到 M 层)+2, =+1+2+3+进一步来看,我们将 在其子空间上分解,求出它在各空间上的子函数(即根据(4) 式迭代求出尺度函数系数 与小波函数系数 ), ,我们必须将系数初始化,即给 赋值。当 为连续函数时,=+()()因为在本文中, 为离散序列时,故需要对 进行抽样取值近似上面积分, =2/2(2)重构算法对于给定的信号 f,按照前面的分解算法可以将其分解为 与 (jlM)中的成分,然后根据需要对分解后的序列进行数据处理,当处理后,小波系数会发生变化,这就需要一个重构算法,使处理后的信号 能用 里的, 基底表示,即使=()设 =+1+2+3+
5、令 1=+即 1,1,()=,.()+,()则1,= /2=(+1)/2 2,+(+1)/2=/2 2, 类似的,可以重构出 (jlM),并得到其的小波系数 , ,9最终得到 。4.2.2 小波分解需要解决的问题:(1) 选用什么样的小波基函数对原序列进行分解;(2) 需要将序列进行多少次分解:(3) Mallat 算法每循环一次都要进行二抽样,因此,随着分解的增加,分辨率的降低,子序列的数据点变少,需要找一种改进算法来克服这一缺点。问题的解决:(1) 对于问题一由于本文处理的时间序列的波动性较大,而且序列中有“奇异点”存在,故所采用的小波最好具有对称性,否则在分解重构后会造成失真(http:
6、/ Haar 小波同时具备这两个性质,故采用 Haar小波。(2) 对于问题二由于股票波动频繁,分解层数越多越好;但随着分解阶数的增加,尺度空间和小波空间的变化越来越小,而工作量却成倍的增加,故分解层数也不宜过多。经过比较,选用 6 层分解。(3) 对于问题三为了得到一个稳定的时间序列预测,我们需要分解出来的子序列的数据点相较于原始序列不减少,因此我们考虑在原始序列抽样取值时,在偶数点上加上0,这样一来,原始序列的抽样点变多一倍,则子序列的抽样点便与原始序列抽样点数量一样了。对时间序列进行分解根据上面所阐述的算法,由 matlab2010 编程可得到分解后的各个小波空间的子时间序列及各尺度空间
7、的序列,具体如下图(注意,由于证券收益率太小,有太多位小数,我们在处理数据时可能会造成数据丢失,故我们将所有数据均乘以 1000.)小波空间的序列10图表 1(第一级小波空间 Wj+1 )图表 2(第二级小波空间 Wj+2 )图表 3(第三级小波空间 Wj+3)图表 4(第四级小波空间 Wj+4)11图表 5(第五级小波空间 Wj+5)图表 6(第六级小波空间 Wj+6)尺度空间的序列图表 7(第一级尺度空间 Vj+1)图表 8(第二级尺度空间 Vj+2)12图表 9(第三级尺度空间 Vj+3)图表 10(第四级尺度空间 Vj+4)图表 11(第五级尺度空间 Vj+5)图表 12(第六级尺度空
8、间 Vj+6)由上图可以看出随着分解的深入,尺度序列与小波序列都呈现出了越来越低的分辨率,曲线变的越来越平滑。特别的,由于小波序列属于原始序列的高频部分,表示了原序列的细节变化部分,所以图像呈现出强烈的非线性性,故需要高响应度的算法来处理,而且序列曲线呈现出了一定的周期性,即表示序列的自相关度较小,因此进一步说明,用神经网络算法预测是可取的。但是可以发现,低层次的小波序列很不平滑,变化频率很高,用神经网络算法来预测这一部分的子序列还是会有较大的误差。13另一方面,随着分解层数的增加,尺度序列变得越来越简单(即越来越逼近原序列的概貌) ,第六级尺度空间的序列拥有较好的平稳性及线性性,故采取线性自
9、回归模型来预测效果更好。4.3 时间子序列的预测4.3.1 小波空间变换序列的预测BP 神经网络模型对于具有小波分解后产生的高度非线性的小波空间,借助前馈神经网络(BP)算法处理非线性问题的自适应特性分别对各级小波空间的序列进行模拟进而预测股市的变化趋势。通过对已有数据的训练来调节系统的权值与阈值以及偏移量,进而利用得到的网络模型作用于后期的输入量以得到输出的预测值。神经网络基本模型具体来说,神经网络模型的建立通过以下几步得以实现: 随时间变化的收益率作为待训练系统的目标量,而标志其变化的时序作为网络的输入量 对目标量与输入量进行归一化处理得到网络模型输入端的有效数据 网络初始化时将隐层神经元
10、的个数设置为 20,初始化网络的转移函数与训练函数分别是 tan-sigmoid、traingd 利用各级小波空间已有的 3072 个数据对该网络系统进行自适应训练,迭代500 次后即可得到训练的系统,由训练结果可以得到该系统对已有数据预测输出的有效性进行评估。检验后即可对后期的输入(时序)进行模拟预测,最终得到各级今后 10 个时隙的预测值作为总体预测值在该级小波空间的投影模型结果根据上述模型,用 matlab2010 编程实现神经网络算法得未来 1 级小波空间2 级小波空间3 级小空间4 级小波空间5 级小波空间6 级小波空间时刻 1 3.0984 -0.2204 1.2038 3.405
11、5 1.08 0.6042时刻 2 -3.5036 -2.8978 -0.8643 3.2935 1.1944 0.6097时刻 3 -2.4421 -3.6489 -2.8168 1.7218 -1.3341 0.607214时刻 4 -1.1449 -3.3695 -3.0199 0.9137 -2.9173 0.6046时刻 5 -0.5627 0.3103 -1.1937 0.8009 -1.6909 0.5945时刻 6 -0.4228 -0.4317 -1.5608 -0.2601 -1.3798 0.5834时刻 7 0.2322 0.2826 -0.0512 2.6402 1.
12、241 0.5711时刻 8 -0.4279 -0.1764 -1.4128 -1.2562 -1.1282 0.5612时刻 9 0.3534 0.046 -0.4929 -1.5903 1.0596 0.5485时刻101.8639 0.7816 0.3108 1.793 1.9867 0.6315时刻11-1.856 0.4748 0.206 -1.8423 0.8678 0.5068时刻120.3036 0.3754 0.5544 -1.4863 0.7566 0.4791拟合度(R)0.9043 0.9613 0.9854 0.9949 0.9986 0.9959由上表可知,神经网络
13、对于各个小波空间序列的拟合程度很高。4.3.2 尺度空间变换序列的预测根据小波分析理论,随着尺度空间阶数增大,原序列在此尺度空间中投影得到的序列具有越来越好的线性性及平稳性。为了科学起见,我们用单位根检验判断序列的平稳性。单位根检验此处我们通过利用软件 EViews6.0 得出序列的自相关分析图判断序列的平稳性通过观察图像,由于图像不具有长期明显的上涨或者下降,而且图像的均值接近 0,因此我们使用软件进行单位根检验的时候选择既不含常数项也不含趋势15项形式的方程 作为检验方程,其中检验类=(1)1+1=1+型选择 ADF 检验,对原序列进行单位根检验,Eviews6.0 有自动计算最佳的滞后期
14、 P 从而进行检验计算的功能,得出结果如下图:由上图可知,软件取定 P 的最佳取值为 12,且此时检验 t 统计量值为-13.29253,远小于显著性水平为 1%的临界值,因此可以拒绝原假设,即序列不存在单位根,是平稳的。故我们采用 AR(p)模型进行预测。AR 模型首先确定阶数 P根据文献(金融时间序列分析)应选择合适的 p 值,使得()=ln(2)+2/最小,其中 是 的最大似然估计, 是残差的方差,T 是样本容量。2 2 2通过统计软件的计算,p 取 12 可以使得 AIC 最小。故可以建立 AR(12)模型 =11+22+33+44+55+66+77+88+99+1010+1111+1
15、212上式中, 表示当期的尺度变化值, 表示 i 时刻前的尺度变化值。 用马可威软件进行求解,并对得到的方程进行系数显著性检验,剔除那些系数不显著的,并重新建立 AR 模型,最后可得 =11+22+33+44+55+88+99运用马可威软件可得各变量的系数如下表16由上表可知,各变量的显著性都很好。由以上残差表可知,模型的拟合度很好。再根据自回归 AR 模型预测出尺度序列的点列可得下图:2 4 6 8 10 120.720.740.760.784.4 预测数据的重构及检验预测结果根据上述的模型,我们对 S&P 在 2011.5.30-2011.6.18 这中间的 12 个时间序列点进行预测,可
16、以得到下表1 级小波序列2 级小波序列3 级小波序列4 级小波序列5 级小波序列6 级小波序列6 级尺度序列重构序列3.0984 -0.2204 1.2038 3.4055 1.08 0.6042 0.685193 9.856693-3.5036 -2.8978 -0.8643 3.2935 1.1944 0.6097 0.697416 -1.470684-2.4421 -3.6489 -2.8168 1.7218 -1.3341 0.6072 0.708741 -7.204159-1.1449 -3.3695 -3.0199 0.9137 -2.9173 0.6046 0.719114 -8
17、.214186-0.5627 0.3103 -1.1937 0.8009 -1.6909 0.5945 0.728856 -1.012744-0.4228 -0.4317 -1.5608 -0.2601 -1.3798 0.5834 0.737933 -2.7338670.2322 0.2826 -0.0512 2.6402 1.241 0.5711 0.746397 5.662297-0.4279 -0.1764 -1.4128 -1.2562 -1.1282 0.5612 0.754388 -3.0859120.3534 0.046 -0.4929 -1.5903 1.0596 0.548
18、5 0.761889 0.6861891.8639 0.7816 0.3108 1.793 1.9867 0.6315 0.768879 8.13637917-1.856 0.4748 0.206 -1.8423 0.8678 0.5068 0.775364 -0.8675360.3036 0.3754 0.5544 -1.4863 0.7566 0.4791 0.781338 1.764138与真实数据比较可得(预测数据要除以 1000)结果分析1. 由上图可知,预测序列在 A 点,B 点,C 点的预测效果比较差,特别是 A 点,股票的走势都预测错了,但其他点的预测效果还可以。经过分析我们得
19、出结论,WBPAR 模型不能很好的对证券市场中的未知的突发事件作出及时响应。例如我们对位于 A 时刻(2011.6.1)的预测点与实际序列进行分析,首先,我们列出 A 时刻前五个时刻的证券收益率的变化图,收益率的变化图从图中可以看出,在 2011.6.2 S&P500 指数发生了突变,经过查询资料()我们得知,这是因为在当天美国政府发布了美国前几个月的经济报表,公布了美国金融危机后期经济复苏速度迟缓的事实,导致投资者的信心受挫,对市场产生担忧,这一信息迅速反应到证券市场中,使得股指由 6.1 日的大涨(涨幅 1.5%)变成 6.2 日的大跌(跌幅 2.3%) 。而这一个突发事件是从历史数据中不
20、可能预测的到,即 WBPAR 无法及时从历史数据中获得这个突发事件的信息,故在 A 点预测失败。对于 B 点与 C 点,6 月 10 号及 6 月 15 日,股指的大幅波动,则是由于,618月以来原油价格的进一步走低;穆迪警告下调意大利银行的信用评价,加剧了欧洲的债务危机;对于这些事件, (主要是原油下跌的事件)历史数据中有一定的体现,所以 WBPAR 模型有一定的反应,但响应不够精确,故预测数据的误差较大。而对于其他点,WBPAR 模型的预测结果的误差还是很小的。这是因为,WBPAR 模型对突发事件的响应有滞后性,例如,WBPAR 模型在对 6.3 日进行预测时,考虑了 6.2 日的突发事件
21、的影响,因此预测数据比较成功。总之,WBPAR 模型只能从历史数据中获得信息,并运用这些信息对未来进行预测,而对那些未知的突发事件的响应具有滞后性。2. 最后将 WBPAR 模型,直接用 BP 神经网络算法,直接用 AR 模型得到的预测序列比较得若直接运用 AR 模型得到下表即如果直接用 AR 模型预测,拟合度 R 特别低。因为原始序列是高度非线性的,故直接用 AR 模型的预测效果极差。我们再比较 WBPAR 模型及 BP 模型,预测结果如下表WBPAR 模型 BP 模型 原始数据0.0098567 0.0120968 -0.0230483-0.0014707 -0.0030955 -0.00
22、12255-0.0072042 0.0030769 -0.0097816-0.0082142 -0.0023671 -0.0108185-0.0010127 -0.0075879 -0.0009568-0.0027339 -0.001828 -0.00419580.0056623 0.0075879 0.0073505-0.0030859 0.001828 -0.01407850.0006862 0.002748 0.00066860.0081364 -0.0005318 0.0125329-0.0008675 -0.00004894 -0.01758560.0017641 0.0016 0.
23、001752819由上图可以得到,WBPAR 模型的预测效果明显优于 BP 模型,再对求相对误差得,相对误差WBPAR 模型 0.127(剔除 A,B,C 点)BP 模型 1.101由以上可知,使用普通 BP 神经网络预测时会出现较大幅度的相对误差,而且有很多数据甚至连正负都预测错了。而另一方面,混合策略 WBPAR 模型则有明显的改善,进而能够对数据进行相对有效的预测,虽然相对误差较大,但是由于数据本身的绝对值较小,所以预测序列绝对误差很小。5 模型评价及改进方向5.1 优点: 该模型以小波理论为基础将待分析序列分别投射到不同频段的小波空间与尺度空间,以对序列进行时频窗分析,实现序列概貌与细
24、节的分解,再对两个领域分别运用适用的方法进行有效的预测。利用这种分解策略能实现较之传统方法更为有效的预测 对序列在具有高度非平稳性的小波空间的投影序列建立具有自适应与非线性的神经网络模型,构造前向反馈神经系统进而实现对网络进行多次训练可以有效处理因高频变化的非线性序列,最终进行有效的预测。而对序列在尺度空间的投影则充分利用其平稳性进行自回归模型进行预测,这样就将两种使用与不同对象的预测方法实现有机结合5.2 缺点及改进方向:20 对序列在高频空间映射的处理利用神经网络算法时,对于实际情况可能出现的突发事件不能有效的预测,进而可能出现预测误差的扩散影响以后的预测效果。针对这个缺陷,可以考虑利用遗
25、传算法与神经网络算法的结合,即基于遗传算法的神经网络。遗传算法中的基因变异可以从概率的角度体现可能出现的突发事件(变异) ,再结合对神经元的权值与阈值的调节对数据进行预测 该混合策略的处理一方面要对数据实现多空间的分解,另一方面需要进行前馈神经网络的构造以对数据进行多次训练,然而这些都要建立在一定数据量的基础上。因此,该模型需要有足够的数据支持才能进行行之有效的预测 对原时间序列的小波分解得到的低维小波空间序列具有很强的变化频率,而且序列的平滑度很不好,故对这一部分序列用神经网络算法预测会有误差。针对这一缺陷,可以适当的增加小波分解层数,用更多的高维的平滑小波序列的预测结果来弥补低维小波序列的
26、预测误差。21参考文献1 http:/ 1999-20112 戴维鲁珀特著 , 孙志宾,张键红译 Statistics and finance 中国人民大学出版社 ,20103 Satish Kumar 著 Neutral Network 清华大学出版社, 20064 胡守仁著 神经网络导论 国防科技大学出版社 19935 Ruey S. Tsay 著 金融时间序列分析 人民邮电出版社 20096 张世英 , 樊智著 协整理论与波动模型 : 金融时间序列分析及应用 清华大学出版社 20097 刘贵忠, 邸双亮著 小波分析及其应用 西安电子科技大学 19938 Jaideva C. Goswam
27、i, Andrew K. Chan 著 小波分析理论、算法及其应用 国防工业出版社 20079飞思科技产品研发中心著 小波分析理论与 MATLAB 7 实现 电子工业出版社 2005 10徐佩霞,孙功宪编著 小波分析与应用实例 中国科学技术大学出版社 200111邸继征著 小波分析原理 科学出版社 201012胡昌华, 张军波, 夏军著 基于 MATLAB 的系统分析与设计,小波分析 西安电子科技大学出版社 199913殷洪才,赵春燕,王佳秋模糊神经网络在股票市场预测中的作用J哈尔滨理工大学学报 200714王振龙时间序列分析M中国统计出版社 200015佟伟民,李一军,单永正基于小波分析的时
28、间序列数据挖掘计算机工程 2008 第 34 卷第 1 期16何书元应用时间序列分析M北京:北京大学出版社,200317马社祥,刘贵忠,曾召华基于小波分析的非平稳时间序列分析与预测J系统工程学报,200018胡俊胜,肖冬荣,夏景明基于小波神经网络的经济预测研究J统计与决策,2005 年 3 月(下)19徐正国. 金融市场高频/超高频时间序列的分析、建模与应用D. 天津大学,2004: 21420http:/ 小波分析中的多孔算法21http:/ matlab 里的神经网络工具箱22任华英 著 Eviews 应用实验教程 湖南大学出版社23http:/ 单位根检验的 EViews 操作(20090507)