1、FIN412金融时间序列模型2016 2017 学年第二学期上机作业第 1 次作业题目 基于 ARIMA 模型的绿地控股股价预测学号 姓名201401212 陈熙元201401270 林靖凯学 院(系) 国际经济贸易学院专 业 金融学作业提交时间 2017.4.111一、数据选取与描述性统计分析绿地集团是中国第一家跻身财富世界 500 强以房地产为主业的企业集团,在“2016 中国企业 500 强“中排名第 67 位,前景良好。为指导投资决策,本文选取绿地控股(600606)股票在 1994 年 1 月至 2017 年 3 月的月收盘价进行分析,来源是国泰安 CSMAR 金融经济数据库。剔除缺
2、省数据后,对数据进行描述性统计分析,得到特征指标和频数分布直方图。表 1 数据描述性特征指标指 标 数 值数 量 265最 小 值 2最 大 值 49均 值 10.11标 准 差 6.49峰 度 11.00偏 度 2.72图 1 数据频数分布直方图由图表可知该股票价格历史分布比较集中且右偏,说明均值可能有所变化,期间有大幅涨跌的阶段。二、平稳性检验与一阶差分本文从直观的折线图、相关函数图和单位根检验三个方面来对原始数据的2平稳性进行检验。1.图形直观判断一个平稳的时间序列在图形上往往表现出一种围绕其均值不断波动的过程; 而非平稳序列则往往表现出在不同的时间段具有不同的均值。由图 2 可以大体看
3、出,该时间序列数据不平稳。0 10 20 30 40 50 94 96 98 0 02 04 06 08 10 12 14 16 图 2 股价折线图2.相关函数图建立AR模型、MA模型、ARMA模型要求样本的自相关函数与偏自相关函数至少有一个是拖尾的 1,而从图3对于该原始数据的相关函数的分析中可以看出,该原始数据的自相关函数和偏自相关函数都不是拖尾的,故无法建立上述三个模型。1 金融时间序列模型 ,潘红宇,对外经济贸易大学出版社, p140,表 4.1.3图 3 股价相关函数分析3.单位根检验单位根检验用于检验序列中是否存在单位根。单位根指单位根过程,可以证明,序列中存在单位根过程就不平稳
4、2,因此无法使用平稳线性 ARMA模型。我们对原始的价格数据进行单位根检验,得到结果如下表。表 2 股价单位根检验2 百度百科4由表2可知单位根检验的p值为0.0266,在1%的显著性水平下不能拒绝存在单位根的原假设,故进一步佐证了原始数据非平稳的结论。4.数据平稳化处理综合上述分析,绿地控股(600606)的股票月收盘价数据不具有平稳性,也不能建立ARMA模型。因此我们对月收盘价进行一阶差分处理,以实现对其平稳化。之后我们画出一阶差分的时间序列图形,并对其进行单位根检验,分别得到图4,表3。-30 -20 -10 0 10 20 94 96 98 0 02 04 06 08 10 12 14
5、 16图 4股价一阶差分折线图表 3股价一阶差分单位根检验由表1.2可知,一阶差分后数据的单位根检验P值为0,在1%的显著性水平下拒绝原假设,数据平稳。同时,图1.3也可以更加直观的让我们看到差分后数据5的平稳性特征。平稳的数据是建立ARMA模型的前提,接下来我们将对一阶差分后的数据建立ARMA模型,相当于对原始数据建立ARIMA模型。三、定阶首先通过观察相关函数进一步确定差分后数据是否适合建立ARMA模型。若适合便对ARIMA模型的自回归部分与滑动平均部分的阶数进行预估,利用预估阶数,建立多个ARIMA模型,分别计算每个模型的信息准则指标(AIC & BIC),找出有相对较小的信息准则指标的
6、模型对应的阶数,作为建立ARIMA模型的阶数。1.一阶差分后数据的相关系数计算一阶差分后数据的相关系数,结果如图5。图 5股价一阶差分相关函数分析由图可知,一阶差分后数据的自相关函数与偏自相关函数都有拖尾的特征,6时候对其建立ARMA模型。2.预估阶数及信息准则指标计算设定预估自回归部分与滑动平均部分的阶数最高为5阶。分别建立ARIMA(0,1,0)至ARIMA(5,1,5)模型共36个,并在建立模型的过程中去掉一阶差分数据中的前5个月的数据,以保证不同阶数自回归的模型的AIC与BIC具有可比性。分别计算25个模型的AIC与BIC,得到结果如下表,其中p表示自回归部分结束,q代表滑动平均部分阶
7、数。表 4AIC 比较p/q 0 1 2 3 4 50 4.9004 4.8561 4.8204 4.7887 4.7967 4.80241 4.8814 4.8500 4.7983 4.7968 4.8015 4.79122 4.7931 4.7943 4.8022 4.8043 4.7917 4.68213 4.7945 4.7753 4.8019 4.8014 4.7788 4.77754 4.8026 4.7810 4.7867 4.7785 4.7854 4.79645 4.8071 4.7855 4.7825 4.7519 4.7585 4.7674表 5BIC 比较p/q 0 1
8、 2 3 4 50 4.9146 4.8844 4.8628 4.8452 4.8673 4.88711 4.9097 4.8924 4.8548 4.8674 4.8862 4.89012 4.8355 4.8508 4.8728 4.8891 4.8906 4.79513 4.8511 4.8459 4.8867 4.9003 4.8918 4.90464 4.8732 4.8658 4.8856 4.8915 4.9125 4.93765 4.8919 4.8844 4.8955 4.8790 4.8997 4.9228由表可知,ARIMA(2,1,5)具有最小的AIC与BIC,分别为4
9、.6821和4.7951,所以我们定阶于ARIMA(2,1,5)。 =+1-1+22+1-1+22+33+44+55(1)四、参数估计、模型调整与 Box-Pierce Q-检验留下差分数据的最后10个月做样本内预测使用,用剩余数据对式(1)中的7参数进行参数估计,得到的结果如下表,其中PRICEA是股价一阶差分,PRICEA(-1)是股价一阶差分的一阶滞后,以此类推。表 6 参数估计结果对这一估计出的模型进行 Box-Pierce Q-检验,得到的结果如下表。表 7Box-Pierce Q-检验结果8Box-Pierce Q-检验原假设为 H0: 是白噪声,可以看出, P 值均大于0.1,所
10、以在 90%的显著性水平下不能拒绝原假设,所以不能认为 不是白噪声。接下来,将模型中不显著的常数项 C 剔除出模型,同样用除最后十个月外的其它数据估计参数,得到结果如下表。表 8 剔除截距的参数估计结果9可见如此调整后,不仅剩余参数的显著性更强,而且 AIC 与 BIC 更小,说明这样的调整是有意义且有利于预测的,故采纳。接下来,对表 3.3 的模型进行 Box-Pierce Q-检验,结果如下表。表 9 剔除截距的 Box-Pierce Q-检验结果10同样,P 值均大于 0.1,所以在 90%的显著性水平下不能拒绝原假设,所以是不能认为 不是白噪声。综上,我们将的 ARIMA 模型建立如下
11、: =1.300-10.90182+1.5071-1+0.916220.381430.492640.15475(2)五、预测1.预测公式由式(2)推导出 1-步预测公式:(1) =1.3000.90181+1.5071+0.916210.381420.492630.15474(3)亦可得多步预测公式:11()=1.300(1)0.9018(2)+1.5071+0.916210.381420.492630.15474(4)其中 0时 , ()=+; 0时 , +=0。2.模拟预测根据式(3)对 1994 年 4 月到 2016 年 5 月的股价变动额进行预测,累计加总得到结果如下图,其中 PRI
12、CE 为实际股价,PRICEF 为预测股价。图 6 模拟预测股价折线图由图可观察到预测股价与实际股价间有明显空隙,前者比后者滞后一个月。故再预测 2016 年 6 月的股价,然后将预测股价前移一阶,得到结果如下图,其中 PRICE 为实际股价,PRICEF 为月份调整后的预测股价。12图 7 月份调整后模拟预测股价折线图由图可知月份调整后的预测价格与实际价格间的空隙大大缩小,拟合更好。且经计算,月份调整前预测均方误差为 6.5,月份调整后预测均方误差为1.25,后者预测更为准确。3.事后预测根据式(3)对样本外 2016 年 6 月至 2017 年 3 月的股价变动额进行预测,累计加总得到结果
13、如下图,其中 PRICE 为实际股价,PRICEF 为预测股价。图 8 事后预测股价折线图由图可观察到预测股价与实际股价变动方向相反,前者明显比后者滞后一13个月,故再预测 2017 年 4 月的股价,然后将预测股价前移一阶,得到结果如下图,其中 PRICE 为实际股价,PRICEF 为月份调整后的预测股价。图 9 月份调整后事后预测股价折线图由图可知月份调整后的预测价格与实际价格变动方向一致,拟合更好。且经计算,月份调整前预测均方误差为 1.65,月份调整后预测均方误差为 0.42,后者预测更为准确。4.事前预测鉴于模拟预测和事后预测的经验,先用式(4)对 2017 年 4 月至 2017
14、年 9月的股价变动额进行预测,累计加总后前移一阶,得到预测值和在 95%置信水平下的置信区间及折线图,其中 PRICEF2 为预测股价,PRICEF2S.E.为置信区间上下限。表 10 事前预测值和置信区间下 限 上 限2017.3 2017.4 7.23 2.16 12.302017.4 2017.5 7.47 -0.47 15.422017.5 2017.6 8.30 -1.00 17.602017.6 2017.7 7.75 -2.23 17.732017.7 2017.8 7.96 -2.74 18.662017.8 2017.9 8.18 -3.19 19.55置 信 区 间预 测
15、值原 始 月 份调 整 月 份14图 10 事前预测股价折线图从预测值看,2017 年 4 月至 8 月股价总体呈上升趋势,上涨幅度小,基本在 8 元附近徘徊。置信区间范围较大,说明风险较高。区间下限都包含了负值,指导意义弱。六、总结本文构建 ARIMA(2,1,5)模型对绿地控股股价进行了预测,在模拟预测和事后预测中发现预测值有滞后性,前移一阶后有预测效果有所改进,但仍有明显误差。究其原因一方面可能是由于样本区间内有数据缺失,没有完整反映历史信息,另一方面可能是因为 2000 年和 2015 年左右出现大涨大跌,这类颇为反常的波动影响了模型定阶和参数估计,提高了其他年份估计的偏误。此外,在定阶过程中设定最高阶数为 5 阶,则可能遗漏更可靠的变量组合。在有条件的情况下,应收集更充足的数据,对数据有更细致的分析处理,对 ARIMA 模型构建有更多的讨论,同时还需要其他模型的对比,才能做出更好的预测。