1、基于 ARMA-ARCH 模型的风电场风速预测研究何育,陈冀,赵磊(东南大学,江苏 南京 210089)摘 要:风速预测对风电场规划设计和电力系统的运行都具有重要意义。对采样时间为 15min 的风速时间序列建立 ARMA(自回归移动平均)模型,利用拉格朗日乘数法检验 ARMA 模型残差的 ARCH(自回归条件异方差 )效应,建立ARMA-ARCH 模型。分别使用 ARMA 模型和 ARMA-ARCH 模型对风速时间序列进行短期预测,并比较两者精度。结果表明,ARMA-ARCH 模型具有更高的预测精度,具有一定的实用价值。关键词:短期风速预测;ARMA 模型;ARCH 效应;波动集聚;MLE1
2、、引言风能是世界上增长最快的可再生能源,装机容量每年增长超过 30%。根据政府计划,到 2020 年我国风电的装机容量将达到 30GW1。目前,国内外对于风力发电各种课题的研究越来越深入和广泛,但其中关于风电场风速预测以及风力发电功率预测的研究还不能达到令人满意的程度,我国在这方面研究工作还不够深入。目前,风电场短期风速预测的绝对平均误差在 25%40%左右,这不仅与预测的方法有关,还与风速特性有关 2。由于风电具有很强的不可控性,所以风电穿透功率超过一定值之后,会严重影响电能质量和电力系统运行,主要表现在电压和频率会有较大幅度的波动。中国电力科学院指出:一般情况下,我国电网在风电穿透功率不超
3、过 8%时不会出现较大的技术问题 3。如果对风速和风力发电功率预测比较准确,则有利于风电场的规划与设计,有利于调整电力系统的调度计划,从而有效减轻风电对整个电网的不利影响,减少电力系统运行成本和旋转备用,提高风电穿透功率极限。所以,风速的准确预测对于负荷管理和系统运行十分重要。风速受很多因素的影响,如温度、气压、地形等,这就使它表现出很强的随机性,从而使预测很难达到令人满意的精度。目前,风速预测的方法主要有持续预测法、卡尔曼滤波法、时间序列法、人工神经网络法、模糊逻辑法、空间相关性法 4。本文主要采用时间序列法中的 ARMA 模型和 ARMA-ARCH 模型进行短期风速预测。2、ARMA-AR
4、CH 建模基本原理2.1 ARMA 模型ARMA模型是一类常用的随机时间序列模型,其基本思想是:某些时间序列是依赖于时间t的一族随机变量,构成该时序的单个序列值虽然具有不确定性,但整个序列的变化却有一定的规律性,可以用相应的数学模型近似描述 5。ARMA(p,q)模型的形式如下:(1)()()ttBy其中, 为观测到的序列值; 、 为滞后多项式, 为Y 的均值 。 tyB为有零均值和恒定方差的不相关随机误差项( 是白噪声)t t式(1)的平稳条件是滞后多项式 的根在单位圆外,可逆条件为 的根()()B在单位圆外。ARMA模型对时间序列的平稳性有要求。在建模之前,要对风速时间序列作平稳性检验。2
5、.2 平稳性检验利用序列的自相关分析图判断时间序列的平稳性,但是一般认为这种方法比较粗略。而单位根检验是检验时间序列平稳性的一种比较正式的方法。单位根检验的方法有DF检验、ADF检验、PP检验、Said-Dickey检验、DF-GLS检验等。本文只介绍实例分析中所用的ADF检验。ADF检验又称增广DF 检验( Augment Dickey Fuller),检验方程为:(2)11221ttttptpttyyy在实际操作中,式(2)中的参数 视具体情况而定,一般选择能保证 是t白噪声的最小的 值。为了协助判断 值,常常借用一些信息准则,最著名的p有赤池信息准则(AIC),许瓦兹信息准则(SIC)
6、。2.3 自回归条件异方差(ARCH)模型一些时间序列常表现出波动(Volatility Cluster)的现象,在一段时期内,其表现出大幅波动,然后又会在下一段时期内保持相对稳定。这就说明此时间序列的方差也在随时间而变化。恩格尔(Robert F.Engle)80年代开创性地提出了自回归条件异方差(Autoregressive Conditional Heteroscedasticity)模型(简称ARCH模型)2.3.1 ARCH模型ARCH模型通常可用于时间序列模型的随机扰动项建模。模型的均值方程为:(3)tttyX式中: ; 为 的条件方差。tthvtt2201ttqt 22001()
7、qit tB服从正态独立分布; 为滞后算子多项式。tv()B同时满足非负约束条件: ;二阶平稳约束条件:0,i的特征根均在单位圆外。1()L如满足上述条件,称 服从ARCH(q)过程。t2.3.2 ARCH效应检验判断一个时间序列是否存在ARCH效应的方法有拉格朗日乘数法(LM) 、BDS检验法,其中最常用的是LM检验。LM检验的一般流程如下:建立辅助回归方程:(4)2201ttqth通过检验式(3)中所有回归系数是否同时为零来判断序列是否存在ARCH效应。检验统计量为:(5)2LMnR( q)式中: 为的样本容量; 为决定系数。统计量 依分布收敛于自由度为n LM的 的分布。q22.3.3
8、ARCH模型参数估计模型参数的估计方法通常主要有两大类:极大似然估计(MLE)和矩估计(ME) 。一般来说,在似然函数可求的情况下,多倾向于采用MLE。本文也采用这种估计方法。通过下式的最大化条件似然函数可以得到ARCH模型的参数估计:(6)211()ln2lTTtttLh本文实证部分采用BHHH算法实现MLE.3、算例分析在检验风速时间序列的平稳性的基础上,建立ARMA模型;然后利用LM检验分析ARMA 模型的残差是ARCH效应存在性,在此基础上建立 ARMA-ARCH模型并进行预测;并奖预测结果与常规ARMA模型作比较。3.1 数据选用某风电场测风点2007年10月2日至2007年10月1
9、4日的风速实测数据作为研究对象。测风点每隔15min对风速采样,每天得到96个数据,共1248个数据。选取的样本空间为10月2日到10月13日,共1152个数据,并用所建的模型对10月14日的风速数据进行预测,以检验模型的预测能力。3.2 平稳性检验时间序列的平稳性是建立ARMA模型的前提。本文采用 ADF检验。实际操作中,可根据一定的标准选择可以保证 是白噪声过程的最小的p值。本文根据t赤池信息准则AIC,选定滞后阶数为 4阶。表 1 ADF 检验结果ADF 1% 5% 10%t-Statistic -6.206 -3.436 -2.864 -2.568 Prob. 0.0000 由表1可见
10、,风速时间序列ADF检验统计量甚至小于 1%的显著水平的临界值,所以,在95% 置信水平下有理由拒绝原假设,即本序列是平稳的,满足ARMA建模的前提条件。3.3 建立 ARMA 模型本文根据时间序列的自相关、偏相关函数分析图,初步确定偏相关1,2,3阶,自相关1,2,3,4,5,6,7,8,9,10,11阶为ARMA模型的可选阶数。进一步根据拟合优度 、赤池信息准则AIC、施瓦茨信息准则SIC、DW统2R计量、AR根是否在单位圆内进一步确定ARMA模型的阶数。一般认为,SIC准则是强一致的,在理论层面上能够渐进地选择真实模型。所以,当几个模型都是非劣的时候,本文采用SIC准则选择最合适的阶数。
11、本文选择ARMA(1,10)模型作为风速时间序列的最终模型。模型方程如下:(7)11010.821.9430.52934.683(56)(7)(8)(25)t tt tyy3.4 风速时间序列的 ARCH 效应分析与建模3.4.1 残差的ARCH效应分析下面对ARMA(1,10)模型的残差进行LM检验,以证实 ARCH效应的存在。ARCH(2)(经过比较,LM检验阶数取为2)效应检验结果如下:表 2 ARCH(2)效应 LM 检验结果Prob.F 37.33499 0.00000 2R70.28583 0.00000 LM统计量以及检验的相伴概率用以判断是否存在ARCH效应。ARMA模型的LM
12、值为70.28583, 检验的相伴概率P值为0,明显小于显著性水平 ,2 0.5所以有理由拒绝LM检验回归方程系数为零的原假设,即ARMA模型的残差序列ARCH(2)是显著的。3.4.2 建立ARMA-ARCH模型ARMA-ARCH 模型ARMA 部分的定阶方法我们采用的是 “从一般到简单”思路,所谓“从一般到简单”是指从一般非约束模型开始,通过每次去除一个系数最不显著的变量来缩减模型。本文选用ARMA(1,1)-ARCH(2)作为最终的预测模型。ARMA-ARCH 模型方程如下:ARMA部分(均值方程):(8)110.9372.6830.594(5)(7)(26)tt tyy条件方差方程:(
13、9)22210.6453.790.63(18)()(78)t tt3.5 预测分别使用ARMA模型和ARMA-ARCH 模型进行样本外预测,将 10月14日的预测数据与实测值比较,计算预测绝对平均误差。其预测能力比较如表3,绘制预测曲线如图1:表3 预测能力对比模型 绝对平均误差 偏度 方差ARMA 31.11% 0.029677 0.167012ARMA-ARCH 30.09% 0.009122 0.134312图1 预测结果通过表3和图1的比较,可以看出:1)从两种模型的绝对平均误差指标上看,都处于25%40%之间,预测结果比较满意。ARMA-ARCH 模型略优于ARMA 模型。2)由于风
14、速时间序列的方差时变的,而ARCH模型正是为解决这一类问题而提出的,从两种模型的方差指标中可以看出。3)对比两种模型的最大预测误差,ARMA-ARCH模型有一定优势,其背景是因为该最大误差正是在波动集聚的状态下出现的。4、结语本文使用ARMA-ARCH模型对风速进行了短期预测。通过与经典的ARMA模型的比较,本文提出的模型显示了比较满意的预测能力。由于风速时间序列具有群集波动的现象,其方差随着时间而变化,这与经典的ARMA模型所假设的同方差不相符。而ARCH模型正是在“变动着的方差”的基础上提出的,具有一定的理论优势。但是,当ARCH模型阶数过高时,会存在参数估计困难等一系列问题。这种情况下,
15、可以考虑使用广义自回归条件异方差(GARCH) 。总之,ARMA-ARCH模型为风速预测提供了一种可行的方法,实际预测能力比较令人满意。参考文献:1 李俊峰,时璟丽,施鹏飞,喻捷.风力12在中国M.北京:化学工业出版社,20052 肖洋.风电场风速和发电功率预测研究D. 吉林:东北电力大学,20053 杨秀媛,肖洋,陈树勇.风电场风速和发电功率预测研究J ,中国电机工程学报,4 吴国旸,肖洋,翁莎莎.风电场短期风速预测探讨J,吉林电力,2005, (6):21-245 陈昊.非经典计量经济学在负荷预测中的应用研究D.南京:东南大学,20056 CHEN Hao, A Study of Auto
16、regressive Conditional Heteroscedasticity Model in Load Forecasting, Powercon2006, Chongqing, 20067 徐孝纯.关于我国发展风电的现状和预测,未来与发展,2006, (9):17-198 丁明,张立军,吴义纯.基于时间序列分析的风电场风速预测模型,电力自动化设备,2005,25(8):32-349 张世英,樊智 .协整理论与波动模型.北京:清华大学出版社,200410 Tasy R S. Analysis of Financial Time SeriesM.New York: Wiley, 2002
17、.11 R. Engle, “Autoregressive conditional heteroscedasticity with estimate of thevariance of U.K. inflation”. Econometrica, 50, pp.987-1008, 1982. 12 J. Fan and Q. Yao, Nonlinear time series: Nonparametric and Parametric MethodsM,Springer-Verlag New York, 200313 T. Bollerslev, R. F. Engle, and D. B.
18、 Nelson ARCH models,Prepared for The Handbook of Econometrics, Volume 4,199414 Hamilton J D. Time Series AnalysisM. Princeton: Princeton University Press,1994._作者简介何育(1984- ) ,男,江苏盐城人,汉族,硕士,主要研究方向为负荷预测、非线性时间序列分析。Email:;陈冀(1985-) ,男,江苏盐城人,汉族,硕士,主要研究方向为概率论与数理统计;赵磊(1982-)男,江苏徐州人,汉族,硕士,主要研究方向为为负荷预测、非线性时间序列分析。