1、 灰色预测模型理论及其应用灰色系统理论认为对既含有已知信息又含有未知或非确定信息的系统进行预测,就是对在一定方位内变化的、与时间有关的灰色过程的预测. 尽管过程中所显示的现象是随机的、杂乱无章的,但毕竟是有序的、有界的,因此这一数据集合具备潜在的规律,灰色预测就是利用这种规律建立灰色模型对灰色系统进行预测. 灰色预测模型只需要较少的观测数据即可,这和时间序列分析,多元回归分析等需要较多数据的统计模型不一样. 因此,对于只有少量观测数据的项目来说,灰色预测是一种有用的工具.本文主要围绕灰色预测 GM(1,1)模型及其应用进行展开。一、灰色系统及灰色预测的概念1.1 灰色系统灰色系统产生于控制理论
2、的研究中。若一个系统的内部特征是完全已知的,即系统的信息是充足完全的,我们称之为白色系统。若一个系统的内部信息是一无所知,一团漆黑,只能从它同外部的联系来观测研究,这种系统便是黑色系统。灰色系统介于二者之间,灰色系统的一部分信息是已知的,一部分是未知的。区别白色和灰色系统的重要标志是系统各因素间是否有确定的关系。特点:灰色系统理论以“部分信息已知、部分信息未知”的 “小样本” 、 “贫信息”不确定型系统的研究对象。1.2 灰色预测灰色系统分析方法是通过鉴别系统因素之间发展趋势的相似或相异程度,即进行关联度分析,并通过对原始数据的生成处理来寻求系统变动的规律。生成数据序列有较强的规律性,可以用它
3、来建立相应的微分方程模型,从而预测事物未来的发展趋势和未来状态。灰色预测是用灰色模型 GM(1,1)来进行定量分析的,通常分为以下几类:(1) 灰色时间序列预测。用等时距观测到的反映预测对象特征的一系列数量(如产量、销量、人口数量、存款数量、利率等)构造灰色预测模型,预测未来某一时刻的特征量,或者达到某特征量的时间。(2) 畸变预测(灾变预测) 。通过模型预测异常值出现的时刻,预测异常值什么时候出现在特定时区内。(3) 波形预测,或称为拓扑预测,它是通过灰色模型预测事物未来变动的轨迹。(4) 系统预测,是对系统行为特征指标建立一族相互关联的灰色预测理论模型,在预测系统整体变化的同时,预测系统各
4、个环节的变化。上述灰预测方法的共同特点是:(1)允许少数据预测;(2)允许对灰因果律事件进行预测,比如灰因白果律事件:在粮食生产预测中,影响粮食生产的因子很多,多到无法枚举,故为灰因,然而粮食产量却是具体的,故为白果。粮食预测即为灰因白果律事件预测。白因灰果律事件 :在开发项目前景预测时,开发项目的投入是具体的,为白因,而项目的效益暂时不很清楚,为灰果。项目前景预测即为灰因白果律事件预测。(3)具有可检验性,包括:建模可行性的级比检验(事前检验) ,建模精度检验(模型检验) ,预测的滚动检验(预测检验) 。二、GM (1,1)模型2.1GM(1,1)模型GM(1,1)模型是基于灰色系统的理论思
5、想,将离散变量连续化,用微分方程代替差分方程,按时间累加后所形成的新的时间序列呈现的规律可用一阶线性微分方程的解来逼近,用生成数序列代替原始时间序列,弱化原始时间序列的随机性,这样可以对变化过程作较长时间的描述,进而建立微分方程形式的模型. 其建模的实质是建立微分方程的系数,将时间序列转化为微分方程,通过灰色微分方程可以建立抽象系统的发展模型. 经证明,经一阶线性微分方程的解逼近所揭示的原始时间数列呈指数变化规律时,灰色预测 GM(1,1)模型的预测将是非常成功的. 2.2GM(1,1)模型的建立GM(1,1)模型是指一阶,一个变量的微分方案预测模型,是一阶单序列的线性动态模型,用于时间序列预
6、测的离散形式的微分方程模型.模型符号含义为G M (1, 1)Grey Model 1 阶方程 1 个变量设时间序列 有 个观察值, ,为了使其成为0Xn000,2,Xxxn有规律的时间序列数据,对其作一次累加生成运算,即令 101tnx从而得到新的生成数列 , ,称1X11,2,xn(0)(1)xkab为 GM(1,1)模型的原始形式。新的生成数列 一般近似地服从指数规律. 则生成的离散形式的微分方程具体的形式为1Xdxaut即表示变量对于时间的一阶微分方程是连续的. 求解上述微分方程,解为 (1)()atuxtce当 =1 时, ,即 ,则可根据上述公式得到离散形式微分方程的具体t()1x
7、tuc形式为 1atuxte其中, 项中的 为 的背景值,也称初始值; , 是待识别的灰色参数, 为发展axdt a系数,反映 的发展趋势; 为灰色作用量,反映数据间的变化关系. u按白化导数定义有0()(limtdxtxA显然,当时间密化值定义为 1 时,当 时,则上式可记为11li()(tdxtxA这表明 是一次累减生成的,因此该式可以改写为dxt (1)(1)dxtxtt当 足够小时,变量 从 到 是不会出现突变的,所以取 与tA()tA()xt的平均值作为当 足够小时的背景值,即 (紧邻均()xtA(1)(1)(1)2xt值(MEAN)生成序列)将其值带入式子,整理得(GM(1,1)模
8、型的均值形式)(0) (1)(1)2xtaxttu由其离散形式可得到如下矩阵: (1)(1)(0) ()()(0) (1)(1)22332xxaunxn 令 (0)()(0),3,TYx (1)(1)()()(1)(1)2232xBxnTau称 为数据向量, 为数据矩阵, 为参数向量. 则上式可简化为线性模型:YBYB由最小二乘估计方法得 1Tau上式即为 GM(1,1)参数 的矩阵辨识算式,式中 事实上是数据矩阵 的广,a1TBYB义逆矩阵. 将求得的 , 值代入微分方程的解式,则u(1)(1)(1)atuxte其中,上式是 GM(1,1)模型的时间响应函数形式,将它离散化得 (1)(0)(
9、1)atuxte对序列 再作累减生成可进行预测. 即1xt (0)(1)(1)(0) (1)atxttxtue上式便是 GM(1,1)模型的预测的具体计算式. 2.3 GM(1,1)模型的检验GM(1,1)模型的检验包括残差检验、关联度检验、后验差检验三种形式. 每种检验对应不同功能:残差检验属于算术检验,对模型值和实际值的误差进行逐点检验;关联度检验属于几何检验范围,通过考察模型曲线与建模序列曲线的几何相似程度进行检验,关联度越大模型越好;后验差检验属于统计检验,对残差分布的统计特性进行检验,衡量灰色模型的精度. 残差检验残差大小检验,即对模型值和实际值的残差进行逐点检验. 设模拟值的残差序
10、列为 ,则(0)et(0)(0)(0)txtt令 为残差相对值,即残差百分比为()t (0)(0)%xttt令 为平均残差, . 1()nt一般要求 ,最好是 ,符合要求.20%t10t 关联度检验关联度是用来定量描述各变化过程之间的差别. 关联系数越大,说明预测值和实际值越接近. 设 (0)(0)()(0)1,2,Xtxxn(0)(0)()(0),t序列关联系数定义为式中, 为第 个点 和 的绝对误差, 为第 个数据的关联系数,(0)(0)xtt(0)x()()t称为分辨率,即取定的最大差百分比, ,一般取 . 05和 的关联度为(0)xt(0)t(0)(0) (0)(0)minmax,1
11、,xttttt t 1ntr关联度大于 60%便满意了,原始数据与预测数据关联度越大,模型越好. 后验差检验后验差检验,即对残差分布的统计特性进行检验. 检验步骤如下:1、计算原始时间数列 的均值和方差0()(0)(0)1,2,Xxxn 2(0)(0)2(0)11,nt txSt2、计算残差数列 的均值 和方差(0)()(0)(0),een e2s2(0)2(0)11,nt tSt其中 为残差数列. (0)(0)(0),etxttn3、计算后验差比值 21CS4、计算小误差频率 (0) 1.6745PetS令 =0.6745 , ,即 . 0S1(0)|tt0()Pt若对给定的 ,当 时,称模
12、型为方差比合格模型;若对给定的0C0,当 时,称模型为小残差概率合格模型. 0PPC模型精度0.95 0.80 0.70 0.65 不合格表 3 后验差检验判别参照表2.3 GM(1,1)模型修正(残差 GM(1,1)模型) 当原始数据序列 建立的 GM(1,1)模型检验不合格时,可以用 GM(1,1)残差模型来(0)X修正. 如果原始序列建立的 GM(1,1)模型不够精确,也可以用 GM(1,1)残差模型来提高精度. 若用原始序列 建立的 GM(1,1)模型(0)(1)(0)1atuxtxe可获得生成序列 的预测值,定义残差序列 . 若取 k=t, t+1, (1)X(0)(1)(1)kxk
13、, n,则对应的残差序列为 (0)(0)()(0)1,2,eken计算其生成序列 ,并据此建立相应的 GM(1,1)模型(1)(1)(0)1eakuete得修正模型 (1)(0) (0)1()1eakakeuuxtxeta其中 为修正参数. ()0ktkt三、GM (1,1)模型的应用表 1 南昌市民用汽车保有量年份 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013南昌市民用汽车保有量(万辆)24.4109 26.7307 30.3878 36.3807 41.0161 43.73 48.41 61 57 63.1第一步:构造累加生成序列 X(
14、1); (1)()(1)()(1)(1)()(1)()(1)(),2,3,45,6,7,89,05.468.97.08.920.52.063.26.2.09Xxxxxx, , , 432.16第二步:计算系数值;对 做紧邻均值生成. 令 ,得(1) (1)(1)(1).5.Zkxk (1)()(1)()(1)()(1)(1)(1)(1)2,3,4,6,789,037.65.9.78.0.92,.6,.5234.6,.1Zzzzzz , , , ,则数据矩阵 及数据向量 为BY, (1)(1)(1)(1)-3.625129.74-845=0.12667-.58349zzBz 0.1 (0)(0)
15、(0)(0).70386.41.78653.91xxYx对参数列 进行最小二乘估计,得,Tau10.162459() ,TT TBYau即 ,.a.u= -0.101624 , =25.290111 , 平均相对误差为 4.685749%第三步:得出时间响应预测函数模型为: 8596.242698.7311064.1 kekX第四步:进行灰色关联度检验。真实值:24.4109,26.7307,30.3878,36.3807,41.0161,43.7300,48.4100,61.0000,57.0000,63.1000预测值:24.4109,29.2310,32.3578,35.8190,39.
16、6504,43.8917,48.5867,53.7839,59.5371,65.9056计算得到关联系数为:1,0.906683,0.444273,0.416579,0.82377,0.357133,0.715694,0.843178,0.333333,0.770986 于是灰色关联度:r=0.661163关联度 r=0.661163 满足分辨率 =0.5 时的检验准则 r0.60,关联性检验通过。第五步:后验差检验。计算真实值的均值与标准差: 0254.1,26.430SX计算残差的均值和标准差: 3.95.12,于是方差比 C=S 2/S1=0.32890.35S0=0.6745*S1=9
17、.4601 8761.0,.,286.5,7.1,6.,538.0,67.,4.,578.,9.1ke所有 都小于 S0,故小误差概率 ,又 C0.35ke 0SepPi所以后验差检验通过。第六步:残差检验。(1)得到模拟值、残差和相对误差如下:序号 模拟值 残差 相对误差(%)1 24.4109 0 02 29.230986 2.500286 9.3536123 32.357751 1.969951 6.4827044 35.818976 -.561724 -1.5440165 39.650442 -1.365658 -3.3295666 43.891749 .161749 .3698817
18、 48.586737 .176737 .3650848 53.783938 -7.216062 -11.829619 59.537068 2.537068 4.45099610 65.905597 2.805597 4.446271相对误差序列中有的相对误差很大,所以要对原模型 8596.242698.7311064.1 kekX进行残差修正,以提高精度。(2)利用残差对原模型进行修正:我们取2.500286,1.969951,0.561724,1.365658,0.161749 0e,0.176737,7.216062,2.537068,2.805597同样的可求得 = -0.183488
19、, =0.481549 则有624.124706.5 624.1834. 1834.001 kkneeake对上述求导,得: keke 1834.019.这样就得到经过残差修正后的灰色预测 GM(1,1)模型: 8596.242698.7311064.1 kekXkk183.0.其中: 为修正系数(k=0,1,2,) 。,01kk修正后,精度有所提高。修正后的残差计算见下表:序号 k修正灰色预测 kX1年份 kX1相对误差0 24.4109 2004 24.4109 01 53.64180846 2005 51.1416 0.0488879592 87.35665908 2006 81.529
20、4 0.0714743283 123.448862 2007 117.9101138 0.0469743264 163.4275582 2008 158.9262074 0.0283235275 207.7136735 2009 202.6562074 0.0249558916 256.7742061 2010 251.0662074 0.0227350347 311.1273655 2011 312.0662074 -0.003008478 371.3483035 2012 369.0662074 0.0061834339 438.0755103 2013 432.1662074 0.013673681因此,可用上述经过残差修正后的灰色模型来预测 2014 年及 2020 年南昌市民用汽车保有量的估计值: 075.4389,81Xk1.2,1于是得到 2014 年南昌市民用汽车保有量的预测值为(万辆)945.73101X同理可以得到 2020 年南昌市民用汽车保有量的预测值为 137.2035 万辆。