1、中长期水文预报统计预报方法,梁忠民河海大学水文水资源学院,汇报内容提纲,Q,t,12月31日,12月31日,中长期水文预报提供未来一年以内的预报,旬月季年,未来一年总量预报,未来一年各季(或汛、枯期)预报,未来一年各月(或旬)预报,一、中长期水文预报基本需求,时间尺度,10月,2月,12月,4月,6月,8月,中长期水文预报提供未来一年以内的预报,定量,定性,提供具体数值。可在年初预报未来一年(旬、月、季、年),也可滚动预报未来一段时间(如3月报4月),提供预报量定性评价,如偏枯、偏丰或提供等级预报,如 V级,一、中长期水文预报基本需求,成果形式,气象水文资料,大气环流特征,高空气压场,海表温度
2、,地面观测,74项环流指数(逐月),北半球100hpa 、500hpa逐月平均高度场,北太平洋逐月海温场(SST),当地降雨、径流、蒸发、日照等,遥相关因子,本地相关因子,二、需要的基础资料,74项环流指数,可从中国国家气候中心下载,二、需要的基础资料,美国环境预报中心(NCEP)和美国国家大气研究中心(NCAR)提供1956年 以来的100hpa 和 500hpa 逐月平均高度场,资料范围从 0N80N,0E10W,网格距为经度 10纬度 10。,北半球 100hpa/500hpa 逐月平均高度场,二、需要的基础资料,美国国家海洋和大气局(NOAA)提供的北太平洋 1956 年以来的逐月海温
3、资料,资料范围从 50N10S,120E80W,网格距为经度 5纬度 5。,北太平洋海温资料,二、需要的基础资料,水文、地形、工程运行等资料,前期多年日、月降雨、气温、蒸发资料前期多年日、月径流、水位资料自然地理、地形资料水利工程特征参数及调度运行资料,二、需要的基础资料,三、常用预报方法简介,统计学方法,统计分析与水文模型耦合预报方法,方法分类,寻找预报变量与预报因子之间的统计关系,实现预报,时间序列或统计相关,水文模型,气象要素预报水文模型水文要素预报,(1)预报方法分类,大气物理模型,初始场、边界条件大气运动方程,数值天气预报产品,回归分析,时间序列,多元回归逐步回归门限回归。,统计方法
4、分类,传统统计方法,现代统计方法,自回归滑动平均类马尔科夫转移周期分析。,聚类/判别,模糊灰色混沌投影寻踪神经网络,小波分析随机森林贝叶斯预报支持向量机相关向量机。,三、常用预报方法简介,统计预测与水文模型耦合,水文集合预报,统计分析与水文模型耦合预报方法,率定确定性水文模型确定预报时刻系统初始状态构建模型输入集集合预报及统计分析,统计方法预测模型输入要素率定确定性水文模型耦合预报,三、常用预报方法简介,(1)方法简介多元回归类,通过成因分析找出影响预测对象的影响因素(因子),应用数理统计中的多元线性回归方法建立预报方案。,多元线性回归方程:,预报因子,基本思想,根据历史资料用最小二乘方法确定
5、,根据相关性分析和物理成因分析,回归系数,三、常用预报方法简介,逐步回归,门限回归,主成分回归,按相关性与贡献率的大小,逐步筛选与剔除相关因子,不同取值区间,建立不同的回归方程,消除因子间的相关成分,提取主成分,并以主成分为变量,建立回归方程,方 法,思 想,(1)方法简介多元回归类,三、常用预报方法简介,(2)方法简介时间序列(相关类模型),分析时间序列自身的相关特征,建立预报模型。,基本思想,分类,ARMA(p,q),例:AR(p)模型:,ARIMA(p,d,q),解集模型,正则展开模型,。,三、常用预报方法简介,(2)方法简介时间序列(AR(p)),模型阶数P确定,模型参数确定,AIC准
6、则确定,利用各阶相关系数计算模型系数,步骤,三、常用预报方法简介,(3)方法简介马尔可夫链,马尔可夫链是一种随机时间序列,预报对象在将来状态(xt+1)只与它现在的状态(xt )有关,而与过去的状态(x1,x2,xt-1)无关,称为无后效性,即,假设水文时间序列满足无后效性性要求,则可采用马尔可夫链对预报对象的未来状态进行定性预报。,三、常用预报方法简介,(3)方法简介马尔可夫链,pij 表示径流从状态i (i=1,2,3);一步转移到状态j (j=1,2,3)时的概率,如p11代表T月径流为枯时T+1月径流为枯的概率值,由转移频数矩阵可计算所有情形的转移概率,得到一步概率转换矩阵P(1);,
7、假定月径流状态分为枯、平、丰三种,分别记为1、2、3;预报因子为T月径流,预报对象为T+1月径流。,预报时,只要将T月径流的初始概率分布PT与P(1)相乘,便得到T+1月径流分别在枯、平、丰三种状态的概率分布PT+1 。,枯,三、常用预报方法简介,谐波分析是从频率域上分析水文时间序列内部结构的一种方法,其理论依据是任意水文时间序列可由不同频率的谐波(正弦波和余弦波组成)叠加而成。显著的谐波即为周期成分,其对应的频率的倒数为周期。,设水文时间序列Xt(t=1,2, ,n),其数学模型为:,式中:为Xt的均值;L为显著谐波的个数;aj,bj为第j个谐波的傅氏系数; Tj为第j个谐波的周期,Tj=n
8、/j ,其中:,(4)方法简介周期分析法(谐波分析),三、常用预报方法简介,通过假设检验可确定显著谐波的个数L,构造统计量:,根据分析出的周期进行外延,则可实现预报。,为序列的方差。根据给定的显著性水平,由F分布查得F。当FjF,则第j个谐波显著,其对应的周期就显著;反之则不显著。,三、常用预报方法简介,(5)方法简介BP神经网络,数据流前向计算,误差信号反向传播的多层前馈网络模型,基本思想,大气环流特征,高空气压场,海表温度,输入层,隐含层,输出层,降雨径流资料,选择传递函数,初始化权重和阈值,利用训练样本修正权重和阈值,完成机器学习 确定网络,预报降雨径流量,三、常用预报方法简介,(6)方
9、法简介聚类分析(系统聚类法),聚类分析就是按照某种相似性度量,将具有相似特征的样本归为一类,使得类内差异较小,而类间差异较大。获得新的样本之后,根据相似准则,将新样本归类,由该类特征进行预报。,三、常用预报方法简介,(7)方法简介聚类分析(随机森林法),特点:随机抽样+决策树。训练集:预报因子的观测样本,预报因子的属性值称为节点。自顶向下,在决策树的内部节点进行属性值的比较,并根据不同属性判断从该节点向下的分支走向,最后在决策树的末端得到分类或预测结果。,三、常用预报方法简介,(7)方法简介聚类分析(随机森林),随机森林,改进:一棵决策树只能得到一个预测结果,构建树群可以得到多个预测结果,多个
10、结果集成可以提高预测精度。关键:通过 Bootstrap随机抽样,形成决策树群(随机森林)。,三、常用预报方法简介,预报因子X,预报对象Y,将Y值分为m级,Y=Y1,Y2,Ym,获得新的预报因子值X,计算Yi出现的概率,再根据后验概率最大准则,可实现预报变量Y的定性(等级)预报。,(8)方法简介判别分析(贝叶斯判别),将预报对象Y的取值范围分成若干等级或区间(如丰、平、枯),计算预报值落入每个区间的可能性大小,取可能性最大的区间作为预报结果。,三、常用预报方法简介,(9)方法简介水文集合预报,实测数据:降雨、初始土壤含水量等,1950,1951,1952,2015,. .,1953,2014,
11、水文模型计算系统初始状态,1 2 3 12,3月11号,预报,4月10号,三、常用预报方法简介,(9)方法简介水文集合预报,Q(m/s),t(d),三、常用预报方法简介,四、应用示例简介,多元回归自回归马尔科夫链周期分析(谐波分析)随机森林统计分析与水文模型耦合水文集合预报,(1)以丹江口以上流域1月份的月降雨为例,四、应用示例简介(多元回归),预报因子选择,回归方程,汉口上游区1954-2013年1月份降雨量y和对应的各影响因子x数据,最小二乘法计算,四、应用示例简介(多元回归),(1)以丹江口以上流域1月份的月降雨为例,率定期(1954-2009):年降雨总量误差8.5%,汛期各月平均误差
12、约为20%40%验证期( 2010-2013 ):年降雨总量误差8%,汛期各月平均误差约为10%45%,四、应用示例简介(多元回归),(2)以丹江口以上流域径流量为例,率定期( 1984-2009 ):年降雨总量误差10.8%,汛期各月平均误差约为15%60%,年总量预报精度最高,枯季及汛期月份次之。验证期(2010-2013):年降雨总量误差13.5%,汛期各月平均误差约为14%50%,年总量预报精度最高,枯季及汛期月份次之。,四、应用示例简介(多元回归),(2)以丹江口以上流域径流量为例,2010年,2011年,2012年,2013年,阶数P=4,四、应用示例简介(自回归-AR(P)),(
13、3)以丹江口以上流域4月径流量为例,率定期:1955-2009验证期:2010-2013,AR(4)方程,验证期误差统计,四、应用示例简介(自回归-AR(P)),预报结果示意图,(3)以丹江口以上流域4月径流量为例,四、应用示例简介(马尔科夫链),(4)以丹江口水库9月报10月入库径流量为例,率定期:1951-2008 验证期:2009-2013,为fi,j为第i状态经一步转移为第j状态的频数,转移概率为,状态划分,转移矩阵计算,四、应用示例简介(马尔科夫链),(4)以丹江口水库9月报10月入库径流量为例,预测水平年与实际情况相符,9月报10月径流预报成果表,四、应用示例简介(谐波分析),则X
14、t的周期方程为:,(5)以丹江口水库1月径流量为例,率定期:1951-2009验证期:2010-2013,置信度: =0.05显著周期: 10、5年,周期成分1,周期成分2,采用上述方程,模拟19512009年1月径流量,其平均相对误差为24.4%;验证20102013年1月径流量,其平均相对误差为27.2%。,四、应用示例简介(谐波分析),四、应用示例简介(随机森林),(6)丹江口逐月径流预报预报因子:10项环流因子预报变量:逐月径流量,25棵决策树,率定期:19502009,验证期:19502009,读取训练数据,25,四、应用示例简介(随机森林),验证期逐月预报结果:,四、应用示例简介(
15、统计分析与水文模型耦合),(7)丹江口水库入库径流预报多元回归预测+SWAT,预报月降雨过程,日降雨过程,相似性原理,SWAT 水文模型,预报日/月径流过程,模型参数率定与验证,率定期:1995-2005验证期:2006-2011,多元线性回归模型,2012年月降雨预报,预报结果分析,选择预报因子确定回归系数模型构建与验证,最小距离原则:,月降雨统计预报模型(多元线性回归方程),预报因子选择,回归方程,最小二乘法计算回归系数,以汉江上游区 1 月份的月降雨为例,模型验证,四、应用示例简介(统计分析与水文模型耦合),月降雨日降雨过程,根据由欧氏距离构建的相似性度量函数,选择相似的典型月份的逐日降
16、雨过程:,日径流过程预报、月径流量统计,缩放,计算同倍比缩放系数,对典型降雨逐日过程缩放:,各月缩放系数式中i=112,预报年份逐日降雨量预报,四、应用示例简介(统计分析与水文模型耦合),径流预测(以2012年为例),以2012年为例,采用多元回归预测月降雨、采用相似性理论推求日降雨,采用swat模型进行径流预测。,降雨预报及实测,径流预报及实测,四、应用示例简介(统计分析与水文模型耦合),(8)丹江口水库入库径流集合预报(李岩等,2008水文),预报:2007年10月份3个旬的径流量水文模型:三水源新安江模型降雨和流量集合: 1979- 2006 年 10 月1 日30 日,四、应用示例简介
17、(水文集合预报),未来预报降雨信息如何使用,多种预报结果如何选取与综合,预报不确定性定量评估,主要问题,1,2,3,4,各种模型预报结果,欧洲、日本、中国预测降雨产品,五、存在问题及研究重点,(1)未来数值天气预报产品应用,五、存在问题及研究重点,水文集合预报系统流程图(HEPEX),实测值,地面资料同化器,天气与气候预报,天气集合预处理器,成果与服务,输出生产器,水文集合(预报)处理器,水文模型,集合初始条件,单值或集合预报,可靠的水文输入,集合预报,可靠的水文成果,引自丛树铮水科学技术中的概率统计方法,(2)多种预报成果的寻优与综合技术,1,2,3,4,1,2,3,4,综合结果,各种模型预报结果,多预报模型结果综合,五、存在问题及研究重点,基于贝叶斯理论的多模型预报成果的综合技术(BMA)通过对预报信息与实测信息的似然程度分析,构建一种自动赋权的多预报成果综合技术。,预报不确定性估计,未来输入不确定性估计PUP,水文不确定性估计(模型结构+模型参数)HUP,综合不确定性处理器 INT,五、存在问题及研究重点,(3)预报结果不确定性分析- 借鉴美国BFS洪水预报系统思想,总不确定性评估,t,预报时刻t0,tm,预报结果,预报置信区间,谢谢!,联系方式:梁忠民 河海大学水文水资源学院,210098,南京Tel 025-83786475, 13951645871 email: ,