1、1雨量预报方法的评价模型庄丽丽、燕巧、冯琳(指导教师钱浩韵等)摘要要评价两种预测方法的准确性,就要在相同地点、相同时段对预报值和实测值进行比较,本文首先针对这一问题,采用 kNN 方法对数据进行压缩,将 2491 个网格点的预报值变为 91 个观测站点的预报值;在问题一中,我们采用绝对误差的大小,平均值大小来评价两种预报方法准确性的好坏;在问题二中我们通过求公众对预报结果满意度之和(或每个时段的满意度之和)的方法评价两种预报方法的准确性。由问题一和问题二所得出结果可知,两种预测方法各有各的优点和缺点,我们可以根据实际情况,选择较佳的预测方法。我们应用 MATLAB 软件编程,处理数据并求解结果
2、。检验结果表明两种预测方法所得的结果相差不大。但我们可以利用相差不大的数据得出我们实际情况所需的较佳预测方法。2一 问题重述雨量预报对农业生产和城市工作和生活有重要作用,但准确、及时地对雨量作出预报是一个十分困难的问题,广受世界各国关注。我国某地气象台和气象研究所正在研究6 小时雨量预报方法,即每天晚上 20 点预报从 21 点开始的 4 个时段(21 点至次日 3 点,次日 3 点至 9 点,9 点至 15 点,15 点至 21 点)在某些位置的雨量,这些位置位于东经120 度、北纬 32 度附近的 5347 的等距网格点上。同时设立 91 个观测站点实测这些时段的实际雨量,由于各种条件的限
3、制,站点的设置是不均匀的。气象部门希望建立一种科学评价预报方法好坏的数学模型与方法。气象部门提供了41 天的用两种不同方法的预报数据和相应的实测数据。MEASURING 中包含了 41 个名为.SIX 的文件,如 020618.SIX 表示 2002 年 6 月18 日晚上 21 点开始的连续 4 个时段各站点的实测数据(雨量) ,这些文件的数据格式是:站号 纬度 经度 第 1 段 第 2 段 第 3 段 第 4 段 58138 32.9833 118.5167 0.0000 0.2000 10.1000 3.100058139 33.3000 118.8500 0.0000 0.0000 4
4、.6000 7.400058141 33.6667 119.2667 0.0000 0.0000 1.1000 1.400058143 33.8000 119.8000 0.0000 0.0000 0.0000 1.800058146 33.4833 119.8167 0.0000 0.0000 1.5000 1.9000雨量用毫米做单位,小于 0.1 毫米视为无雨。(1) 请建立数学模型来评价两种 6 小时雨量预报方法的准确性;(2) 气象部门将 6 小时降雨量分为 6 等:0.12.5 毫米为小雨,2.66 毫米为中雨, 6.112 毫米为大雨,12.125 毫米为暴雨,25.160 毫米
5、为大暴雨,大于 60.1 毫米为特大暴雨。若按此分级向公众预报,如何在评价方法中考虑公众的感受?3二 符号说明: 表示第 种预报方法,gg2,1g: 表示第 种预报方法预测第 天、第 个时段、第 个站点雨量值, Jgijkgjki 2,1g91,241,2j 4,32: 第 天、第 个时段、第 个站点的实测值 , Sijkjki 91,2i 41,2j4,321: 第 种预报方法在第 天、第 个时段、第 个站点的绝对误差cgijk jki2,191,i 41,2j 4,32, cmijkijijijijk211,0, ,j ,1k: 第一种预报方法比第二种预报方法更准确的次数所占的比例h1特
6、大 暴 雨大 暴 雨暴 雨大 雨中 雨小 雨无 雨,1.60,25,.,43,6.,5.210,)(xxxyjx(绝对误差的平均值) : 91 个站点在 41 天内,每个时段绝对误差的cgijk4平均值。(绝对误差的最大值) :91 个站点在 41 天内,每个时段绝对误差的最cgijkjimax41,9,1 大值。(绝对误差的最大值) :91 个站点在 41 天内每个时段绝对误差的最大gijkjin41,1 :公众对第 种方法预测的第 个观测点、第 天、第 个时段结果满意度gijk ijk:雨量 转化成的雨级数xran三 模型假设) 假设雨量小于 0.1 毫米时视为无雨;) 假设经纬度线所构成
7、的图形是矩形;) 假设在任意时段内每个测点的雨量分布是均匀的;) 假设无雨日不参加评定。) 相差相同的绝对雨级,公众的感受一样) 假设公众满意时的不满意度为 0,不满意度的极限为 1四 问题分析雨量预报方法的好坏直接影响到预报结果的准确程度,从而在一定程度上影响了人们的日常生活和工作。因此怎样检验预报方法的准确度是我们要解决的问题。由于此题所给的数据相当大,计算起来较麻烦,所以首先我们对数据做了压缩,由于只有 91 个实测值,所以我们把 2491 个要预报雨量的网格点向 91 个观测站点进行转化,可以用 kNN 方法,二维插值法等。在处理数据 k 时,我们可以运用以下方法:)正三角形标准,求出
8、正三角形顶点处的三个点,正三角形内部和三条边上的点,再根据实际情况取适当的边长。)以正方形为标准:求出正方形顶点处的四个点,)以正六边形为标准:求出正六边形顶点处的六个点5)以实测点为圆心,R 为半径作圆,算出这个圆内预测点的个数,根据实际情况使 R 取恰当的值,对 R 进行调试。)以实测点为中心,作矩形,在这个矩形内算出预测点的个数,再根据实际情况取适当的长 a 和宽 b。经过分析和观测数据,最后我们选择 kNN 方法找出离观测站点最近的 k 个点,再求出这 k 个点的平均值作为相应观测站点的预测值,根据实际情况,地球上经线之间的距离与纬线之间的距离是不相等的,四个节点和它们之间的线段构成了
9、一个矩形,所以我们选择了 K_NN 方法来处理数据,最终得到 91 个与实测点对应的预测点。通过观察分析数据我们作出 91 个观测点在所给区域内的分布图,如图 1 所示:图 1我们还可以作出 91 个点组成的雨量在记录的 41 天内各个时段的分布图,如下图所示:6要比较两种预测方法的准确性,我们可以通过比较同一地点在同一天的同一时段的实测数据与预测数据的绝对误差来实现。我们可以把第一种预报方法比第二种预报方法更准确的次数的累计和求出来,除以(41*4*91) ,再用这些所得数据与 进行比较,若21大于 ,则说明第一种预测方法比第二种预测方法准确;若小于 ,则说明第二种预测21方法比第一种预测方
10、法准确性好。我们还可以通过比较预报的准确率来说明哪一种预测方法比较好。我们把公众的感受用实测雨级与预报雨级的绝对差来表示,并对其赋予权重,如表格(2):雨级绝对误差 公众的满意度0 11 0.52 0.253 0.1254 0.06255 0.032257通过比较公众对预报结果的满意度来说明哪种预报方法的准确性较好。五 问题一: 模型的建立分析与求解根据上面的分析与假设,我们可以建立如下模型:模型一 : 91*4914ijkijkgijgijkSJc2,1,Jgijkijjigjkji maxa41,9141,91 4,321k,Scgijkijjigjkji n41,9141,91 ,: 表
11、示绝对误差的平均值gijk:表示绝对误差的最大值cgijkjiax41,9,1 表示绝对误差的最小值。gijkjimn41,1模型一求解:我们利用 MATLAB 软件,输入数据,对模型进行求解,得到我们所需要的数据,这些数据如下表(3)所示:绝对误差(第一种预测方法) 绝对误差(第二种预测方法)时段 平均值 最大值 最小值 平均值 最大值 最小值一 1.8780 13.5141 0 1.8712 13.6561 0二 2.4936 19.6291 0 2.4880 19.7155 0三 2.1391 16.0223 0 2.1426 16.1509 0四 2.0347 10.8566 0 1.
12、9124 10.9840 08观察上述表格中的数据,单从绝对误差的平均值来看,我们可以得到下述结果:在第一个时段内,第二种方法比第一种方法精确;在第二个时段内,第二种方法比第一种方法精确;在第三个时段内,第一种方法比第二种方法精确;在第四个时段内,第二种方法比第一种方法精确。综上所述,可以得到结论:不能笼统的说明一种方法是好还是不好,我们要在具体情况下的具体时段来说明。在第一,二,四时段内,预测时要尽可能应用第二种方法;而在第三时段内,预测时应尽可能应用第一种方法。 由上述分析可得到下面的式子:, cmijkijijijijk211,091,41,2j 4,32k由 0,1 变量我们可以得到两
13、种预报方法在同一个站点同一天的同一个时段下哪一种方法比较准确。如: 时,说明第二种预报方法较准确, 时,说明第一种预报方01ijk 1mijk法较准确。我们用第一种预报方法比第二种预报方法更准确的次数的累计和作为目标建立如下模型:模型二 : 4*194191Kjiijkmh将所得数据带入模型,计算出 的值,再把 与 进行比较,如果 ,则说明h11221h第一种预报方法比第二种预报方法准确;,如果 ,则说明第一种预报方法不如第二种预报方法精确。模型二求解:通过 MATELAB 软件,我们可以求得 的值。h1=0.8214h19由于 ,所以第一种预报方法比第二种预报方法准确。我们利用综合的方法,从
14、全21h面的角度来考虑预报方法的准确性,因此在考虑预测某一时段或某一雨级的准确性时,需要我们利用模型一或其他的方法进行考虑。六 问题二:模型的建立、分析与求解对于 91 个观测点,41 天中的四个时段的“预测数据”是否准确进行讨论。考虑到公众的满意度,我们把雨量转变成雨级进行比较,首先我们要把 6 小时降雨量转化为6 个等级,如表格(1)所示。我们用 Matlab 得出以下数据:方法一雨级预测准确的次数(a) a 与实测次数之比 a 与预测总次数之比 预测总次数 实测次数0(无雨) 7466 65.04% 93.61% 7976 114791(小雨) 943 52.07% 19.59% 481
15、4 18112(中雨) 110 20.95% 8.81% 1249 5253(大雨) 81 16.88% 12.78% 634 4804(暴雨) 31 7.64% 15.9% 195 4065(大暴雨) 5 2.67% 9.43% 53 1876(特大暴雨) 0 0.00% 0.00% 3 36等级 雨级 雨量(毫米)0 无雨 0.11 小雨 0.12.52 中雨 2.663 大雨 6.1124 暴雨 12.1255 大暴雨 25.1606 特大暴雨 60.110方法二雨级 预测准确的次数(a) a 与实测次数之比 a 与预测总次数之比 预测总次数 实测次数0(无雨) 7473 65.10%
16、93.61% 8029 114791(小雨) 930 51.35% 19.59% 4810 18112(中雨) 107 20.38% 8.81% 1237 5253(大雨) 78 16.75% 12.78% 611 4804(暴雨) 30 7.39% 15.9% 189 4065(大暴雨)6 3.21% 9.43% 46 1876(特大暴雨) 0 0.00% 0.00% 2 36由以上两表得出的数据我们可以看出两种方法所测出的结果并没有太大的差距。虽然差距不大,但我们可以根据每一雨级测量的准确率(a 与实测次数之比)来评价这两种方法的优劣。由数据我们得出在测量结果为无雨与大暴雨时,第二种预测方
17、法较准确,而在测量结果为小雨、中雨、大雨和暴雨时第一种预测方法较准确。综上分析,第一种预测方法要比第二种预测方法准确。第一种方法和第二种方法预测特大暴雨的准确率非常低、甚至为,是因为特大暴雨不经常发生,而且变化无常,根据现有的气象预报技术是很难准确预报的。随着雨级的增加预报的准确率就越低,符合实际情况。我们把预测雨级和实测雨级相等的权重设定为 1;预测雨级和实测雨级相差数值为1 的权重设定为 0.5,相差数值为 2 的权重设定为 0.25,相差数值为 3 的权重设定为0.125,相差数值为 4 的权重设定为 0.0625,相差数值为 5 的权重设定为 0.03125,相差数值为 6 的权重设定
18、为 0.015625。即: 6.01562. 534. 312502. 10.1SJSJnIJKgijkijkijijgijkijkijijgijkijkijijgijkgjk ranranrranrran11也就是说 越大公众的满意度越大。ngijk模型三:(1)9141ijkij(2)9142ijiijkn我们根据 Matlab 计算出如下图三所示:雨级差 0 1 2 3 4 5 6方法一次数8636 3582 714 267 59 17 0方法二次数8624 3581 718 258 51 9 0对图三的解释:例如,方法一雨级差为 0 的次数是 8636。 因此(1)式的结果是:8636
19、*1+3582*0.5+714*0.25+267*0.125+59*0.0625+17*0.03125+0=9568.5(2)式的结果是:8624*1+3581*0.5+718*0.25+258*0.125+51*0.0625+9*0.03125+0=8839.2从结果可以看出,如果我们从整体上考虑方法一优于方法二,因为公众对方法一预测结果满意度的总和要大于对方法二预测结果满意度的总和。模型四:, , (3)914ijijkn432,1, k=1,2,3,4 , (4)9142ijijk我们根据 Matlab 计算出如下图四所示:120 1 2雨级差第一时段第二时段第三时段第四时段第一时段第二
20、时段第三时段第四时段第一时段第二时段第三时段第四时段方法一次数262 273 269 354 826 770 915 1069 157 179 179 198方法二次数252 270 282 341 847 785 921 1045 157 183 199 1963 4 5雨级差第一时段第二时段第三时段第四时段第一时段第二时段第三时段第四时段第一时段第二时段第三时段第四时段方法一次数 57 85 71 53 14 23 13 9 2 7 1 7方法二次数 55 84 71 51 14 26 10 3 2 4 2 1对图四的解释:例如,方法一雨级差为 0 第一时段的次数是 262。因此公众对方法
21、一第一时段的满意度为:262*1+826*0.5+157*0.25+57*0.125+14*0.0625+2*0.03125=102.6875依次类推公众对方法一第二时段的满意度为:118.7813;公众对方法一第三时段的满意度为:113.2188;公众对方法一第四时段的满意度为:127.3750;公众对方法二第一时段的满意度为:103.1875;公众对方法二第二时段的满意度为:118.3750;公众对方法二第三时段的满意度为:116;公众对方法二第四时段的满意度为:115.7188;公众对每种方法每个时段的满意度如表五所示:时段方案第一时段 第二时段 第三时段 第四时段方法一 102.687
22、5 118.7813 113.2188 127.3750方法二 103.1875 118.3750 116 115.718813分析:公众对方法一第一时段预测结果的满意度小于方法二第一时段预测结果的满意度,因此第一时段方法二优于方法一;公众对方法一第二时段预测结果的满意度大于方法二第二时段预测结果的满意度,因此第二时段方法一优于方法二;公众对方法一第三时段预测结果的满意度小于方法二第三时段预测结果的满意度,因此第三时段方法二优于方法一;公众对方法一第四时段预测结果的满意度大于方法二第四时段预测结果的满意度,因此第四时段方法一优于方法二;由模型三、四可知,在考虑不同公众的不同感受时,我们可以根据
23、实际情况选择最佳的预测方法。七 模型推广为了较客观地评定两种方法雨量的预报准确,我们可以采用模糊综合评分方法。模糊评分公式:iip OFiM,max1406式(1) 中第一项是预报基础分,规定为60 分;第二项为强度(量级) 预报的加权分,其中取 分别表示三峡库区五大流域, 分别表示面雨量预报值和实况值,i5321 i为面雨量预报值和实况值中的最大项。由式(1) 可知,当预报量级与实况iOFmax一致时(即预报与实况误差为0) ,该预报评分为100 。当预报量级有误差时,按其误差大小给分,误差越大,分值越低,相反分值越高,预报值越接近于实况值。可以看出,根据误差大小计算的模糊评分,能够很好地表
24、征预报贴近实况的程度,从而较好地检验流域面雨量预报水平。中国气象局文件中对面雨量不同等级进行分别评分然后求平均,而在实际面雨量预报业务中直接预报的是每个流域面雨量的量级,因此在检验中就可以直接采用面雨量预报量级与实况面雨量量级进行对比评定。当面雨量预报值为0 而实况面雨量也为0 时,视为预报正确,预报评分为100。动态权重系数法就是权重系数随时间或空间的变化将发生动态调整。综合流域面雨量集成方法的权重系数 采用下式计算:iAniiiiXA13各预报方法的动态预报准确率 ,计算公式为:iiiiFX3,2114采用这种动态权重系数法可对不同预报方法的预报优势,集成预报的可靠性较每种单独方法要好参考
25、文献1赵静,但琦 ,数学建模与数学实验(第二版)北京:高等教育出版社,。黄嘉佑等。气象统计分析与预报方法M.北京:气象出版社,2000。周晓阳,数学实验与 MATLAB 武昌:华中科技大学出版社,。何志学,三峡区间面雨量预报方法极其实验效果:气象出版社,第卷,页,。:15附录(MATLAB 程序)load yuceshu1 load yuceshu2load shiceshu for i=1:91 for j=1:4 for k=1:41 if A1(i,j,k)=0.1end end end end for i=1:91 for j=1:4 for k=1:41 if A2(i,j,k)=0
26、.1end end end end for i=1:91 for j=1:4 for k=1:41 if b(i,j,k)=0.1 end end end end for j=1:4shu11=0;shu12=0;shu13=0;shu14=0;shu15=0;shu16=0; for k=1:41 for i=1:91 if A1(i,j,k)-b(i,j,k)=0 end if A1(i,j,k)-b(i,j,k)=1shu12=shu12+1;end if A1(i,j,k)-b(i,j,k)=2shu13=shu13+1; end if A1(i,j,k)-b(i,j,k)=3shu1
27、4=shu14+1; end if A1(i,j,k)-b(i,j,k)=4shu15=shu15+1;end if A1(i,j,k)-b(i,j,k)=5shu16=shu16+1; end end end shu11shu12shu13shu14shu15shu16end for j=1:4shu21=0; shu22=0; shu23=0; shu24=0;shu25=0;shu26=0; for k=1:41 for i=1:91if A2(i,j,k)-b(i,j,k)=0end if A2(i,j,k)-b(i,j,k)=1shu22=shu22+1;end if A2(i,j,k)-b(i,j,k)=2shu23=shu23+1;end if A2(i,j,k)-b(i,j,k)=3shu24=shu24+1;end if A2(i,j,k)-b(i,j,k)=4shu25=shu25+1; end if A2(i,j,k)-b(i,j,k)=5shu26=shu26+1;end end end shu21shu22shu23shu2417shu25shu26end