1、0第十二届大学生数学建模竞赛2014 年 5 月 6 日5 月 16 日题目 A B(在所选题目上打勾)编号 1996 参赛队员 1参赛队员 2参赛队员 3姓 名学 号院(系)专 业手 机Email浙江大学本科生院教学研究处浙江大学数学建模实践基地1B 题 美术大赛评选制度摘要美术大赛评选制度问题是一个普遍而又重要的实际问题。美术作品的评价带有一定的主观性,所以一个公平合理的评选制度尤为重要,但是在保证公平合理性的同时还要考虑时间和经济上的可行性。本文正是以 2012、2013 年初评专家的评分结果为研究对象,通过数学建模的方法来对现有评选制度进行评估和完善。对问题一:要得到入选会评的合理名单
2、,只要得到参赛作品的合理排名就行。我们认为如果每个初评专家都以同样的标准为每个作品打分,即每位专家给同等优秀的作品的打分相同,那么最后得到的排名就是合理的。在这里,我们给出了衡量专家评分标准的两个重要概念“标度”和“刚度” 。 “标度”代表专家对于已知其水平的作品所打的分数。 “刚度”代表专家对于已知水平差距的作品所打分数的差距。现在各个专家已经给作品打了分,但是专家们评分的标度和刚度各不相同,我们通过“校正迭代”的方法把各位专家评分的标度和刚度校正至同一水平来获得各个作品的合理得分表。最后用合理得分表来计算作品的合理排名,从而得到入选会评的合理名单。校正迭代的思路是:用专家给所评作品的分数均
3、值来表示对应专家的标度,用专家给所评作品的分数标准差来表示对应专家的刚度。在每轮迭代中,用上一轮校正后所得的评分表来计算各专家应持的标度和刚度,校正各专家评分的标度和刚度到此两值,得到此轮校正后的评分表。我们编出校正迭代程序,用 2012 年和 2013 年的数据让程序运行,随着迭代次数的增加,评分表上分数均趋于稳定。对问题二:首先阐述两阶段评选的基本框架既能保证一定的公平性,又在时间因素和经济因素上具有可行性,但是在初评阶段中每个作品均由 3 位专家评分,受专家评分的标度、刚度和个人偶然因素影响较大,有失公平。其中“个人偶然因素”包括专家的情绪波动、对某一作品的偏见等,体现在问题一校正完毕得
4、到的评分表中专家对作品评分和作品得分之差的绝对值中,假定对于特定专家,这些绝对值呈正态分布,则可用此分布的标准差 表示该专家的个人偶然因素。我们通过查阅大量的比赛评选制度,发现几乎都是使用求作品各评委评分的算术平均作为最后得分(有些会先去除最高分和最低分) 。假设现行的初评处理是求算术平均。我们通过对比此方法得到的入选会选名单和第一问所得名单的区别来说明其不合理性。在新的评选制度中,我们对初评阶段做了部分修改:选出一部分特别需要第四位专家进行评分的作品,让第四位专家评分。特别需要的作品需要同时满足这两个条件:一是在入选会评临界排名附近上下 5%;二是校正后三位专家的评分标准差大于平均水平。对问
5、题三:如果某一初评专家在评分时的个人偶然因素很大,就影响入选会评的名单,从而影响竞赛最终结果。我们编写程序,模拟一位个人偶然因素极大的专家参与初评的情形,即让计算机随机抽取一位专家,将该专家对作品的打分全部用计算机产生的随机数代替,按照第一问的处理方法得到入选会选名单,比较此名单和第一问所得到的入选名单,二者的差别即该初评专家对竞赛产生的影响。由于每个专家评的作品有多个,而且每个作品都有三位专家进行评分,这为评价专家提供了一定的信息。具体可从标度、刚度和个人偶然因素三个方面来评价专家。2我们在第一问中已经得到合理的评分表,从而可计算出各位专家应持的标度和刚度,与各位专家实际所持的标度和刚度进行
6、比较,得到对各位专家标度和刚度的评价。各位专家的个人偶然因素可第二问中所求得的 表示。关键词:刚度、标度、校正迭代、正态分布、偶然误差、合理化一、问题重述美术新星大赛是一项面向中学生的美术赛事,每年有来自各地的数百件作品参赛,从中将评出特等奖、一等奖、二等奖、三等奖、鼓励奖若干,各奖项的获奖比例约为5%、5%、5%、10%、20%,获特等奖和一等奖的作品还将获得参加国际赛事的资格。作品评选按惯例分为初评和会评两个阶段。在初评阶段,组委会选择若干专家组成初评委员会。将每件作品分送其中的三位专家,每位专家以百分制独立打分。组委会汇总专家评分后筛选出一定份数作品进入会评。会评专家由各领域权威人士组成
7、,以集中讨论、逐件评议的形式进行。最终获奖名单在会评结束后确定。美术作品的评价有其客观标准,但也存在一定的主观性。为使竞赛能持续、健康发展,一个公平、合理的评选机制非常重要,同时组委会也需要考虑评选过程的时间因素和经济因素。现请你应用数学工具,通过定量分析,协助组委会对现有评选制度进行评估和完善。附件是组委会从十余次比赛中选出的近两年初评专家的评分结果,可供参考。1试给出一种方案,对给定的参加会评作品数量和类型,可根据初评评分结果选出参加会评的作品名单。2. 对现有评选制度进行评估。若有必要,在保留两阶段评选基本框架的前提下,设计新的评选制度,并撰写一份给初评专家的评分指南(不超过半页) 。3
8、. 分析初评专家评分对竞赛最终结果的影响。探讨根据初评专家的评分对专家进行评价的可行性与具体做法。二、问题分析问题一:题目考察根据初评评分处理数据,得到入选会评的合理名单。我们可以先求得各参赛作品的合理排名。思考评分中不合理的地方,不同天专家的打分标准不同,例如:同一个优秀作品,有的专家会给 90 分,而优秀专家会给 85 分;两选手之间的细小差别,有的专家打出的分数可能体现得不是很明显,但有的专家可能会打出相差较大的两个分数。我们要分析以获得合理名单的条件,即所有专家都应持相同的打分标准。把专家的打分标准分类并量化,我们可以把专家标准分为标度和刚度,分别用用专家给所评作品的分数均值和标准差来
9、表示,通过建立校正迭代模型,在每一轮的迭代中,根据上一轮校正后的评分表得出各位专家合理的标度和标准差,再把各位专家的标度和刚度校正到此两值。如果此思路合理,那么通过无穷多次的迭代之后可以得到一张稳定的评分表。我们可以编写程序,输入附录中的评分表,查看迭代次数增加后每轮评分表变化的量,3若变化的量越来越小,最后趋近于零,则在设置足够的精度后可得到合理的评分表,从而得到合理排名和入选会评的名单。问题二:考察对于现有评选制度的评估和改进。对一个制度进行评估,我们需要有全面辩证科学的目光,既要考虑到合理的地方,也要考虑到不合理的地方。现行评选制度合理的地方:两阶段评选的基本框架既能保证一定的公平性,又
10、在时间因素和经济因素上具有可行性;不合理的地方:在初评阶段中每个作品均由 3 位专家评分,受专家评分的标度、刚度和个人偶然因素影响较大,倘若进行标度和刚度进行校正,结果会有失公平。我们可以比较不进行标度和刚度校正的情况下所得到的入选名单和我们在第一问中所得到的入选会评名单的差异来说明制度的不合理。另外,就算通过无穷多次的校正迭代,把每个专家的标度和刚度都校正到其应持的标准上,专家们在评分过程中由于情感波动、对某一作品有偏见等个人偶然因素还是会对结果产生不良影响,由于每个作品只有三个专家评分,可能有些作品受到的专家个人偶然因素的影响比较大,尤其是那些在入选会评临界排名附近的作品。这也是现行评选制
11、度的弊端之一。要设计新的评选制度,我们可以保留原有制度的合理之处,改进不合理之处。对于各位专家的标度和刚度不一致的问题,我们在第一题中已经给出了校正的方法。对于专家的个人偶然因素问题,我们可以为关乎关键作品安排第四个专家进行评分,关键作品需要同时满足这两个条件:一是在入选会评临界排名前后 5%;二是校正后三位专家的评分标准差大于前一条件中的作品的标准差的平均值。问题三:考察初评专家评分对于竞赛结果的影响、根据初评专家评分对专家进行评价的可行性和方法。在第一问中我们已经得到了校正各个专家标度和刚度的方法,所以各个专家的标度和刚度问题可解决,但是专家评分是的个人偶然因素问题不能解决。因此如果某一初
12、评专家在评分时的个人偶然因素很大,就影响入选会评的名单,从而影响竞赛最终结果。我们可以通过程序模拟一位个人偶然因素极大的专家参与初评的情形,即让计算机随机抽取一位专家,将该专家对作品的打分全部用计算机产生的随机数代替,按照第一问的处理方法得到入选会选名单,比较此名单和第一问所得到的入选名单,二者的差别即该初评专家对竞赛产生的影响。要评价专家,我们需要获得一定的信息,而由于每个专家评的作品有多个,而且每个作品都有三位专家进行评分,这为评价专家提供了一定的信息。根据前两问的解答过程,我们可从标度、刚度和个人偶然因素三个方面来评价专家。我们在第一问中已经得到合理的评分表,从而可计算出各位专家应持的标
13、度和刚度,与各位专家实际所持的标度和刚度进行比较,得到对各位专家标度和刚度的评价。各位专家的个人偶然因素体现在问题一校正完毕得到的评分表中专家对作品评分和作品得分之差的绝对值中,假定对于特定专家,这些绝对值呈正态分布,则我们可以用此分布的标准差 表示该专家的个人偶然因素。三、符号说明符号 名称 定义4 标度刚度大评分表|( 1, 1) ( 1, n) ( m, 1)A( m, )|(,)o 作品得分数组 =Xo1,1,1n() 某专家评审作品数量f作品合理得分数组专家评分均值数组X()=()j=1(Bij, 1)(n( i) ) 专家合理评分均值数组E(i)=()j=1(Cij, 1)(n(
14、i) ) 专家评分元胞数组专家合理评分元胞数组某专家所评作品所有评分元胞数组专家评分标准差数组Si,1=2()=1,1() 合理专家评分标准差数组S,1=2()=1,1() 刚度校正系数 K()=()/()F基准矩阵|( 1, 1) ( 1, n) ( m, 1)( m, )|(,)U 迭代前后得分差值 U(i)=Xf(i)-Xo(i)5四、问题假设假设 1:每位专家的偶然误差均服从 的正态分布;=0, 0假设 2:各位专家的标度因素、刚度因素以及个人偶然因素均相对独立,无相互影响;假设 3:正常情况下,每位专家均能正确把握作品的优劣水平;假设 4:各位专家所评审的作品数量相对一致,且足够多;
15、假设 5:会评标准足够公正合理;假设 6:初评过程的时间成本和经济成本与各位专家作评作品数量之和成正比;假设 7:会评成本与入选会评的作品数量成正比,且会评中对一个作品评审成本大于初评中的评审成本;假设 8:现有评选制度初评阶段,将每个作品得到的三个分数的算术平均作为作品的最后得分;假设 9:专家的数量大于 3;假设 10:相比于专家评审的时间,程序运行的时间可忽略;假设 11:专家对某件作品的评审不受到其它作品的影响;五、模型建立及求解问题一:要得到入选会评的合理名单,只要得到参赛作品的合理排名就行。我们认为如果每个初评专家都以同样的标准为每个作品打分,即每位专家给同等优秀的作品的打分相同,
16、那么最后得到的排名就是合理的。在这里,我们给出了衡量专家评分标准的两个重要概念“标度”和“刚度” 。“标度”代表专家对于已知其水平的作品所打的分数。 “刚度”代表专家对于已知水平差距的作品所打分数的差距。现在各个专家已经给作品打了分,但是专家们评分的标度和刚度各不相同,我们通过建立校正迭代模型把各位专家评分的标度和刚度校正至同一水平来获得各个作品的合理得分表。最后用合理得分表来计算作品的合理排名,从而得到入选会评的合理名单。6模型程序图:输入大评分表 A计算 A 中所有非零值的均值,作为首轮校正迭代中各位专家应持的标度调整各位专家的标度到他们应持的标度得到新的大评分表 A计算新的大评分表中各位
17、专家所评作品的全部分数均值作为应持的标度计算各位专家打分的标准差作为目前的刚度计算各位专家的打分均值作为目前的标度判断是否达到精度要求得到新的大评分表 A计算 A 中所有非零值的标准差作为首轮校正迭代中各位专家应持的刚度调整各位专家的标度到他们应持的标度计算新的大评分表中各位专家所评作品的全部分数均值作为应持的标度计算新大评分表中各位专家打分的标准差作为目前的刚度计算新大评分表中各位专家打分的均值作为目前的标度调整各位专家的标度到他们应持的标度调整各位专家的刚度到他们应持的刚度得到新的大评分表 A得到新的大评分表 A是否71.1 构建校正迭代模型校正迭代的思路是:用专家给所评作品的分数均值来表
18、示对应专家的标度 ,用专家给所评作品的分数标准差来表示对应专家的刚度 。在每轮迭代中,用上一轮校正后所得的评分表来计算各专家应持的标度和刚度,校正各专家评分的标度和刚度到此两值,得到此轮校正后的评分表。经过多次校正迭代后,可得到一组几乎恒定不变的作品得分数组,视为合理化得分值,作为各个作品的最终得分。迭代过程分为首轮校正迭代和循环校正迭代,两者思路相同,实际操作略有区别。1.1.1 首轮校正迭代、用矩阵表示大评分表等数据:各位专家给各个作品的评分表就是大评分表,进行数据整理,得到 的评分(m)矩阵 :AA=|( 1, 1) ( 1, n) ( m, 1)A( m, )|()若第 i 位专家没有
19、评过第 j 号作品,则 。( , ) =0、从矩阵 A 中提取数据,去除 0 元素,生成 的元胞数组 B,以 Bl表( 1)示单位专家所评分数的集合:|1,k,|=| 11,11(1),1, 1,1(),1, 1,1(),1|( 1m)其中 n(k)为单位专家所评审的作品数量;标度校正:由于这是首轮迭代,在此之前,除了原始分数表,我们没有获得关于作品的更多信息,所以这一轮迭代中我们假定各位专家所评的作品的均值和标准差均相等;、基于此,首轮迭代中所有专家应持的标度为所有作品得分的均值 ,构造数组E,表示各位专家应持的合理标度:E( i) =0 0 (,)3E=1,1,1( m1) =|( m1)
20、若第 i 位专家没有评过第 j 号作品,则 。( , ) =0、构造数组 X,表示单位专家目前评分平均值:Xi, 1=()j=1(Bij, 1)n()8= (1,1)(),1)( n1)、构造 )的矩阵 ERR1,将单位专家的标度校正的量:( mERR1=ERR1( 1, 1) ERR1( 1) ERR1( m, 1) ERR1( m, n) ( mn)若 :Ai, j0 ERR1i, j=,1若 :Ai, j=0 ERR1i, j=0、将标度校正矩阵 ERR1 与原始得分矩阵相加,得到一个新的得分矩阵表 AA=A+ERR1首轮专家评分标度调整完毕;刚度校正、与标度同理,首轮迭代中所有专家应持
21、的刚度为目前所有作品得分的标准差 ,构造数组 SC,表示各位专家应持的合理刚度:SC()=2(,)23其中 ;(,)0S=S1,1,1( m1) =|( m1)、构造数组 S,表示目前单位专家的刚度,即对所评作品的分值的标准差:S=|(1,1)(,1)|(1)Si,1=2()=1,1()将单位专家评分原有标准差 S,校正为合理化标准差 SC:首先,构造 的数组 K,作为刚度校正系数:(1)Ki, 1=SC,1,19K=1,1,1( m1)其次,构造刚度校正矩阵 ERR2:ERR2=ERR2( 1, 1) ERR2( 1) ERR2( m, 1) ERR2( m, n) ( mn)若 :Ai,
22、j0 ERR2i, j=()Ai,1若 :Ai, j=0 ERR1i, j=0、构造一个 的基准矩阵 F,即每一列的元素都相同:( n)若 :Ai, j0 Fi, j=,1=若 :Ai, j=0 Fi, j=0、刚度校正矩阵 ERR2 与基准矩阵相加,使单位专家的评分标准差得到调整,即可得到新的评分矩阵 A: A=F+ERR2*首轮专家评分刚度调整完毕;1.1.2 循环校正迭代在循环迭代的每轮迭代中,用上一轮校正后所得的评分表来计算各专家应持的标度和刚度,校正各专家评分的标度和刚度到此两值,得到此轮校正后的评分表。标度迭代:、构造数组 X,表示上一轮校正迭代后,单位专家评分标度,即所评分数的均值:Xi, 1=()j=1(Bij, 1)n()= (1,1)(),1)( n1)、根据表 A,计算作品上轮平均得分,并构造 数组 Xo,存放作品平均得(1)分,构成元胞数组 C,抽取出单位专家所评作品的得分,存放于 Cl中,即每位专家对应所评作品应给分值集合:=Xo1,1,1( n1)