1、1A. 公平的竞赛评卷系统目录A. 公平的竞赛评卷系统 10.摘要 .2.关键词 .31.问题的重述 .32.问题分析 .53.模型的基本假设 .64.符号的说明 .65.模型的建立和求解 .7问题一 7问题二 评委的分配 9(1 )在这里,我们再做一些必要的假设: .9(2 )数据的处理 9(3 )模型建立 10问题三 评阅试卷公平性与一致性的分析 .165.3.1 模型(一) .175.3.2 模型(二) .175.3.3 模型(三) .21问题四 分数的调整 22问题五 百分制与等级制的比较 .25六 模型评价 26七 模型推广 282摘要我们这次做的是 A 题。现在,越来越多的大学生积
2、极参与到全国大学生数学竞赛当中,如何公正客观的评阅参赛卷是很重要的!针对此题目的五个问题,我们分析相关的数据,建立了相应的数学模型,并且求解出最后结果。 问题一,题目要求给出一种答卷编号加密和解密的数学公式,自然会想到常用且简单的 XOR(异或)运算,其原理如下:设待加密明文为 M,加密密钥为 P,则密文 C=MP;由异或运算的性质易得 CP=M,CM = P;故可以通过 CP 解密出原明文 M。异或运算简单,计算快速;由于使用了加密密钥P(由密码变换得来) ,故能满足可随意变换;只要密码的安全性能得到保障,其加密性能还是较好。问题二中,我们利用整数规划以及层次分析法,建立相应的数学模型。我们
3、对 “特殊要求”赋予不同的期望值,构成一个 4 行 25 列的适配度矩阵,我们以最大适配度为目标函数,利用相应的数学软件求解出每个题组需要的评委数目以及评委编号;同时,为了每个评委评阅的答卷尽可能广泛,在我们建立的广泛度模型中,我们采用了倒置的钟型隶属函数为广泛度函数,求出相应的权值,同时建立一个广泛度最大的函数,使函数值最大,求出每个评委具体评阅各个学校的试卷份数。问题三,对评分一致性和公正性进行分析,我们采用两种模型:模型一,我们根据四个分组的样本方差,来比较不同评阅员对试卷打分公平度的分析,由于模型一中,当样本方差小时,我们能够得出,这个评阅员的打分比较客观,但是,当样本方差很大时,我们
4、只能够得出这个评分不够客观,不能够更客观,更精确的分析,所以在模型二中,我们引入了“绝代比”这个概念,这样,我们就可以在绝代比稍稍大于 1 时,说明这个评委总体来说他的评分比较客观,但是也不能排除他对少部分试卷作弊的嫌疑,当“绝代比”远远大于 1 时,只能说明他的评分在平均分附近徘徊。模型三中,我们把每个评委评分的走势图以及平均分的走势图相比较,简单,易懂,清晰。问题四中,题目是让我们利用问题三的分析,对评阅的“不公平”现象做出调整并给出公式,在这个问题中,我们采用两个模型,模型一中,我们采用“裁头去尾”的方式,来计算这份试卷的平均分,虽然这样有一定的公平性而且排除了某些作弊的嫌疑,但是这样会
5、让我们失去一些宝贵的评分资源,于是我们在不排除评分的情况下,采用权值形式即,在高评分的情况下,我们乘以一个小的数,在低评分的情况下,我们乘以一个大的数,这样就可以保证评分的公正性,这就是我们问题四的模型二,采用的回归方程的新模型。在问题五中,我们会讨论一下在评阅的过程中,是采用百分制好,还是采用等级制好。3.关键词:XOR (异或)加密运算,整数规划, 柯西隶属函数,回归方程,等级制。1.问题的重述数学建模竞赛吸引了众多的大学生、研究生甚至中学生的参与,越来越多的人关心竞赛评卷的公平性。现今大多数的评卷工作是这样进行的:先将答卷编成密号,评委由各参赛学校(20-50 所)派出,按不同的题目分成
6、几个题组,每个题组由 M 个评委组成,评阅 N 份答卷,每份答卷经 L 个评委评阅,评委对每份答卷给出等级分(A +,A ,A -,B +,B ,B -,C + ,C ,C -,D) ,如果 L 个评委给出的分数基本一致,就给出这份答卷的平均分,否则需讨论以达成一致(其中 M = 5-10,N = 60-200,L = 3-5) 。现在需要我们解决如下问题:1有 A,B,C,D 四个题目, P(P M)所学校参赛,给出一种答卷编号加密和解密的数学公式方法(其中题号为明号) ;要求方法简单易算、可随意变换且保密性能好;对你的方法给出分析。2每个题组的 M 个评委来自不同学校,给出一种评阅答卷分配
7、的数学公式方法,要求回避本校答卷,并且每个评委评阅的答卷尽可能广泛,并满足某些特殊的要求。3给出评分一致性或公正性的检验方法,该方法要求对每个评委的公平性给出评价(某评委分数普遍给的偏高或低属于尺度偏差,不应算作不公平,可在下面的问题中调整) 。4给出最终的分数调整计算公式。该公式要处理那些可能出现的“不公平” ,及尺度偏差。对可能出现的“不公平”构造例子,说明你的方法。5对评卷中的其他问题(如采用百分制还是等级分,一份答卷由几个评委评阅可以满足既经济又公平,等等)提出你的看法和根据。46假定有 35 所学校 298 个参赛队参赛,数据如附表。其中:数字前两位代表学校,甲组选做 A,B 题;乙
8、组选做 C,D 题;25 名评委所属的学校编号为:1-17,20,21,22,24,26,28,29,30。每份试卷经四位评委评阅,编号为 15,22 的只容许评 C,D 题,编号为 26 的只容许评 A,B题,编号为 1,4,6,12,16 的评委要求评 A 题,编号为 2,5,7,10 的评委要求评 B 题;编号为 24 的评委要求评 C 题,编号为 29 的评委要求评 D 题。其余按所在学校的甲、乙组别及个人的要求安排。要求对问题 1,2 给出具体的算法及结果。对问题 3,4,5 给出模拟数据再进行分析和运算。2.问题分析该问题讨论的是数模竞赛当中所涉及的一个公平评卷问题。该题目有五问:
9、问题一,让我们对 P 所学校的参赛队的答卷编号写出编号加密和解密的数学公式,题目要求给出一种答卷编号加密和解密的数学公式,自然会想到常用且简单的 XOR(异或)运算,其原理如下:设待加密明文为 M,加密密钥为 P,则密文 C=M P;由异或运算的性质易得 CP=M,CM = P;故可以通过C P 解密出原明文 M。异或运算简单,计算快速;由于使用了加密密钥 P(由密码变换得来) ,故能满足可随意变换;只要密码的安全性能得到保障,其加密性能还是较好;故得出加密方法。 问题二,我们需要给出一种评阅答卷分配的数学公式方法,要求回避本校答卷,并且每个评委评阅的答卷尽可能广泛,并满足某些特殊的要求。我们
10、利用整数规划以及层次分析法,建立相应的数学模型。我们对 “特殊要求”赋予不同的期望值,构成一个 4 行 25 列的适配度矩阵,我们以最大适配度为目标函数,利用相应的数学软件求解出每个题组需要的评委数目;为了每个评委评阅的答卷尽可能广泛,在我们建立的广泛度模型中,我们采用了倒置的钟型隶属函数为广泛度函数,求出相应的权值,同时建立一个广泛度最大的函数,使函数值最大,求出每个评委具体评阅各个学校的试卷份数。5针对问题三,对评分一致性和公正性进行分析,我们采用了两种模型。模型一,我们根据四个分组的样本方差,比较不同评阅员对试卷打分公平度的分析,在模型一中,当样本方差小时,我们能够得出,这个评阅员的打分
11、比较客观,但是,当样本方差很大时,我们只能仅仅得出这个评分不够客观,但不能更客观,更精确的进一步分析,所以在模型二中,我们引入了“绝代比”这个概念,这样,我们就可以在绝代比稍稍大于 1 时,说明这个评委总体来说他的评分比较客观,但是也不能排除他对少部分试卷作弊的嫌疑,当“绝代比”远远大于 1 时,只能说明他的评分在平均分附近徘徊。模型三中,我们把每个评委评分的走势图以及平均分的走势图相比较,简单,易懂,清晰。问题四中,题目是让我们利用问题三的分析,对评阅的“不公平”现象做出调整并给出公式,在这个问题中,我们采用两个模型,模型一中,我们采用“裁头去尾”的方式,来计算这份试卷的平均分,虽然这样有一
12、定的公平性而且排除了某些作弊的嫌疑,但是这样会让我们失去一些宝贵的评分资源,于是我们在不排除评分的情况下,采用权值形式即,在高评分的情况下,我们乘以一个小的数,在低评分的情况下,我们乘以一个大的数,这样就可以保证评分的公正性,这就是我们问题四的模型二,采用的回归方程的新模型。在问题五中,我们针对一些数据和资料,讨论在评阅的过程中,是采用百分制好,还是采用等级制好。 3.模型的基本假设:1.假设评委的经验和知识背景都足够的丰富,这样就不会因为自身一些原因,造成评阅的不公平性。2.假设评阅过程当中,不会出现集体作弊的嫌疑。3.假设每个评委的评卷速度、阅卷量、阅卷水平相近;4. 假设每个评委在评卷过
13、程中不会讨论交流评卷以外的试卷信息,独立自主的评出每份试卷的分数,对于同一份试卷评委不会相互透露各自所评的分数;5.没有被强行要求以及自己没有提出要求的评委被随机分配。64.符号的说明A、B 、C、D-分别表示参赛队所选的题目-表示第 i 个评委评阅的试卷的离差绝对值。Sai-表示第 i 个评委评阅的试卷的离差。di-表示第 i 个评委对第 j 份试卷评阅的分数。ijX-表示第 j 份试卷评分的平均数。j_-表示第 j 所学校所选第 k 组题的参赛对数。kjU-表示第 i 个评委的“绝代比” 。Ai-表示选第 k 个题的参赛队的总数k-第 i 个评委评阅第 j 个学校的份数ijN-表示第 i
14、个评委评分的权值。Ki5.模型的建立和求解问题一题目要求给出一种答卷编号加密和解密的数学公式,自然会想到常用且简单的 XOR(异或)运算,其原理如下:设待加密明文为 M,加密密钥为 P,则密文 C=MP;由异或运算的性质易得 CP=M,C M = P;故可以通过 CP7解密出原明文 M。异或运算简单,计算快速;由于使用了加密密钥 P(由密码变换得来) ,故能满足可随意变换;只要密码的安全性能得到保障,其加密性能还是较好。故得出加密方法,我们假设 M 代表加密明文, P 代表加密密钥,C 代表密文,A 就代表解密出的原明文,根据我们总结出的加密原理,我们会得到以下数学表达式:原文 M 经过加密密
15、钥 P 加密后就会得到密文 C,即:C=MP。密文 C 经过解密密钥 P 解密后,就会得到原明文 A,即:A=CP;其中这是一种对称加密算法,所以,加密密钥与解密密钥是相同的。按照这种思路,如果我们得到的还原密文与加密密文相同,就成功了。下面,我们先从自己假设的一个小例题来验证:设原明文M=(0,1,0,1) ,加密密钥P=( 1,0,0,1) ;那么经过加密密钥加密之后的密文就是:C=M P=(0,1,0,1)( 1,0,0,1)=(1,1,0,0 ) ;密文 C 经过解密密钥解密之后的还原密文就是:A= CP=(1,1,0,0)(1,0,0,1 )=(0,1,0,1) ;又因为 A=M,即
16、还原之后的密文等于原明文,所以我们加密和解密已成功;按照这种思路,我们就可以对我们的参赛选手的序号进行加密了;因为我们参赛选手的编号是四位十进制的,所以我们必须先把他们转化成 16 位的8421BCD 码,才行。如:第一个学校的第一个参赛选手的编号是:0101,它是一个四位十进制的序号,所以他的 8421BCD 码是:0000,0001,0000,0001;我们选择加密密钥是:(2010) ,即:(0010 ,0000,0001,0000) ;8加密之后的密文是:(0000,0001,0000,0001)(0010,0000,0001,0000)结果是:(0010,0001,0001,0001
17、) ,这就是加密之后的密文;然后经过解密密钥就可以得到解密密文:结果是:(0010,0001,0001,0001)(0010,0000,0001,0000) 即:(0000,0001,0000,0001) ;刚好结果与第一个参赛选手的标号相同,转化成四位十进制就是(0101) 。下面我们就用加密密钥为(1234)即(0001,0010,0011,0100) ;对我们 298 为参赛选手的序号进行加密和解密。结果见附录。算法见附录五。问题二 评委的分配5.2 (1)在这里,我们再做一些必要的假设:a假设答卷编号加密后,评委如何也不能获取试卷原来编号;b假设除了问题中某些评委提出的特殊要求,其他评
18、委无明确要求;c.假设每个评委在评卷过程中不会讨论交流评卷以外的试卷信息,独立自主的评出每份试卷的分数,对于同一份试卷评委不会相互透露各自所评的分数;d.假设评委们不会在一起讨论各自评分的大概范围。(2)数据的处理根据题意,共有 35 所学校 298 个参赛队参赛,评委数为 25,且来自不同的学校。25 名评委所属的学校编号为:1-917,20,21 , 22,24,26,28,29,30。每份试卷经四位评委评阅,编号为15,22 的只容许评 C,D 题,编号为 26 的只容许评 A,B 题,编号为1,4 ,6 ,12 ,16 的评委要求评 A 题,编号为 2,5,7,10 的评委要求评 B
19、题;编号为 24 的评委要求评 C 题,编号为 29 的评委要求评 D 题。其余按所在学校的甲、乙组别及个人的要求安排。首先,我们经过处理所给题目数据,统计每个学校所选题目以及选题的参赛队个数得到以下表(1) ,表一,每个学校所选题目以及选题的参赛队个数学校代码1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18A 题 13 4 3 6 7 6 6 7 6 4 4 4 7 5 2 2 5 2B 题 17 4 3 4 4 4 5 13 4 6 6 6 8 6 3 5 2 6C 题 2 2D 题 2 2总计 30 8 6 10 15 10 11 20 10 10
20、 10 10 15 15 5 7 7 8学校代码19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 总计A 题 2 95B 题 1 107C 题 3 2 7 3 3 4 4 3 3 4 2 3 1 2 1 1 50D 题 4 6 3 2 4 2 4 3 3 4 3 1 1 1 1 46总计 3 7 8 10 5 7 6 8 6 6 8 5 4 2 3 2 1 298其中,由于题目有一些特定的要求(约束条件) ,我们统计得到表(2)表二,特定的要求(约束条件)的统计表评委编号 1 2 3 4 5 6 7 8 9 10 11 12 13学校代号 1
21、 2 3 4 5 6 7 8 9 10 11 12 13只容许要求 A B A B A B B A评委编号 14 15 16 17 18 19 20 21 22 23 24 2510学校代号 14 15 16 17 20 21 22 24 26 28 29 30只容许 C、 D C、 D要求 A C D(3)模型建立通过对问题的分析以及对数据的处理,我们知道首先要解决的问题是评委的分配。1) 依据题意,要把 25 个评委分配到 A、B 、C、D 四个题组中,且必须满足以下的要求:a. 每个评委只能分配到一个题组中;b. 为了尽可能回避评阅本校参赛队的试卷,分组过程中评委应分配到自己学校参赛队选
22、择最少的题组;c. 严格满足题目所述某些评委只能评阅特定题组的要求;d. 在满足以上前提下,尽量满足某些评委的个人要求;e.对于没有提出要求或者未被强制要求的评委,进行随机分配;f. 在满足以上前提下,使每个评委能尽可能多的评阅不同学校的试卷。对于以上原则,我们采用数学规划中的整数规划,引入适配度的概念,并用决策变量 来表示,其中 n=1,2,3,4 表示四个题组 A、B、C 、D,用nkyk=1,2,3,25 表示 25 个评委 117、20、21 、 22、24、26 、28、29、30, 表示第 k 个评委被分配到第 n 个题nky组的适配度大小。适配度定义为:a) 评委中,只容许评阅特
23、定题组试卷的评委的要求被满足,适配度为 3,反之为-3;b) 评委中,个人要求评阅特定题组试卷要求被满足,适配度为 1,否则,为-1;c) 当没有特殊要求的评委被随机分配到任意组时,其适配度为 0。11我们可以用 Y 表示 组成的矩阵,则 Y 可以写成如下nky101010310310 矩阵 Y 的列表示 A、B、C、D 四个题组,矩阵的行表示的是 125 号的评委,因为每个评委只能分配到一个题组,所以对于矩阵的每一列,只能取一个数,而我们需要的是把这 25 个评委分配到四个题组,而且他们的适配度的和要达到最大,于是我们得到了以最大适配度为目标函数的表达式: 4251nkSMaxy由题目可知,
24、每个题组需要 510 个评委,同时,从题目所给的表中我们可以得知,选择 A 组的参赛队有 97 个,B 组有 107 个,C 组 50 个,D 组 46 个,在这里我们就不按照比例来规定四个题组评委的分配个数,为了体现公证性,只要求 A、B 组的评委总数多余 C、D 组的评委总数。于是我们得到了有以下约束条件的模型(I ): 4251nkSMaxy2510.ABCDST经过数学软件求解后,我们的到具体分配方案如下表表三,每个评委的分组表(程序见附录二)题组 评委分配数目 评委所在学校编号A 7 1,4,6,12,16,28,30B 8 2,5,7,10,17,20,21,26C 5 11,13
25、,14,15,2412D 5 3,8,9,22,29在得到各位评委的分配方案后,接下来我们考虑要让每个评委能够尽可能的评阅来自不同学校的试卷,使阅卷广泛度尽可能的大。现在我们以 A 组题为例,建立数学模型分配 A 组 7 位评委的评阅试卷。A 组的评委有 7 位,来自 1、4、12、16、28、30表四,每个评委的评分广泛度 ijN1 2 3 4 5 6()ijf0.8832 0.8621 0.8351 0.8001 0.7537 0.6921ijN7 8 9 10 11 12()ijf0.6097 0.5000 0.3600 0.2002 0.0589 0七所学校,再重新编号为 1、2、3、
26、4、5、6、7,选做题 A 的学校编号为1、2 、 19。我们为了更好的公证的评判广泛度,引入了柯西隶属度函数12()14ijijNf 其中广泛度 是以 为自变量的减函数,即一个评委评阅一个学校的试()ijfxij卷数越多,广泛度越小,若一个评委评阅的试卷数来自越多不同的学校,广泛度越好。我们带入数据,可以得到下表 ijN1 2 3 4 5 613()ijfN0.8832 0.8621 0.8351 0.8001 0.7537 0.6921ij7 8 9 10 11 12()ijfN0.6097 0.5000 0.3600 0.2002 0.0589 0因为我们需要得到一个广泛度越好的分配方案
27、,所以我们可以得到一个目标函数,建立的数学模型为 719()ijijGfN71914.506ijjijijijiUSTNb我们可以得到一个 A 组的分配方案(程序见附录二)学校编号评委编号1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 191 0 2 2 5 4 5 4 4 3 3 2 3 5 3 1 1 4 2 24 9 2 1 0 4 4 4 4 4 2 3 2 4 3 1 2 3 1 16 10 3 1 3 4 0 3 4 4 3 2 3 4 3 1 1 3 1 112 10 3 2 4 4 4 3 4 3 2 2 0 4 3 1 1 2 1 1
28、16 8 2 1 4 4 4 4 4 3 2 3 2 4 2 2 0 3 1 128 7 2 2 3 4 4 3 4 3 2 2 3 4 3 1 2 3 1 11430 8 2 3 5 4 3 3 4 4 2 2 3 3 3 1 1 2 1 1把模型推广到其他的题组,可以得到:1()kmnijijMaxfN1112()4.,kkknijijmnijkijnkijijkiffASTNb、 分别表示第 k 个题组评委评阅答卷的上界与下界1kb2经过数学软件的求解,我们得到总体的评委评阅方案A 题组的分配方案学校编号评委编号1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
29、 17 18 191 0 2 2 5 4 5 4 4 3 3 2 3 5 3 1 3 4 2 24 9 2 1 0 4 4 4 4 4 2 3 2 4 3 1 3 3 1 16 10 3 1 3 4 0 3 4 4 3 2 3 4 3 1 3 3 1 11512 10 3 2 4 4 4 3 4 3 2 2 0 4 3 1 2 2 1 116 8 2 1 4 4 4 4 4 3 2 3 2 4 2 2 3 3 1 128 7 2 2 3 4 4 3 4 3 2 2 3 4 3 1 2 3 1 130 8 2 3 5 4 3 3 4 4 2 2 3 3 3 1 2 2 1 1B 题组的分配方案学
30、校编号评委编号1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 192 8 0 2 3 3 2 4 6 2 3 3 3 3 3 1 3 2 3 05 8 2 2 2 0 2 3 7 2 4 3 3 4 3 2 3 1 3 07 9 3 2 2 2 2 0 6 2 4 3 3 4 3 2 3 1 3 010 9 3 1 2 2 2 4 7 2 0 3 3 4 3 1 2 1 3 117 9 2 2 2 2 2 3 6 2 3 3 3 4 3 2 3 0 3 020 8 2 1 1 3 2 2 7 2 3 3 3 4 3 2 2 1 3 121 8 2 1
31、2 2 2 2 7 2 4 3 3 4 3 1 2 1 3 126 9 2 1 2 2 2 2 6 2 3 3 3 5 3 1 2 1 3 1C 组的分配方案学校编号评委编号5 14 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 3511 2 2 3 2 5 2 3 3 3 2 2 3 2 2 0 2 1 113 1 2 2 2 5 3 3 3 3 2 2 3 2 3 1 1 1 114 2 0 2 1 6 3 3 4 3 3 2 3 1 2 1 2 1 115 1 2 3 2 5 2 3 3 3 2 3 4 2 2 1 1 1 01624 2 2
32、2 1 7 2 0 3 4 3 3 3 1 3 1 2 0 1D 组的分配方案学校编号评委编号5 14 20 21 22 23 24 25 26 27 28 29 30 31 32 33 343 2 1 3 5 3 1 4 2 3 2 2 4 3 0 1 0 18 1 2 3 4 3 2 3 1 3 2 2 4 3 1 0 1 19 2 1 4 4 3 2 3 2 3 2 2 4 2 1 1 1 022 1 2 3 6 0 1 3 2 3 3 3 4 2 1 1 1 129 2 2 3 5 3 2 3 1 4 3 3 0 2 1 1 1 1问题三 评阅试卷公平性与一致性的分析5.3 由于有些评
33、委的主观和环境的一些客观因素的影响,他们评阅试卷不可避免的会出现一些漏洞和弊端,为了对这个更细致的分析这个问题,我们需要做定量的分析,这样才能体现公平性与一致性。5.3.1 模型一:在这里,我们先引述几个变量:样本方差: 21_2 )(njijijXS如果有一个评委参与 55 份试卷,每一份试卷必须有四个评委来评阅,我们可得到 55 个平均数,对这 55 份试卷该评委都评阅了一个自己的分数,利用样本方差的公式就会算出这个方差,我们一般定义每个评委与平均数差距应在 517之内,若 在误差之内,我们认为这个评委所参评的试卷很客观,如果 太大,2S 2S我们就会认为这个评委做的评判与平均值相差太大,
34、须重新审阅。但是我们仅依据 来做参考,就会太过牵强,而且,当 在误差范围之内,我们会被它的2 2S“假象”所欺骗,因为在这种情况下,作弊者对自己看好的试卷故意抬高分数,对别的院校的参赛者试卷故意压低,不仅不会使 太大,而且还会使 在误差22S范围内,这就使我们无法判断作弊者的行为,因此我们须对我们现有的模型再分析和改进。但是,我们发现,当评阅员对试卷的评分很大一部分都是“超偏离”我们的平均分数,会使样本方差 很大,当评阅员只对一小部分参赛者的试卷作弊,2S再用样本方差 就无法判断了,于是我们在这里我们想着有没有一种模型可以2S克服这种弊端。在这里,我们引入“绝代比”的概念,提出数学模型二。5.
35、3.2 模型(二)将每个评委的离差绝对值之和与其离差代数和进行比较,可以计算二者的比值,简称为“绝代比” 。其中“离差绝对值之和”是将各个评委对每一测评对象的评分,分别减去该对象的平均分,即得到该评委对该测评对象的离差,将全部离差的绝对值累加求和,得出该评委的离差绝对值之和,离差绝对值之和的大小反映各个评委对测评对象整体水平的看法,离差绝对值之和与测评对象整体水平成负相关,离差绝对值之和越大,测评对象整体水平越不整齐,内部差异即离散程度则越大。而“离差代数和”是将各个评委对每一测评对象的评分,分别减去该对象的平均分,即得到该评委对该测评对象的离差,将全部离差累加求和,即得到该评委的离差代数和,
36、离差代数和没有直接意义,必须与离差绝对值之和结合起来考察,才有实际意义。这样我们就可以更清晰更细致的进行分析了。18其中离差绝对值的求解公式: jXSijai_离差的求解公式为:dijij_那么每位评阅员的“绝代比”是:A njdijaiiS1如下面一组数据,是某评阅员对部分试卷的评分与该试卷的平均分的比较试 类别1 2 3 4 5 6 7 8 9 10 11 12 13评委一 72 78 85 85 71 76 84 74 70 89 88 81 74评委二 68 77 83 82 67 73 80 58 66 73 86 78 70评委三 71 81 87 86 72 78 86 65 7
37、3 80 90 84 75评委四 69 76 85 83 66 73 82 59 67 74 88 81 73平均分 70 78 85 84 69 75 83 64 69 79 88 81 73利用离差绝对值的求解公式 jXSijai_可得下面一组数据:19试卷类型1 2 3 4 5 6 7 8 9 10 11 12 13Sa12 0 0 1 2 1 1 10 1 10 0 0 122 1 2 2 2 2 3 6 3 6 2 3 3a31 3 2 2 3 3 3 1 4 1 2 3 241 2 0 1 3 2 1 5 2 5 0 0 0利用离差求解公式 SdijXij_可得下面一组数据:试卷类
38、型1 2 3 4 5 6 7 8 9 10 11 12 13Sd12 2 0 1 2 1 1 10 1 10 0 0 12-2 -1 -2 -2 -2 -2 -3 -6 -3 -6 -2 -3 -3d31 3 2 2 3 3 3 1 4 1 2 3 24-1 -2 0 -1 -3 -2 -1 -5 -2 -5 0 0 0利用上述求得的离差绝对值之和与离差代数和,可求的这个评委的评分的“绝代比”:利用公式 A njdijaiiS120得出四个评委的“绝代比”: AI 2A341.0000 -1.0000 1.0000 -1.0000由以上数据我们求的虽然这个评委的评分的“绝代比”与 1 相差很小
39、,但是里面却隐藏着不可告人的秘密,当我们用画图的方式来表示这个评委评阅的走势图与平均值的走势图相比较的时候,发现这个评委对第八号和第十号试卷的评分有明显的突跃,所以我们会对这两份试卷重新评阅。所以由以上分析,如果引入了问题三的第三个模型,为每个评委的评分画走势图,然后与试卷的平均分走势图相比较,这样,每一位评委的评分情况,我们就会一目了然。在对评委评分评价的过程中,我们以为模型二是一个好模型,但是,根据上述我们某评委和他评阅的十三分试卷分析之后,我们发现了他的弊端。评委评分的绝代比,会出现三种情况:第一, 当 A =1 时,只能说明这个评委平的分数严格的大于平均分或是严格的i小于平均分,有可能
40、隐藏对某张试卷故意抬高或压低分数的现象。第二, 当 A 比 1 稍稍大一点时,只能说明这个评委一小部分评分在平均分附i近波动,也掩盖了评委作弊的嫌疑。第三, 当 A 远远大于 1 时,只能说明评委的评分大部分在平均分附近波动,i也会隐藏评委作弊的嫌疑的。而问题三的,模型三却恰恰克服了模型二的这个缺点。于是,我们对我们的数据用模型三进行分析。215.3.3 模型(三)根据上述评委的评分和平均分的比较,我们不能用简单的样本方差和“绝代比”来分析,因为这样将不能反映每位评委的评分情况。模型三,我们将用折线图分别画出每一位评委的对每一张试卷的评分情况,而且还能与其他的评委作对比。四位评委评分情况如下:
41、(上表结果的程序见附录三)由四位评委评分走势图,我们可以知道, 评委一对 1-7 和对第 9 和 11,12 ,13 份试卷平的分数都与平均分有惊人的相似,但是,经过观察,在对第 8 和第 10 份试卷评阅的时候,他都故意抬高分数,与平均分相差的太离谱,所以,这两张试卷是我们重点分析的对象。 评委二是红色打叉折线其评分比较平均,而且几乎其全部评分都在平均分的下方,最重要的是他的评分与平均分相差很小,所以,我们对评为二的评价22很高。 评委三的评分与平均分的走势图的弯折程度有惊人的相似,而且他的评分都在平均分的上方,同样,我们对评委三的评价也是相当高的。 对评委四评分的走势图,与平均分相差很小,
42、所以评委四也是值得我们肯定的评阅员。对问题三中,评委评分的一些弊端,我们将在问题四中,给予详细解决。问题四 分数的调整在问题三中,我们讨论了评阅试卷当中出现的一些不公平现象,在问题四中我们将一一解决。由于一些人受自己阅历和知识背景以及看问题的角度的影响,对不同的试卷会评出不同的评分,不同的评委会对同一份试卷做出相差很远的评价,还有一些评委,由于自己的主观因素的影响(如作弊行为)对某些试卷故意抬高或是压低分数,于是便出现了怎样对待这种现象,怎样对一张试卷做出客观公正的评价,问题四的出现,就是解决这种种问题的。针对问题四,我们做出了两种数学模型。模型一:针对这种现象,我们采用比较大众化的评价方式:
43、“裁头去尾”的方法。即去掉一个最高分,去掉一个最低分,然后计算平均分。但是这种计算方式,会使我们忽略某些评委的珍贵信息,而且剩下的两个分数的来当做评阅的依据,就会使试卷有失公平性,使评阅试卷的角度太窄,所以我们须考虑另一种更有效地方法。模型二由于模型一得分数调整仍然使评阅有失公平性,所以我们考虑,能不能有一种方法使我们在不去除每一个分数的前提下,仍然使分数做出了调整呢?顺着问题分析的深入,当某一位评委评分高,我们就乘以一个较小的数,如果有一位有一个评委评分过低,我们就让它乘以一个较大的数,但是这个权值怎么23取呢?我们现在就定义一个权系数,令权系数K n 表示第 i 个评委所评的试卷数。nji
44、jjijiX1_其中, 表示第 i 个评委对第 j 张试卷的分数,则 表示第 i 个评委对ij njijX1自己所评试卷所有评分之和。表示第 j 份试卷评分的平均值。则 表示第 i 个评委所评试卷评ijX_ njij1_分的平均值之和。K 表示第 i 个评委评分的权系数。i因此,我们对下面表格中的数据进行计算,但计算:试 类别1 2 3 4 5 6 7 8 9 10 11 12 13评委一 72 78 85 85 71 76 84 74 70 89 88 81 74评委二 68 77 83 82 67 73 80 63 66 73 86 78 70评委三 71 81 87 86 72 78 8
45、6 70 73 80 90 84 75评委四 69 76 85 83 66 73 82 61 67 84 88 81 73平均分 70 78 85 84 69 75 83 64 69 79 88 81 73我们会得到每一张试卷的合理的评分,如下:其中 n=4;niijjXK124根据公式 K njijjijiX1_计算每一个评委评分的权系数,如下表:评委 评为一 评为二 评为三 评为四评分的权系数 0.9718 1.0385 0.9708 1.0225从上表中的四个评委评分的权系数可知,评委一和评为三的评分有少许的偏高,而评委二和评委四的评分有部分偏低。这也与评委一有故意抬高分数的嫌疑有关。然
46、后我们根据niijjXK1即 =j4 XKjjjj 432*就可以计算每一张试卷的相对来说比较客观的分数,如下:试卷1 2 3 4 5 6 7 8 9 10 11 12 13评分70.02 78.02 85.031 84.02 68.98 75.00 83.00 63.89 68.98 78.90 88.04 81.01 73.01分数调整后,发现最终试卷的分数更加客观,综合了每一位评委对这张试卷的综合评价。下面,我们利用调整后的评分走势图与平均分相比较来分析。25(上表结果程序见附录四)问题五 百分制与等级制的比较我们在前面四个问题当中,我们用的全部都是百分制,只因为,百分制让人看起来直观,
47、一目了然。用百分制计算将会使计算更加精确,使评委对试卷的评阅更容易把握。下面我们通过,我们在问题四中评分调整后的结果进行分析。如下表:试卷1 2 3 4 5 6 7 8 9 10 11 12 13评分70.02 78.02 85.031 84.02 68.98 75.00 83.00 63.89 68.98 78.90 88.04 81.01 73.01如果我们规定在 95 分以上者是 ,在 90 与 95 分之间者为 ;85 分到A A2690 分之间的为 ,80 分以下 85 分以上者为 ,在 75 分与 80 分之间的为A_ B,70 分与 75 分之间者为 ,在 65 分与 70 分之
48、间者为 ,在 60 分与 65B C分之间者为 ,在 55 分与 60 分之间者为 ,在 55 分以下者为 。像这种C_D等级制,就有失公平性,因为他的这个等级的精确度就太粗糙了,而百分制,就会有精确度高的优点,从这一点我们就可以突出他的优越性。首先,我们来分析上面调整的表,试卷三与试卷四,两张试卷相差一分,如果用等级制,就会评试卷三为 ,试卷四就会被评为 ,两人分数相当,A_ B却相差一个等级,不知道分数的人,就会误认为他们有很大差距呢。而实际上,他们的分数相差无几。而且当我们在整合同一张试卷不同评委的等级时,在确定最终结果时,无法定量给出最终结果。因此我们一直倡导使用百分制,使用百分制,可
49、以使人们更能一目了然的知道差距,而且还能够定量的衡量和表示最终结果。但是,百分制也有一些弊端,如,他毫不掩饰的揭露了人和人之间的差距,是人自尊心有了一定伤害。在一定程度上打消了那些心理素质不够强的人参赛的积极性。 是任何事情都有两面性,百分制还是利大于弊呀!六 模型评价问题一中,题目要求给出一种答卷编号加密和解密的数学公式,自然会想到常用且简单的 XOR(异或)运算,该运算简单,易懂。对我们来隐藏参赛者的序号已经足够。但是如果要想保密性更好的话,可以使用 RSA 公约密码算法。由于时间仓促和参赛者自身知识有限所以不能使用更好的算法。问题二中,我们用最大满意度来分配我们的评委,以最大广泛度来分配题目给我们的评委,模