1、自 考 命 题 中 计 算 机 题 库 自 动 组 卷 策 略 研 究尉明宇 耿霞题库是按照一定原则组织起来,技术质量业已查明的,能为一定考试目的服务的大量优良试题的集合,它包括题库技术和题库管理两个方面。本文重点论述的是题库组卷方法的研究。题库的建立使编制测验技术发生了根本性的变革,在发达国家建立的不同级别和不同类型题库实践中,已显示了题库的优越性。随着国内教育测量理论的提高和统计软件的发展,我国在题库建设方面也进行了多次尝试,如近几年开发的 9702 系统、海天题库、通用题库系统等,还有汉语水平考试(HSK) 、部分省开发的一些题库软件和全国英语等级考试(PETS)题库。实践证明,计算机题
2、库至少有三个方面的优越性:第一,管理学上的优越性,即高效、灵活、保密;第二,测量学上的优越性,即高质量、可预控、等值可比、稳定一致;第三,计算机实现技术的先进性,即试题的动态管理和试卷的自动生成和分发。计算机题库支持的计算机化考试不仅可以提高考试的信度,而且可以通过多媒体技术的应用而提高考试的效度。许多学者认为,实现计算机化自适应测验将是考试发展的必然方向。题库组卷的前提是确定题库中试题的参数指标,由于自考题库无法借预试建立参数指标,我们尝试以主观判断来建立难度预估的可能性,并为抽题组卷制定了细致的质性类别,如多层的考核难度、多层的考核点、试题型态、认知层次等。当这些指标建立完整时,题库的字段
3、格式同步完成,筛选试题、题量统计的分析也趋于简便。最重要的,择其质性指标来建立组卷向度,这些向度即可用于人工组卷或自动组卷来完成正式试卷。自学考试命题的突出特点是科目繁多,不同科目的题库建设规模不同,因此组卷所采取的策略也应有所差别。根据题库建设周期所处的不同阶段,组卷策略可确定为手动组卷、双向细目表组卷、智能自动组卷。三种组卷策略对题库规模要求不同,在某课程题库建设初期,试题数目相对较少,可以采取手动组卷,随着试题逐渐增多,各个考核点、题型、难度等的交叉点上都存在试题后可采用双向细目表策略,当题库愈加完善可采取自动组卷策略。1.1 基于双向细目表的组卷策略采取双向细目表策略组卷时,系统可保存
4、教师制定的每一份细目表,并允许教师之后对其进行局部修改,所以,只要考试大纲和试卷的结构不发生根本性变化,教师即可用该份细目表多次组卷,每次抽题试题内容不同,但试题的参数和整个试卷的试题分配比例是相同的,这种组卷策略尤其适合于诸如自考之类的定期的标准参照性的考试。1.1.1 利用双向细目表命题的优势建立“命题双向细目表” ,主要是参照美国著名教育心理学家布鲁姆关于认知领域中的教育目标分类体系,结合学科的具体特点,由任课教师和专家共同研究确定。 “命题双向细目表”由三个要素组成:(1)考查目标,亦称考查能力层次。它具体回答了考试是“考什么”的问题,也体现了该门课程对学生要求应具备的具体能力。(2)
5、考查内容,亦称考查的知识块。它反映了考试的基本素材,即反映了课程的基本纲要或内容体系。(3)考查目标与考查内容的比例,亦称权重。它反映了考查目标和考查内容各项目之间的相对重要性。应用“双向细目表”命题的优势在于:(1)可以克服考试命题的主观随意性以往大多数考试命题时,主要凭借教师的经验,随意性较大,命题缺乏明确的计划和标准,试题取样不恰当,覆盖面较窄,教师把注意力集中在每道题目的内容细节上,却不利于从全局上把握试卷的总体参数特征,这样必然会影响试卷的质量。而“双向细目表”体现了考核目标、考查内容和考核难度等多个维度上的比例分配,从全局把握试卷的内容,教师在出卷之前已做到心中有数,可有效地避免教
6、师的主观随意性。(2)可作为评价教学质量的依据“双向细目表”在很大程度上体现了教学阶段的“质” (即考查目标与内容)和“量” (即考查的比例)具体要求。由计算机根据“双向细目表”组出的试卷将完全符合命题细目表中的各项要求,在考完之后可以利用其作为教学质量评价的依据。(3)一次制定重复使用由于“双向细目表”只是详细制定了课程的考核内容以及各题型的分配比例,并没有涉及到具体试题,故只要命制一次,如果今后没有其他变化便一劳永逸,依据此份细目表重复组卷。在本系统中提供了保存细目表的功能模块,使教师可以利用以前制定的细目表命制一份新的试卷。1.1.2 利用双向细目表组卷流程分析依据自学考试的命题原则制定
7、了适用于自学考试的“命题双向细目表” ,如表 1-1 所示:表 1-1 自学考试命题双向细目表单项选择题(_分/题)填空题(_分/题)题型预计难度题量认知层次 A B C D A B C D小计合计备注考核点 1考核点 2小 计合 计说明:1、预计难度:A易;B中等偏易; C中等偏难;D难2、认知层次:识记;领会;简单应用;综合应用为明确测量目标,把握考核点的比例和形式,提高命题的科学性,系统采用基于考核点分值分配的细目表的方式规划试卷蓝图,双向细目表采用向导方式,引导教师完成双向细目表的命制,用户在每一步骤中均可以选择“上一步” 、考核内容“下一步”进行步骤之间的切换,并且在向下一步切换时,
8、会进行试卷的一致性检查(如分配的各个分值与总分是否一致):第一步:填写试卷总体参数。相应填写试卷名称、试卷总分、试卷号,选择试卷的命制时间等参数。第二步:选择题型及其分配方式。教师根据试卷的要求选择需要的题型,并为每一题型选择分配方式,即统一分配和独立分配,统一分配指一种题型的题目分值相同,独立分配可以为一种题型的不同题目分配不同的分值,并为统一分配的题型提供每题分值。教师可以随时调整已选择题型的呈现顺序并编辑修改,提交后,试卷题型按编号呈现。如图 1-1 所示:图 1-1 (第二步)选择题型第三步:设计试卷蓝图。如图所示,该蓝图即生成了自学考试命题细目表中的第一维表单,题型列是根据上一步中选
9、择的题型而动态设定的。教师先选择预命制试题的考核点(即选择考核内容)并添加到表单中,并在总分值中填写想要分配给该考核点的分数,然后填写各题型各考核点想要命制的试题数目和分值,合计一行会根据教师填写的信息计算出结果并动态改变其值。图 1-2 (第三步)填写考核点分值分配第四步:考核目标详细分配。在每个考核点后点击详细分配,进入到细目表的第二维菜单,详细分配各考核点的将命制的试题的难度层次和能力层次,若不分配题不填即可。如图 1-3 所示:图 1-3 (第四步)每个考核点的考核目标的详细分配第五步:考核目标及内容汇总。该步骤汇总了以上步骤中填入的信息,将用户在各考核点中分配的试题(只是规定了参数,
10、并没有绑定具体的试题)按题型分类,用户可以使用上移下移按钮在同一题型中改变试题参数的顺序,这个汇总表将作为系统抽题的依据。如图 1-4 所示:图 1-4 (第五步)考核目标及内容汇总第六步:保存细目表。保存后制定细目表过程结束,教师可以立即进行抽题,也可保留以后再抽题。系统将根据考核目标及内容汇总信息进行抽题,抽题后教师可针对某一道题进行换题,系统会将试题库中与该题参数一致的试题以列表形式呈现,教师可以选择一题替代原题,而又不会破坏细目表中预先制定的规则。具体的抽题算法如下:(1)获取试卷基本信息和题型结构信息。(2)获取试卷题目详细参数设定信息。(3)对每一题型的每一题目用 Select t
11、op 1 * from TestQuestionInfo order by newid() where 语句随机从试题表中抽取一条满足题目详细参数的记录,并标记此题已经被抽取过,直到组卷完成。如果返回的记录数为 0 则进行出错处理。此步中因只随机抽取一条满足条件的记录,而不是把所有满足条件的记录都返回到客户端后再随机选择一条,大大降低了网络传输负荷。(4)将试题的已抽取标志取消,并修改试题的命中次数,最后命中时间等属性。(5)将试卷内容存入数据库以便以后查找试卷。1.2 基于遗传算法的全自动组卷策略笔者分析了目前智能组卷的常用算法,比较了各种组卷方案的优势和不足,决定采用基于遗传算法的自动组卷
12、策略。深入研究了算法的基本原理和数学模型,确定了面向考核点的适应值函数模型,进行了具体代码的编写和测试,并对实验结果进行了分析总结。1.2.1 遗传算法概述遗传算法 GA(Genetic Algorithm)是一种模拟自然界生物进化过程的随机搜索、优化方法。它是模拟达尔文的遗传选择和自然淘汰的生物进化过程的计算模型,是由美国 Michigan 大学的 John H.Holland 教授于 1975 年首先提出来的。它采用简单的编码技术来表示各种复杂的结构,并通过对一组编码表示简单的遗传操作和优胜劣汰的自然选择来指导学习和确定搜索的方向。由于它采用种群的方式组织搜索,这使得它可以同时搜索解空间内
13、的多个区域,而且用种群组织搜索方式使得遗传算法特别适合大规模并行。在赋予遗传算法自组织、自适应、自学习等特征的同时,优胜劣汰的自然选择和简单的遗传操作使遗传算法具有不受其搜索空间限制性条件(如可微、连续、单峰等)的约束、不需要其它辅助信息(如导数) 、搜索过程不易陷入局部最优点的特点。这些崭新的特点使得遗传算法不仅能获得较高的效率而且具有简单、易于操作和通用的特性。目前,该算法已渗透到许多领域,并成为解决各领域复杂问题的有力工具。遗传算法是具有“生成+检验” (generate-and-test )的迭代过程的搜索算法。在遗传算法中,将问题空间中的决策变量通过一定编码方法表示成遗传空间中的一个
14、个体,它是一个基因型串结构数据;同时,将目标函数值转换成适应值,它用来评价个体的优劣,并作为遗传操作的依据。遗传操作包括三个算子:选择、交叉和变异。选择用来实施适者生存的原则,即把当前群体中的个体按与适应值成比例的概率复制到新的群体中,构成交配池(当前代与下一代之间的中间群体) 。选择算子的作用效果是提高了群体的平均适应值。交叉算子首先将交配池中的个体随即配对,然后将两两配对的个体按某种方式相互交换部分基因。交叉算子是产生新个体的主要方法,它决定了遗传算法的全局搜索能力。变异是对个体的某一个或某一些基因值按某一较小概率进行改变。变异算子是产生新个体的辅助方法。交叉和变异相配合,共同完成对搜索空
15、间的全局搜索。遗传算法是一种群体型操作,该操作以群体中的所有个体为对象,选择、交叉和变异构成的遗传操作,使遗传算法有了其它传统方法所没有的特征。遗传操作的设计与参数编码、初始群体的生成、适应度函数的设计、控制参数设定一起构成了遗传算法的核心内容,一般将它们称之为遗传算法的五大要素。遗传算法可以形式化描述如下:GA= (P (0), N, l, s, g, p, f, t)这里 P(0)= (a1(0), a2(0),,a N(0)I ,表示初始种群;I=B l=0,1 表示长度为 l 的二进制串全体,称为位串空间;lN 表示种群中含有个体的个数;L 表示二进制串的长度;s:I I 表示选择策略
16、;g 表示遗传算子,通常它包括繁殖算子 O :II、杂交算子rO : IIII 和变异算子 O :II;c mp 表示遗传算子的操作概率,包括繁殖概率 p 、杂交概率 p 和变异概率 prc;mf:IR 是适应函数;t: I 0,1是终止准则。N遗传算法的基本步骤如下:(1)在一定编码方案下,随机产生一个初始种群;(2)用相应的解码方法,将编码后的个体转换成问题空间的决策变量,并求得个体的适应值;(3)按照个体适应值的大小,从种群中选出适应值较大的个体构成交配池;(4)由交叉和变异这两个遗传算子对交配池中的个体进行操作,并形成新一代的种群;(5)反复执行步骤 2-4,直至满足收敛判据为止。遗传
17、算法的基本处理流程图如图 1-5 所示:对两父体变异后插入到 P(t+1)图 1-5 遗传算法的基本流程使用遗传算法需要决定的运行参数有:编码串长度、种群大小、交叉和变异概率。编码串长度由优化问题所要求的求解精度决定。种群较大时,又会减缓计算速度,使遗传算法的运行效率降低。一般取种群数目为 20-100。交叉概编码并随机初始化群体 P(0),t0计算 P(t)中每个个体的适应值满足终止条件?k0根据个体的适应值比例选择两父体对两父体实行杂交操作NY输出结果开始结束kN?tt+1YNrandom0,10,q0,p+q=1 。另 q= (即用 q 表示期望的平均得分率,也就是试卷的平满 分 值期
18、望 的 平 均 分 值均难度系数)p=1-q,n=v+1(其中 v 为难度级别数,即若试题难度采用四级分档,就取 n=5),代如公式,求得 P(k),k=0,1,2,n,因为一般而言 q0.6,所以 P(n),P(n-1)通常很小,可以将它们加到 P(n-2)上,将处理后得到 P(k)(k=0,1,2,n-2)作为难度级别为 k+1 的分数比例,再将它们乘以满分值,便得到难度的分值分布。根据用户设定的考试内容和各种题型的题目数,按同一试卷中不出现重题的原则,随机生成初始群体,群体的大小按经验或实验给出;由于自学考试是水平测试,故区分度并不要求越高越好,只要保证其值介于 0.3-0.7 之间即可
19、。另外,对于试卷中统一分配的题型,每题的分值相同,只要按照要求的题目数抽题即可,但是对于分值独立分配的题型(如论述题、计算题等大型主观题) ,试题库中的试题默认分值不相同,因此需要按用户的要求,根据每题分值去题库中抽题,以保证抽出的试题的默认分值与用户预期赋予该题的分值相同。对于如何使生成的试卷中各种题型的题目数满足用户的要求,可以将从题库中的取出的备选试题按用户要求的题型顺序归类排序,并记录每种题型的起始和终止索引,抽题时只在相应题型的范围内抽取即可实现,因此,只要题库题量充裕,这一要求很容易满足。(2)适应度函数在遗传算法中,以适应度大小来区分群体中个体的优劣,一般而言,适应值越大的个体越
20、好,越容易被保留而繁衍下一代,适应值越小的个体越差,更容易被淘汰。适应值的选取是遗传算法设计的关键,它直接决定算法的优劣以及该组卷策略的科学性。本文提出的自动组卷模型是基于考核点分布的,采用如下方法设定适应度函数 F:适应度函数 F 分别由 f1,f2 和 f3 三个子函数组成。f1 表示章节分数分布适应函数:设 Ci、Xi、ei(i=1,2,m ,m 为章的数目)分别表示用户要求的各章应占的分数、实际生成试卷中各章所占的分数、用户允许各章的分数误差。生成的试卷满足用户关于内容分数分布要求的程度可以用公式 1-2 值的大小来评价:f1= (1-2) mid12di=0 当|Xi-Ci| ei|
21、Xi-Ci|-ei 当|Xi-Ci|eim:总章数;Xi:实际分配的分值; Ci 预期值;ei:允许误差该式采用方差来统计章节分数分布的偏差,而不用 di 的差的绝对值来表示,是因为 f1 是用来评价某份试卷对每一章的适应度的误差,只是简单的将误差值累加不能充分表现该试卷每一章的偏差。例如一份涉及十章内容的试卷,其中第三章偏差为 6,另外某四章的偏差为 1,累加之后的误差值为 10;另一份试卷有五章的差值分别都是 2,那么,明显后者的试卷在章节分布上更加符合要求,而累加之后二者的适应函数 f1 均为 10,无法比较出孰优孰劣;而方差是衡量距离预期值波动大小的指标,二者的方差值显然后者要小些,说
22、明后者距离预期值的误差小一些,即生成的试卷越接近用户关于章节考核分数的要求。f2 表示知识点的覆盖率和考核点类型的分配比例的适应值函数。有文献规定一份试卷的考核点不能有重复,而我们认为:在实际组卷中有某些重要考核点是允许有重复的,又可能同一考核点的两道试题考核的侧重点不同或考核的方式不同,故本文以考核点的覆盖率作为一项“软”约束条件,即考核点覆盖率越大,该试卷的适应度越大;同时根据自考命题的经验,一份试卷的考核点类型分布比例越接近 5:3:2,那么该套试卷的命题比例越科学,其试卷的考后成绩越容易呈正态分布,故本文将这两个参数也作为适应度函数之一:f2= +(1 ) (1-3) 222 ).0(
23、)3.()5.0( ncbnatmcn:为本章总分数;a:考核点为重点的分值分配;b:考核点为次重点的分配分值;c:考核点为一般的分配分值;tc 为该套试卷所占的不重复考核点数,tm 为该门课程总考核点数该式的前半部分用于衡量一份试卷的考核点类型比例距离预期比例(即5:3:2)的波动误差,值越小,误差越小,比例越接近;后半部分 tc / tm 得到考核点的覆盖率,用 1 减得到考核点的覆盖率越大,该值越小,故 f2 的值越小,其适应度越好。f3 表示难度分布适应度函数:设 Ai、Si、ei(i=1,2,n,n 为难度等级数)分别表示用户期望的每个难度等级应占的分数、实际试卷中各等级所占的分数、
24、允许误差,生成的试卷满足用户关于难度分布要求的程度可以用公式 1-4 值的大小来评价:f3= (1-4)nid12同理,该式的方差值越小,说明该试卷的难度分布越接近用户预期要求,适应度越好。因此,该试卷的总体适应度值 fmin=f1+f2+f3,该式得到的适应值越小越好,是最小化问题,本文采用如下方法将目标函数 fmin 转化为适应度函数fmax:100fmin , 当 fmin1000 , 当 fmin100fmax=因为指数比例既可以让非常好的个体保持多的复制机会,同时又限制了其复制数目以免其很快控制整个群体,提高了相近个体间的竞争,所以对上述适应度函数 fmax 采用如下指数比例变换方法
25、转换为适应度函数 F: F= exp(fmax) 其中 =0.06 (1-5)(3)选择算子本文的选择算子策略采用期望值模型选择机制,即先计算群体中各个个体期望值被选中的次数 Ni:Ni=MFi (i=1,2,M,M 为群体规模,Fi 为MiF1第 i 个个体的适应值) ,用 Ni 的整数部分 安排个体 i 被选中的次数,这样N其选出 个个体,然后以 Ni 的小数部分作为概率进行贝努利实验,若试MiN1验成功,则该个体被选中,不断重复,直至选满为止。显然,个体适应值越高,被选中的概率越大。但是,适应值小的个体也有可能被选中,这样有助于增加下一代群体的多样性。(4)交叉算子将以上选出的个体进行两
26、两随机配对,对每一对相互配对的个体采用有条di=0 当|Ai-Si|ei|Ai-Si|-ei 当|Ai-Si|ei件的“均匀交叉” ,即两个配对个体的每一个基因座上的基因都按一定的交叉概率 Pc 和一定的条件进行交换,产生两个新个体。本文对于交叉概率Pc的确定采用自适应的交叉概率。简单遗传算法中,交叉率是个常数,而实际上,优良的交叉率与遗传代数的关系较大。在迭代初期,交叉率选择得大一些可以造成足够的扰动,从而增强遗传算法的搜索能力,而在迭代后期,交叉率选得小一些可以避免破坏优良基因,从而加快收敛速度。因此,本文选择的交叉概率是个能随着演化不断调整的函数,称为变交叉概率。交叉概率计算公式为:Pc
27、=max ( 1-6)min,ax,/1ccPtPc是第t代的交叉概率,P 为最大交叉概率 , 取0.7;P 是最小交叉概率 , max,c min,c取0.5;t为遗传代数,t 是最大遗传代数。由于遗传代数t是变化的 , 所以交叉概率Pc是随代数 t变的,除非Pc总是小于P 。每次交叉根据选择概率判min定当前是否进行交叉,如果要交叉,则随机选出一对个体,在两个体(即两份试卷中)中分别随机选择一个交叉位进行交叉,具体的操作是:对两个配对个体的每一个基因座上的基因,先随机产生一个0-1的实数r1,如果r1Pc并且满足交换条件(即交换后个体的各个基因不重复),则交换该基因座上的基因,否则不交换。
28、(5)变异算子由于普通的变异操作可能会使用户指定范围外的题目出现在染色体中,也会使各题型的题目数难以保证,本文采用有条件的变异算子,即每个个体的每一个基因座上的基因都按一定的变异概率Pm在一定的范围内(考试范围内与该基因题型相同,独立分配时还要保证备选试题的默认分值与要换掉的试题分值一致)进行变异。同样,本文对于变异概率的选取也采用自适应变异概率。在简单遗传算法中,变异率是个常数。通常,对于交叉率是常数的情况,群体的素质会趋于一致,这样就形成了近亲繁殖。但众所周知,“近亲繁殖对后代的质量不利”。同理,如果双亲的基因码链非常接近,其后代素质的提高也极少。因此,群体基因的多样性变差不仅会减慢进化历
29、程,也可能会导致进化停滞,过早收敛于局部最优解。目前,许多学者都认识到变异率需要随着遗传进程而自适应变化,这种有组织性能的遗传算法具有更高的鲁棒性、全局最优性和效率 。因此,变异概率也能随着演化不断调整,由于概率表达式中含有遗传代数t,这个概率称为变动变异概率。变异概率计算公式为:P =maxP exp(-t/t ),P (1-7)mmax, maxin,ct为遗传代数;t 是最大遗传代数;P 为最大变异概率,取0.15;P 是ax a, min,最小变异概率,取0.01;为常数,取10。每次变异通过交叉概率判断当前是否变异,具体的操作是:对于个体的每一个基因座上的基因,先随机产生一个0-1的
30、实数r1,如果r1Pm,则根据一定的变异条件,即从备选题库中抽取一道同类型同分值的试题,同时保证该题不存在于该份试卷中,替换该基因座上的基因,否则不变异。(6)保存最优策略为了保证优良个体在选择的过程中不被淘汰,本研究采用了保存最优策略。对当前代进行了选择、交叉、变异操作产生新一代后,比较新一代的最好个体与其父代的最好个体的适应值,如下降,则以父代最好个体替换新一代的最差个体。此策略可以保证迄今为止的最优个体不会被交叉、变异等遗传运算所破环,它是遗传算法收敛性的一个重要保证条件。基于遗传算法的组卷算法的具体实现如下:定义最大遗传代数:GenMax、种群规模:PopSize等参数接收用户的组卷要
31、求定义当前代数gener=0GetArrayDifficulty()根据输入的期望平均分求期望难度分配make_begin_population() 产生初始群体并计算其个体的适应值While(generGenMax并且当前代的最优个体没有达到终止条件)choose_population() 运用期望值模型选择策略从当前群体中选择生成下一代的父体CrossGen2(gener) 交叉mutation(gener) 变异best_num = save_best_policy() 比较新一代最优个体与上一代最优个体的适应值,如果下降,则用上一代最优个体替换下一代最差个体if 各章节差值都小于ei
32、then抽到满意试卷Exit WhileEnd ifgener=gener+1End While输出最优个体的编码,并计算各章节分布分数、各难度级别分数、考核点类型分布等指标,输出以上指标的值并与用户的输入参数比较。1.2.4 试验结果及分析1试验条件为了验证上述算法的可行性和有效性,我们利用一门计算机课程的题库进行研究,该题库中有 1000 道题,其题库结构如下所示:题型共有 8 种:单项选择题(1 分/题) ,多项选择题( 2 分/ 题) ,填空题(1 分/空) ,名词解释题,简答题,计算题,论述题,其中后四种题型为独立分配题型,为了试验简明,设这四种题型的分值为 35 分;题数:单项选择
33、题 300 道,多项选择题 200 道,填空题 100 道,名词解释题100 道,简答题 100 道,计算题 100 道,论述题 100 道;难度级别题数:易 200 道,中等偏易 300 道,中等偏难 300 道,难 200 道;章节:10 章,包含 41 个考核点。2试验目标(1)组卷 10 套,总分为 100 分,题型分配如表 1-2 所示:表 1-2 题型分配表题型 分值 分配方式 备注单项选择题 30 统一分配 每题 1 分多项选择题 30 统一分配 每题 2 分填空题 10 统一分配 每题 1 分简答题 12 独立分配 3 分,4 分,5 分论述题 8 独立分配 3 分,5 分(2
34、)预期平均分为 70 分,经过计算得出预期难度分配为:易:中等偏易:中等偏难:难=20:36:31:13(3)要求考核点覆盖率达到 70%以上,平均区分度在 0.3-0.7 之间,平均难度为中等偏易或中等偏难等级,考核点覆盖率(即重点:次重点:一般)接近 5:3:2(4)章节分值分布如表 1-3 所示:表 1-3:章节分值分布表第一章 第二章 第三章 第四章 第五章 第六章 第七章 第八章 第九章 第十章15 7 20 13 0 12 5 6 10 123试验结果:参数设置:设最大迭带代数 GenMax=100 代,允许误差 ei=2 分,群体规模GenSize=100;先后进行十次组卷,组卷
35、结果如表 1-4 所示:表 1-4 组卷结果分析表卷号实际难度分布实际章节分布 章节分布最大误差考核点分布 平均区分度考核点覆盖率1 19:37:29:15 (12) (5) (18) (15) (0)(15) (6) (9) (8) (12)3 40:36:24 0.499 76.6%2 22:34:31:13 (15) (8) (23) (11) (0)(10) (6) (7) (8) (12)3 46:30:24 0.526 67.2%3 22:31:33:14 (13) (8) (20) (11) (0)(11) (6) (6) (12) (13)2 48:30:22 0.538 86
36、.0%4 18:35:32:15 (12) (7) (22) (15) (0)(10) (7) (6) (9) (12)2 51:38:21 0.479 73.4%5 22:34:33:11 (13) (6) (18) (9) (0)(15) (8) (8) (11) (12)4 50:25:25 0.553 81.3%6 21:36:29:15 (15) (9) (18) (13) (0)(13) (4) (8) (10) (12)2 48:33:20 0.504 71.9%7 17:38:33:12 (15) (6) (21) (13) (0)(12) (6) (7) (9) (11)1
37、45:29:26 0.507 82.8%8 18:38:30:14 (14) (7) (20) (14) (0)(13) (5) (6) (9) (12)1 52:29:19 0.612 75.6%9 22:35:30:13 (14) (8) (19) (15) (0)(10) (7) (6) (8) (13)2 47:34:19 0.601 80.2%10 23:33:30:14 (14) (7) (22) (11) (0)(11) (7) (6) (10) (12)2 50:28:22 0.594 78.3%通过对这十次组卷结果的分析,可以看出各章的分布基本满足预期要求,难度和考核点类型比
38、例基本接近正态分布,区分度在 0.40.7 之间,考核点覆盖率基本到达 70%以上(除第二次组卷外);由于定义误差 ei=2,故如果各章误差均小于等于 2 分,即视为已经找到了最优解集中的一个最优解并输出其参数,如果进化到第 100 代,仍然没有上述情况出现,则取最后一代中适应值最大的解并输出。由上述试验结果可知,试卷号为 1、2、 5 的试卷章节分布的全距超过 2 分,但偏误不太大;并且,试卷参数的满足与否与题量、各题型分配的比例(尤其是独立分配的题型)以及初始群体的选择有关。展望本研究针对自学考试命题的特点进行研究,在组卷策略方面有一定的突破,并具有较强的实用性,基本达到预期的效果。但本研
39、究所涉及的知识面广,技术先进,是艰巨且复杂的工程;加之作者本身的经验和技术有限,难免造成理论体系不完善、设计不完备、技术实现不成熟等问题,敬请批评指正。本研究并未终止,今后的研究方向和工作计划已经制定:(1)自动组卷策略算法的优化目前的自动组卷算法还处于测试试用阶段,但组卷过程所需时间过长,并且未达到 100%的组卷成功率,还需要进一步研磨算法,对算法在设计上和性能上进行优化。(2)兼有多考核点试题的处理问题目前研究的试题只能属于一个考核点,对于多考核点的试题选择其主要考核点作为所属考核点,采用这种策略是由于受自动组卷算法的限制。因此,今后要将多考核点的试题考虑到系统中,并完善相应的算法,使其
40、可以适合兼有多考核点的试题。(3)试题“近似度”的分析问题自学考试是大规模的考试,要求同一份试卷中的试题不能相互暗示,这将涉及文字识别、试题的“近似度”分析等更加复杂的技术,这将是本系统今后需要攻破的难点之一。参 考 文 献1 海天题库EB/OL,http:/ 中基教育软件有限责任公司EB/OL,http:/ 全美测评软件系统(北京)有限公司EB/OL,http:/ 张敏强. 教育测量学M. 人民教育出版社. 2005.4 5 朱德全,宋乃庆.现代教育统计与测评技术M. 西南师范大学出版社.1999.66 王孝玲.教育统计学M.华东师范大学出版社.2002.17 杜洪飞.经典测量理论与项目反映
41、理论的比较研究J.社会心理科学.2006(6). 15-178 尹汉明. 一种通用题库管理及组卷系统的设计与实现J. 井冈山医专学报, 2003.9, 10(5): 74-769 丁仕虹.网络试题库系统选题组卷策略优化及算法设计、实现D. 华南理工大学.200310 余胜泉,姚顾波,何克抗.通用试题库组卷策略算法R.200011 曾一,冉忠,郭永林.试题库中自动组卷的算法及试卷测评策略J.计算机工程与设计. 2006.8.3024-302712 张敏.网络试题库系统成卷理论的研究及成卷质量的评价D. 华南理工大学.200313 付厚荃.利用遗传算法实现试题库的自动组卷D.天津师范大学.200614 陈丽娜.基于遗传算法的试题库组卷方法研究D.华东师范大学.200515 张爱文,樊红莲.自适应遗传算法用于自动组卷中的数学模型设计J.哈尔滨理工大学学报.2006.11.18-2016 张辰,张艳群.基于遗传和模拟退火算法的自动组卷系统设计与实现J.计算机工程与科学.2004(11).65-6817 教育部考试中心题库工作组.谈教育考试国家题库建设中国考试2008(4).9-1018 教育部考试中心题库工作组.谈教育考试国家题库建设中国考试2006(12)19作者单位:天津市教育招生考试院天津师范大学