1、Using Item Response Theory to Equate and Choose,WANG, Li Jun Assessment Research Center,BILOG-MG的使用,EXAMPLE 1: yan2EXAMPLE 2: engAEXAMPLE 3: engCEXAMPLE 4: yan3 EXAMPLE 5: equating,Vertical equating(铆测验等值方法 ),所谓铆测验,就是在不同测验形式中放置的一组共同的试题,根据这组试题就可以校准不同组被试能力的差异,从而得到测验形式之间的等值关系。,两个等值应用,三个专业的统计测验等值两个专业的英语
2、测验等值,研究目的:探察先前知识水平(prior knowledge)对后续学习的影响,三个专业:教育学专业(group 1): 大学入学分数第二应用心理学专业(group 2):大学入学分数第一心理行知专业(group 3): 大学入学分数最低大学统计课程由同一个教师任教,学习内容相同,但是期末考试时间不同,试题不同,每个专业考试时共20个单向选择题,为了比较三个专业的能力、估计所有题目的IRT参数,特设置如下:教育学专业的后10个题目是应用心理学专业的前10个题目,应用心理学专业的后10个题目是心理行知专业的前10个题目,这样三个专业就通过铆题可以互相进行能力等值比较。在BILOG-MG中
3、可以看成总共40个题目。(total 40 items),Items 11 to 20 appear in the group 1 and group 2; Items 21 to 30 appear in the group 2 and group 3 。,Estimates,The item parameters estimatesThe ability distributions of the groupsThe ability estimatesGroup 2 serves as the reference group in the calibration of the items.
4、EAP estimates of ability are calculated using the information in the posterior distributions from phase 2. The ability estimates are rescaled to a mean of 0 and standard deviation of 1 by specifying RSCTYPE=3 on the SCORE command.,Solve this question?,If I have a mix of different type of credit, how
5、 to equate? 上面我们使用的只是测验中的一个题目,整个期末测验包括四个大题,有二级记分(Dichtomous scoring) ,也有多级记分(polychotomous scoring),那么对于这样的测验,如果把试题全部放在一起,如何等值,这时可以利用全部的信息,研究目的:比较两个学院的英语水平,两个学院专业不同,涉及到各自的专业英语客观题分为3个部分,听力、阅读理解、词汇;其中听力1-10题,分别基于10句对话,11-14题基于一篇短文对话,15-17题基于一篇短文,18-20题基于一篇短文;阅读理解部分21-25题基于一篇短文,26-30题基于一篇短文;词汇31-50题分别基
6、于50句话。2个学院测验数据中听力题与词汇题是一样的。,Items 21 to 50 appear in the group 1 and group 2 (total 70 items),To compare two kinds of test scoring strategies applying item response theory,绘制概念图的任务,用下列概念绘制概念图:力、冲量、刚体、力矩、质点、功、转动惯量、质量、动能、动量、转动动能、角动量、力矩的功、冲量矩,概念图的两种记分方法,一种是只按知识编码数记分,有该项知识编码记1分,无记0分另一种是按学生的知识编码的质量分别记2分、
7、1分、0分,17,Rasch Dichtomous Model,Datafile gnt1.dat;Format id 1-7 responses 8-32;Model item;Estimate;show cases !est = eap gnt1.eap;show cases !est = mle gnt1.mle;show cases !est = wle gnt1.wle;show cases !est = latent gnt1.lat;Show gnt1.shw;Itanal gnt1.itn;Plot icc;Plot mcc ! legend=yes;,18,Rating Sc
8、ale Model,Datafile gnt2.dat;Format id 1-7 responses 9-34;codes 0,1,2;recode (3,2,1) (2,1,0);model item + step; /*Rating Scale*/estimate;show cases !est = eap gnt22.eap;show cases !est = mle gnt22.mle;show cases !est = wle gnt22.wle;show cases !est = latent gnt22.lat;show gnt22.shw;itanal gnt22.itn;Q
9、uit;,19,Partial Credit Model,Datafile gnt2.dat.dat;Format id 1-7 responses 9-34;codes 0,1,2;recode (3,2,1) (2,1,0);model item + item*step; /*Partial Credit Model*/estimate;show cases !est = eap gnt3.eap;show cases !est = mle gnt3.mle;show cases !est = wle gnt3.wle;show cases !est = latent gnt3.lat;show gnt3.shw;itanal gnt3.itn;quit;,