1、项目分析难度与区分度的计算一、难度难度:指项目的难易程度。难度的计算:(1)二分法计分项目的难度计算(只有答对或答错两种情况)1、通过率用题目的通过率估计难度。被试正确回答或通过题目的人数与总数之比。(R 为通过人数,N 为总数)p主要用于客观题的难度计算。优点:比较简单,适用于小规模测试。缺点:难度的指标是根据样本水平来确定参照点的,具有相对性。所反映的是项目的相对难度,而不是绝对难度。此 P 值易受到项目的编制技术以及受测者的经验的影响。不够可靠。不适用于人数较多的大规模测试中。2、两端分组法当被试人数较多时,可将被试依照测验总分从高到低排列,分成三组,当测验总分分布符合正态分布时,高分组
2、和低分组各占 27%;分布较平坦时,应高于 27%。一般介于 27%33%之间。 )(2率分 别 为 高 、 低 分 组 通 过、 LHPL优缺点:易受到高低分组的标准的影响。(2)非二分法计分项目的难度1、用被试得分平均数估计对于简答题、论述题等题型,每个项目不只有答对和答错两种可能,是从 0分至满分之间。此类题常用以下计算公式: )( maxmax 为 该 项 目 的 满 分的 平 均 得 分 ;为 所 有 被 试 在 该 项 目 上 XXP优缺点:按此公式计算难度时, 可用随机抽样方法 , 以使样本具有代表性, 也利于统计分析。当测验不是二值计分时,且受测者人数很多时,难度等于总分上高分
3、组与低分组平均分之和与 2 倍满分之比。( 分别代表该项目上高分组,低分组的平均分;满分。maxplhmax,lh)2、用难度的校对公式计算在多项选择题中,由于有猜测的成分,被试的得分可能被夸大,不能反映测验的难度,吉尔福德提出了一个难度矫正公式: )(1 为 选 项 的 数 目为 实 际 得 到 的 通 过 率 ,为 矫 正 后 的 通 过 率 , KPCPK优点:当猜测成分占的比重较大时,不能真实反映实际情况时,适合用这个公式。二、区分度1、区分度的定义:指测验项目对被试心理品质水平差异的区分程度,又称鉴别力。也指一道题能多大程度上把不同水平的人区分开来。区分度越高,越能把不同水平的受测者
4、区分开来,该道题目被采用的价值也就越大。2、区分度的指标项目区分度的取值区间为1,-1,数值越高,说明试题设计得越好,一般认为,区分度的数值达到了 0.30,便可以接受;低于 0.30 的项目,则区分能力差。(1)项目鉴别指数法1、鉴别指数的计算(适用于二分法计分的测验项目)当效标分数是连续变量时,可以从分布的两端各取 27%的被试,分别计算每道题目的通过率,二者之间的差别就是鉴别力指数(D ) 。D 越高,项目的鉴别力越大,题目的质量越好.一般来说,某项目的 D 值在 0.4 以上,表示该项目优良;D 值在 0.300.40 之间,表示项目良好,但如能修改会更好;D 值在0.200.29 之
5、间,表示项目尚可,仍需修改;D 值在 0.19 及以下的项目则是必须淘汰的项目。 )( 过 率分 别 代 表 高 低 分 组 的 通、 LHPD优点:运算过程相对较为简单,计算方便,容易理解,但是结果不精确。缺点:(1)计算口径不一致, 缺乏可比性;(2)对主观题得分相同时公式失败;(3)主观题的区分度受最高分和最低分和分组标准的影响,缺乏稳健性。2、极端组的划分当样本较大(100)或分布是正态分布时,一般按照高低分组各取 27%规则进行。当样本太少(100)时,则不能用 27%规则,可取 50%作为分界点,直接分为高低分组。(三) 、相关法(项目总分相关)在大规模或标准化测验中,多采用相关分
6、析法,即以项目分数与效标分数(或测验总分)的相关作为项目区分度的指标。相关越高,区分度越高。1.点二列相关适用项目是 0,1 计分或二分变量(或双峰分布) ,效标分数(或测验总分)是连续变量的数据资料的分析。 qpsxrpqsxrtpbtpb 或为点二列相关系数; 、 为通过、未通过该项目被试的平均效标分数;pb p为通过、未通过该项目被试人数的百分比;q、为全体被试的效标分数的标准差; 为全体被试的平均效标分数。ts tx缺点:易受样本容量的影响。2.二列相关适用于连续的测量变量,但其中有一个变量被分成两类的数据资料。如当一个测验的项目分数是连续变量,而总分被分成高低(及格、不及格)两个类别
7、;或当一个测验的效标(总分)是连续变量,而项目分数被分为对、错两个类别时,可用此计算方法。ypsxrypqsxrtbtb 或为二列相关系数; 为正态分布下 p 与 q 分割点正态曲线的高度;b、 为通过、未通过该项目被试的平均效标分数;pxq为通过、未通过该项目被试人数的百分比。、为全体被试的效标分数的标准差; 为全体被试的平均效标分数。ts tx缺点:易受样本容量的影响。3.积差相关对于非二分法计分的题目,可以用积差相关来计算区分度。但是当某一题目分数在总分中占的比重较大时,该题目的区分度可能会被高估。为此,有时会从总分中扣除该题目分数,再来计算相关。(x,y 分别代表被试在该yxSNr)(项目上的得分和被试所得总分)缺点:由于相关关系数 r 跟抽样数据的容量有关:观测数据越多,其相关系数r 值就越稳定,因而,真实性也相对越大。若抽样数据容量较小,计算相关系数r 值的抽样误差也越大。所以用此系数来作为区分度指标时,也会有这种缺点。除此之外,受变量取值范围的影响也大。