计算机自适应题库实现

作者：时间：2011-07-13 来源：网络

加入技术交流群
- 扫码加入
  和技术大咖面对面交流
  海量资料库查询

计算机自适应测验（Computerized Adaptive Testing，简称CAT）是近年来发展起来的一种新的测验形式。计算机自适应测验不同于传统的纸笔测验，它的测验试题的呈现和被试对试题的解答都是通过计算机完成的。计算机自适应测验也不同于一般的计算机化测验，计算机在测验过程中不光是呈现题目，输入答案、自动评分、得出结果，而且根据被试对试题的不同回答，它能自动选择最适宜的试题让被试回答，最终达到对被试能力作出最恰当的估计。本文将简单介绍计算机自适应测验的原理和方法。

本文引用地址：https://www.eepw.com.cn/article/150474.htm

　　1 题库的分析与实现

　　1.1 原理

　　计算机自适应题库要解决的关键问题是建立适合每一个应试者能力的个性化测验。

　　一般将测量理论分为经典测量理论、概化理论和项目反应理论三大类，或称三种理论模型。人们将以真分数理论（True Score Theory）为核心理论假设的测量理论及其方法体系，统称为经典测验理论（Classical Test Theory，CTT），也称真分数理论。它对建立试卷、考分转换、等值等均有一套较为完整的方法。但随着测验实践的深入，此理论暴露了难以克服的弱点：（1）题目难度、区分度等严重依赖于应试者；（2）对应试者的某项能力或特质水平的估计值，只有当所有应试者使用的都是同一个或并行测验时才是可以比较的，而对于同一能力或特质的不同测验的测量效果则无法进行直接比较；（3）在应用方面，经典测量理论也表现出许多不足。

　　项目反应理论（item response theory）也称潜在特质理论或潜在特质模型，是一种现代心理测量理论，其意义在于可以指导项目筛选和测验编制。项目反应理论假设被试有一种“潜在特质”，潜在特质是在观察分析测验反应基础上提出的一种统计构想，在测验中，潜在特质一般是指潜在的能力，并经常用测验总分作为这种潜力的估算。项目反应理论认为被试在测验项目的反应和成绩与他们的潜在特质有特殊的关系。但在实际考试中，存在有应试者猜题的因素，因此本题库中采用了特征函数的三参数模式。三参数模式的公式为：

　　式中，D＝1.702；θ是应试者能力值；a是题目的区分度；b是题目的难度；c是题目的猜测系数；P（θ）能力为θ的人答对此题目的概率。

　　根据特征函数可画出题目的特征曲线，图1为典型的三参数模式的特征曲线。从该图中可以看出：

　　（1）a参数，即特征曲线的斜率。它的值越大说明题目对应试者的区分程度越高。

　　（2）b参数，即特征曲线在横坐标上的投影。

　　（3）c参数，即特征曲线的截距。它的值越大，说明不论应试者能力高低，都容易猜对本道题目。

　　项目反应理论同经典测量理论相比，最大优点就是项目参数的不变性。对项目各参数值的确定，采用了2种途径：一是经试测后进行统计分析，另一种是由专家进行评估后，再采用统计方法确定参数。这2种途径都存在着统计中使用的样本采集异常困难的问题，因此本题库设计中使用CTT采集样本，结合IRT的三参数模式，确定了试题的3个质量参数。

　　1.2 题库的建立

　　本题库建立过程中，首先要录入试题编号及题干等信息，其次录入参加试题参数测试人员做题情况的信息，最后进行试题的三质量参数测试，并将测试结果写入数据库。

　　1.3 模块设计

　　本题库中的模块及功能如下：

　　（1）试题质量参数测试

　　该模块包括试题的CTT参数计算和IRT参数计算等功能。

　　①试题的CTT参数计算。根据参加试题参数测试人员的做题情况，使用CTT获取标准分Z：