关 闭

新闻中心

EEPW首页 > 工控自动化 > 设计应用 > 基于图像识别的阅卷系统的设计与实现

基于图像识别的阅卷系统的设计与实现

作者:时间:2011-06-14来源:网络收藏

高校学生的期末考试是普通高等学校管理的一项重要工作,它是根据国家对高等学校学生德智体全面发展的要求,按照统一的原则、方法和程序,对学生学习和行为的表现进行阶段和全程的质量考核、记载、评价和处理。目前客观题型较多的英语考试或计算机基础考试均自动化,无需教师干预,既能加快试卷反馈的速度,又能保证公平公正。传统的利用光学标记阅读机的光电变换原理,对填涂在答题卡上的内容进行高速采集,然后进入计算机处理[1]。但是它对答题卡纸张和印刷质量要求太高,如套印误差和剪切误差必须分别控制在0.1 mm和0.2 mm以内;对使用者涂写要求太高,限制太多,如需要用专用铅笔涂满长方条,不得涂出长方条外,整张答题卡涂写要深浅一致等;机械传动机构复杂、使用寿命短、维护量大、设备一致性差[2]。
 本文提出一种,允许使用者使用任何颜色的圆珠笔、钢笔或铅笔在一般纸张的固定位置上涂写如“√”、“w”、“○”等手写符号完成答题,由阅卷采用技术自动答题卡信息,阅卷自动化。本系统与传统的光学标记阅读机阅卷系统的不同之处在于,本阅卷系统对答题卡纸张和填涂符号均无特殊要求,无需特制答题卡,无特殊涂写要求[3]。
1 系统流程及模块组成
 (1)和定义答题卡,将允许用户填写的手写符号限定在一定的矩形区域内;
(2)通过CCD采像设备采集答题卡,经扫描、采样、量化等过程,同时将答题卡图像以JPG格式保存在主机内存和硬盘里;
 (3)对答题卡图像进行预处理,包括粘连字符分割、灰度变换、二值化、图像偏斜纠正、平滑和细化等过程,以将答题卡固有的纸张问题、书写不规范、答题卡传动机械定位精度所带来的干扰因素排除掉,并为后续的识别工作做好准备[4];
 (4)对答题卡信息进行识别。通过图像分析抽取图像,并经过综合特征提取,结合答题卡表格的逻辑结构和几何结构,准确识别填涂在矩形块位置上的“√”、“w”、“○”等手写符号得到答题信息。答题卡识别算法的优劣决定了整个系统的性能(如识别的精度、可靠性等),是整个软件系统中最重要的部分;
 (5)对识别的答题信息进行加工、整理、分析和统计,结合软件的设置对答题卡信息进行判分。
 综上所述,系统实现流程如图1所示。

本文引用地址:http://www.eepw.com.cn/article/161968.htm

 为了便于学生和教师查询和分析阅卷结果,本阅卷系统还设置了用户登录模块、学生信息管理模块、课程基本信息管理模块、试卷分析模块、成绩查询模块、答题卡图像查询模块、报表打印模块和补考管理模块。其中试卷分析模块对试卷的各项数据进行分析和统计,包括最高分、最低分、平均数、及格率方差、标准差等,完成试卷分析功能;答题卡图像查询模块允许学生通过姓名查询存储在硬盘中的答题卡图片;补考管理模块统计不及格、缺考或舞弊学生信息,生成补考表;报表打印模块完成答题卡图片、成绩报告单、试卷分析报告和补考表等的打印功能。系统模块组成如图2所示。

2 系统主要实现技术
2.1答题卡

 答题卡成表格的形式,由试卷答题卡基本信息、考生基本信息、答题卡填写说明及题目选项列表组成,考生用“√”、“w”、“○”等手写符号在相应的矩形框中选择答案。答题卡示例如图3所示。

 答题卡版面与普通表格一样具有几何结构和逻辑结构,几何结构反映了所填写的信息区域的位置和大小,逻辑结构则表示答题卡中所填写信息的实际意义以及填写信息与填写项之间的对应关系。
 在传统的光学标记阅读机阅卷系统中,答题卡的几何结构大部分都是采用定位标记块进行描述,这种描述方法具有很多缺点,如浪费版面空间、缺乏灵活性、版面设计比较复杂、对印刷质量要求高、不便于修改等,而且定位标记块看起来也不美观。在本系统答题卡版面中,填写信息在几何结构上可以看成由若干个互不相交的矩形块组成,它们组成了答题卡版面的最小单位[5],可以以答题卡的边框线建立二维坐标系,以矩形的对角顶点坐标来描述矩形块的位置和大小,完成对答题卡的几何结构描述,该方法简洁、灵活,便于识别。
  答题卡的逻辑结构描述是定义矩形块的属性。矩形块的属性包括对填写项以“√”、“w”、“○”表示的选择或者不选择。
  本系统采用文档结构描述语言同时对几何结构和逻辑结构进行描述。设一张答题卡包含n个填写有信息的矩形块B1,B2,...,Bn, 矩形块之间存在着上下结构和左右结构的几何位置关系,其逻辑顺序一般是从上到下、从左到右,在描述文档结构时也采用这种顺序,则文档结构描述语言DDL 表示如下:

其中i 是答题卡的序号;n是矩形块的总数;xi为矩形块在水平方向的位置;yi为矩形块在垂直方向的位置;li为矩形块的长度;wi为矩形块的宽度;attri表示矩形块的属性,当attri为0时,表示该矩形块的填写内容为待识别的字符,attri为1时,矩形块作为图像保存。
 将答题卡设计成常见的表格形式,一方面它和一般考试用到的答题卡的形式类似,符合人们的使用习惯和书写习惯;另一方面可以利用文档描述语言对它的几何结构和逻辑结构进行描述,以便更好地对矩形框内的字符特征进行提取与识别,辨别矩形框中的字符,与标准答案比对,对考生客观题进行判分。
2.2 答题卡信息识别
 本系统采用汉字识别方法中的统计决策方法对手写字符进行识别,如图4所示,首先提取字符特征,对字符进行分类判别,经过训练和识别两个阶段,最后识别出字符[6]。训练阶段,收集日常人们习惯的手写符号为样本,经过筛选分类建立样本库,以便对待识别字符进行分类和识别。识别阶段,将待识别符号的特征与训练阶段中所建立的标准样本特征比较,计算最大相似度以判别该手写符号所属的类别[7]。

2.2.1 字符特征提取
 学生在答题过程中由于紧张和个人原因,写出的√、w、○等答题符号往往千变万化。为准确识别这些手写符号,需要进行字符结构特征提取,将最能体现这个字符特点和字符间差异的结构特征提取出来。本系统提取的特征是以下特征的组合。
 (1)点特征
 点特征是一种重要的结构特征,是指字符笔画中的端点。端点反映了字符中笔画的起点和终点信息,与该点相连的点数为 1。
 (2)笔画密度特征
 笔画密度特征是取得符号水平方向笔画密度函数d(x)和垂直方向的笔画密度函数d(y),然后进行相同项合并[1]。如图5所示,符号“○”水平方向笔划密度函数d(x)和垂直方向的笔划密度函数d(y)分别是: d(x)=(1,...,1,2,...,2,1,...,1),d(y)=(1,...,1,2,...,2,1,...,1),则合并后笔画密度可表示为d(x)=d(y)=(1,2,1)。


上一页 1 2 下一页

评论


相关推荐

技术专区

关闭