新闻中心

EEPW首页 > 嵌入式系统 > 设计应用 > 基于ARM的文本独立笔迹鉴别系统设计

基于ARM的文本独立笔迹鉴别系统设计

作者:时间:2016-09-12来源:网络收藏

笔迹,是具有个人特征的书写文字符号的形象系统,与个人书写习惯有密切联系。利用计算机进行个人,是模式识别的分支问题,是通过分析比较不同人笔迹的书写风格来判断书写者身份的一种技术方法。(Text—independent)是指进行鉴别时,对书写者书写的内容没有特殊要求,具有样本依存性小、信息采集方便等特点,具有广泛的应用前景。通过对笔迹分析做出身份判断,在计算机登录、电子商务、金融安全、文物监测、信息安全等方面具有重要应用。国内外对基于PC平台的系统算法进行了细致研究,师宝山等人解决了纸质笔迹信息的预处理问题,张德贤等人提出了笔迹信息的特征提取算法,刘海等人提出了基于轮廓方向特征提取的方法,刘爱真提出了利用希尔伯特-黄变换(HHT)方法对脱机手写体汉字特征进行提取,杨彩霞提出了基于和最邻近分类器的笔迹鉴别方法,刘宏等人提出了基于纹理分析优化(Support Vector Machines,SVM)的笔迹鉴别方法。这些方法的鉴别性较好,可实现性强,但都局限在PC系统层面,笔迹的采集方式复杂,不能实现实时的笔迹鉴别系统。本文提出了一种基于嵌入式系统的实时笔迹鉴别系统,该系统主要针对离线的笔迹进行嵌入式鉴别研究,使用ARM终端实时采集笔迹信息,使用Gabor滤波器提取笔迹样本的纹理特征,使用(SVM)训练和识别笔迹信息的特征。

本文引用地址:http://www.eepw.com.cn/article/201609/304006.htm

1 笔迹鉴别系统总体设计

基于ARM的笔迹鉴别系统主要由3个模块部分组成,包括笔迹采集端、数据传输部分、上位机处理部分。系统的总体设计原理如图1所示。

基于ARM的文本独立笔迹鉴别系统设计

进行笔迹鉴别时,需要提前将书写人笔迹数据存入系统数据库中,以便于后期比对分析。待检测人需通过笔迹采集端的手写式触摸屏实时输入手写笔迹信息。笔迹采集端进行简单处理后通过数据传输部分传送给上位机,上位机接收数据后采取笔迹鉴别算法对实时采集的笔迹信息进行预处理和归一化操作。处理后的笔迹数据通过Gabor滤波器和支持

向量机方法与数据库数据进行比对,从而实时显示书写者的身份信息。

2 基于ARM的笔迹采集端技术及设计

文本独立的笔迹鉴别系统的笔迹采集端主要负责笔迹信息的实时采集及发送功能,主要由ARM核心处理器、触摸屏模块、书写信息显示模块和数据发送端口组成。

2.1 笔迹采集模块

触摸屏部分是笔迹采集的关键核心,主要由电阻式触摸屏和触摸屏控制器组成,负责笔迹信息的实时采集。采集的数据信息将被实时保存成图片格式并简单处理后发送。电阻式触摸屏的基层是玻璃。玻璃上面涂覆有两层透明氧化金属(ITO氧化铟)导电层,两导电层之间有细小的透明隔离点,这些隔离点起到了将两导电层隔离和绝缘的作用。当书写者的笔尖或手指按下触摸屏时,两个导电层就会相互接触而形成回路,通过测量接触点的电压值等特定数据就可得到屏幕上的坐标位置。采用电阻式触摸屏具有价格低廉、型号齐全、耐笔尖或手指磨损、感应度高、精确性好等特点。

除了通过触摸屏实时显示书写者的笔迹数据外,为了更便于书写者观察书写,设计了专门书写信息显示模块显示笔迹信息。该模块采用TFT液晶屏和液晶屏控制器组成。液晶显示屏收到来自核心处理器的笔迹数据信息后,实时地将手写笔迹显示在屏幕上方,使得书写者的笔迹输入更加直观。由于电阻式触摸屏采集到的笔迹信息是当前触摸点电压值经过模数转换后X坐标和Y坐标的数字值,对TFT液晶屏没有使用价值,因而需要通过坐标转换将触摸屏坐标映射到TFT屏幕上。具体转换过程可以由核心处理器及驱动程序完成。

笔迹采集端的核心处理器选择三星公司ARM9内核的S3C2440A处理器,它负责整个笔迹采集端的运行控制,包括负责完成触摸屏模块的显示和手写数据的采集、书写信息显示模块的数据输出、数据通信模块的管理控制,还负责包括坐标映射和简单笔迹数据处理等功能。

2.2 数据通信模块

数据通信模块主要负责笔迹采集端采集的笔迹信息实时传送到上位机端的功能。实现上位机与笔迹采集端的通信,主要包括有线和无线两种方式。

有线通讯方式即通过实体数据线路进行连接,包括串口线、USB通信线等方式。其中,USB通信模块是S3C2440A核心处理器的集成部分。S3C2440A核心内部包括USB控制器和外

围电路,可以直接实现通过USB端口数据线将大量书写数据实时准确传送给上位机端的功能,具有简单实用的特点。

为增加系统的可用性,实现相对较远距离(10 m)的自由终端式笔迹采集模块,可以采用基于无线通讯方式进行数据传输。目前较常用的无线通讯方式包括蓝牙、Wi—Fi、基于nRF24L01工业模块等方式。其中,nRF24L01是一款使用2.4 GHz ISM开放频段、采用FSK调制、基于内部自有协议的无线通信模块,本身拥有126频道,可以实现点对点或1对多点的无线通信功能,通信速度可以达到2 Mbps。采用基于nRF24L01的工业化通信模块可以实现较小体积较远距离的数据传输,且开发方便,可以极大提高笔迹鉴别系统的实用性。

3 上位机文本独立笔迹鉴别模块的设计

文本的笔迹信息包括在线和离线两类。离线信息是指写在纸上的字符,具有采集方便、信息量小的特点。笔迹鉴别方法主要包括文本依存和文本独立两种,其中文本依存要求必须使用相同的文字进行比对,而文本独立是依据大量笔迹特征提取,与书写内容无关,应用更广。本文针对离线的文本独立笔迹信息进行研究,利用多通道Gabor滤波器,作为图像纹理特征提取分析方法,它被广泛应用于纹理分析、笔迹鉴别等领域。为了解决训练样本不足的问题,可以采用(SVM)的方法对笔迹特征进行训练和识别。上位机端的算法流程设计如图2所示。

基于ARM的文本独立笔迹鉴别系统设计

3.1 笔迹图像预处理

笔迹图像的预处理主要包括滤波、二值化、归一化等。首先将图像进行颜色聚类和二值化,以消除背景色的干扰,根据分布特征除去背景和网格线,并将图像二值化。然后需要进行滤波以消除噪点的干扰,常用的图像滤波方法有:中值滤波、邻域均值滤波和低通滤波。由于笔迹采集终端采集的图片质量较高,噪声多为小噪声的孤立点,因此可以采用盐和胡椒滤波法去噪。然后将图像分别沿水平和竖直方向进行投影,以压缩空行和字符间的空白。为便于数据处理,需要按统一的行高对每行字符进行归一化处理,即调整不同字符的大小相同。归一化处理时可以根据笔迹图像的水平直方图做行的分割,图像的水平直方图就是图像在水平方向上的投影,即每一行像素值直接相加。实验中我们采集了20人的笔迹信息,每人两份,每份的汉字数量、内容、纸张、书写用笔均没有特殊限制。与此同时,实验还采用了哈尔滨工业大学多人手写库(HIT—MW)中的笔迹图像作为样本,共使用40份,由20个人书写,每人两份。对于采集的手写笔迹信息,我们将每个人的笔迹信息一分为二,一份用于训练,另一份用于测试,以保证两组数据完全不同。实验采集笔迹图像预处理效果如图3所示。


上一页 1 2 下一页

评论


相关推荐

技术专区

关闭