新闻中心

EEPW首页 > 嵌入式系统 > 设计应用 > 一种文档图像检索算法设计和实现

一种文档图像检索算法设计和实现

作者:时间:2011-07-04来源:网络收藏

  3 实验结果与分析

  应用上述方法进行了实验,数据为手写体英文,数据采集分辨率为100 dpi,256级灰度,数据量为100幅。对不同的分别比较它们的相似度。图7(b)、(c)、(d)是与图7(a)的相似度分别为40.422 9、45.760 7和43.407 8的图像。图8(b)、(c)、(d)是与图8(a)原图像版面结构相似的几种图像类型。图9(b)、(c)、(d)是与图9(a)原图像版面结构具有差异的几种图像类型。

  本文使用对100幅图像两两进行版面结构的匹配,共有4 950种结果。实验结果表明,两种不同版面的能量差异最大的在340左右,如图10所示。横坐标显示的是100幅图像两两匹配出现的情况的数目,可以取到的最大坐标为4 950,纵坐标为各匹配情况对应的能量差异,最大值350。从图中可以看出能量差异主要集中在50~200之间。

  各个能量点的频数的直方图如图11所示,图中横坐标为能量差异数据,最大为340左右,提取到350。纵坐标为取到各个能量的情况的数目的累加。从图11可以更直观地观察到能量差异在50~200之间的数目最多。

  实验结果表明:(1)图像的版面结构具有相对的稳定性。(2)点匹配模式计算了最小距离,可有效表示图像的文本行基本信息。(3)距离匹配较为简单,使用了三个维度的一维距离,有较好的区分性。对距离计算统计表明,具有正态分布特性。(4)点匹配模式需进一步进行研究,的复杂度需进一步降低,以进行实时图像处理。

  本文针对文档图像的方法进行了研究,提出一种文档图像的新方法。分析了文档图像版面特性,使用分割方法确定文本行,将文本行进行标记,找出页面的中心点坐标,中心点坐标将文本行的长度作为权重考虑在内,得到相对坐标。根据相对坐标和文本行长度得到一个差异能量,根据差异能量来进行匹配。并对该方法进行了实验和结果分析。本方法的优点是,当文档的行出现倾斜和缩放时,不影响匹配的进行。但需要进一步降低所用的点匹配模式时间复杂度,以进行实时图像处理。



绝对值编码器相关文章:绝对值编码器原理
三维扫描仪相关文章:三维扫描仪原理

上一页 1 2 3 下一页

评论


相关推荐

技术专区

关闭