新闻中心

EEPW首页 > 嵌入式系统 > 设计应用 > 一种文档图像检索算法设计和实现

一种文档图像检索算法设计和实现

作者:时间:2011-07-04来源:网络收藏

  1.3 行线标记

  通过对得到的二值的行跳变的填补,文本行的变化相对比较平滑,这有利于行线的标记。本方法取每个文本行的下边缘来作为行线。因为背景区域为黑色,文字区域为白色,所以对进行扫描,从黑色区域进入白色区域时所遇到的第一个像素进行标记,这样就把每一行的行线标记出来了,所得到的行线是单像素的。这种方法的优点是可以抗倾斜。

  图5(a)为对图1中的中的行用直线的方式标记出来。为了验证提取出的行线与原图是否一致,将它与原图(如图5(b)所示)进行了匹配,可以看出,所得结果是比较满意的。

  2 匹配

  本文所采用的方法是将行线抽象为空间中的一个点,点的灰度值定义为行线的长度。全局匹配模式考虑版面的加权平均,用于全局位置进行匹配,这个过程相当于文本区定位过程。局部匹配模式是定义两个行在位置、尺寸上的变化情况,通过位置优先(版面)得到匹配模式,进而对匹配误差能量进行计算。

  匹配方法转化为两组点之间的匹配定义问题,点模式简化了问题的复杂性,只包含了版面结构信息、长度信息和尺寸信息。

  中心点加权匹配方式不能完全解决问题,图像在两个尺度上的缩放对这种方式影响极大。使用归一化的尺寸可部分解决这个问题,但归一化后仍需计算中心点的位置,通过中心点进行坐标转换,使用坐标转换后的新的点模式对差异性进行度量。

  每一行起始坐标的相对坐标是(xi′,yi′),xi′=xi-x0,yi′=yi-y0。图6为将行线抽象为空间中的点的图像,其中亮度代表该行的长度,位置为起点坐标。

  (2)距离匹配模式计算

  将两个页面的中心点对齐,从第一个页面的第一行开始,与另一个页面每行进行比较。假如另一个页面的相对坐标是(uj′,vj′),j=0,…,n-1,每行长度为wj。计算两个待比较页面的坐标及长度的差Δxi、Δyi、Δzi,其中:Δxi=xi′-uj′,Δyi=yi′-vj′,Δzi=zi-wj。则定义差异能量为:

  dEnerge(i)=Δxi+Δyi+Δzi

  将第一个页面的第一行与第二个页面的每一行进行比较,得到n个差异能量,求这n个差异能量的最小值min(dEnerge(i))。第一个页面共有m行,将得到m个值,对其求和:

  不匹配的情况经常发生,例如一个图像中含有4个点模式,另一个图像中含有10个点模式,内部点模式之间具有结构相关性,结构上的相关性定义为点模式位置掩模距离,该距离用来度量点模式全局匹配能力。如果一个点模式为另一个点模式的子模式,则该方法子图功能,模式距离最小时,产生最佳匹配。最佳匹配时,产生更为细致的行线能力。使用掩模方法是为了产生更好的查准率。

绝对值编码器相关文章:绝对值编码器原理
三维扫描仪相关文章:三维扫描仪原理


评论


相关推荐

技术专区

关闭