[发明专利]文字行几何畸变校正方法和装置有效
申请号: | 201010568404.2 | 申请日: | 2010-11-30 |
公开(公告)号: | CN102063621A | 公开(公告)日: | 2011-05-18 |
发明(设计)人: | 李永彬 | 申请(专利权)人: | 汉王科技股份有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100193 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字 几何 畸变 校正 方法 装置 | ||
技术领域
本发明属于光学字符识别领域,特别涉及一种文字行几何畸变校正方法和装置。
背景技术
电子扫描笔(简称扫描笔)是OCR的重要应用之一。扫描笔的技术原理为:光学摄像头按照一定频率对被扫描资料进行连续拍照,获取被扫资料的图像序列后将图像序列拼接成一幅全景图像并进行OCR处理。在扫描过程中,由于扫描笔的轴向旋转会导致得到的全景图像中的文字行出现倾斜甚至弯曲,这会影响后续的OCR识别。因此,在得到全景图像后,需要先对其进行几何畸变校正,将其中的文字行校正成水平行后才能进行后续的处理。
对于文字行几何畸变图像的校正,一般是先要获取文字行的几何畸变曲线,这条曲线也称为校正曲线,然后根据校正曲线对文字行几何畸变图像进行校正。基于这种思想的一种典型方法是,先对文字行图像进行游程抹黑处理,然后通过穿越线对游程进行区段划分,接下来分析游程区段以获取曲线拟合的采样点集并进行曲线拟合,最后根据校正曲线利用图像错切技术,即根据校正位置对图像中的像素列进行竖直方向移动以完成校正。该方法存在以下三点不足:一是没有针对文字行的字块类型区别处理,其对由方块字构成的文字行处理效果尚可,但对由非方块字构成的文字行的校正效果差;二是该方法采用全局阈值进行游程抹黑,但一般不存在合理的全局阈值,从而抹黑效果差,导致校正效果差;三是该方法在得到校正曲线后采取的图像错切校正方法,存在校正后字符变形的情况。
发明内容
本发明所要解决的技术问题为提供一种文字行几何畸变校正方法和装置,对文字行的字块类型分类并分别处理,采用分段游程抹黑技术获取校正曲线,并沿校正曲线各点的法线方向采样校正图像,对多种语种的文字行几何畸变图像均具有好的校正效果,适用于具有不同畸变的文字段的校正。
本发明公开了一种文字行几何畸变校正方法,包括如下步骤:
步骤一:对二值图像中的各文字行进行提取;
步骤二:根据提取到的各文字行进行选取,选取基准文字行;
步骤三:判断基准文字行中的字块类型,根据字块类型分段抹黑基准文字行;
步骤四:将抹黑后的基准文字行进行采样后拟合出校正曲线,并根据校正曲线校正二值图像。
本发明还公开了一种文字行几何畸变校正装置,包括如下模块:
提取模块:对二值图像中的各文字行进行提取;
选取模块:根据提取到的各文字行进行选取,选取基准文字行;
抹黑模块:判断基准文字行中的字块类型,根据字块类型分段抹黑基准文字行;
校正模块:将抹黑后的基准文字行进行采样后拟合出校正曲线,并根据校正曲线校正二值图像。
本发明文字行几何畸变校正方法和装置,具有以下优点:
1、针对文字行的字块类型区别处理,对多种语种的文字行几何畸变图像均具有好的校正效果;
2、采用分段游程抹黑技术,能够获取准确的校正曲线,校正效果好;适用于各行文字具有不同畸变的文字段的校正,适应性好;
3、由于沿校正曲线各点的法线方向采样作为校正后图像的像素列,本方法能够有效校正字符的畸变。
附图说明
图1为本发明实施例之一的二值图像。
图2为本发明文字行几何畸变校正方法的一个实施例的流程图。
图3为本发明实施例流程图中步骤10的一个具体执行流程图。
图4为本发明实施例之一的步骤101的连通域标记结果示意图。
图5为本发明实施例之一的步骤103的第一尺度块示意图。
图6为本发明实施例之一的步骤104的去掉较小第一尺度块后剩余第一尺度块的示意图。
图7为本发明实施例之一的步骤105的第二尺度块示意图。
图8为本发明实施例之一的步骤106的第三尺度块示意图。
图9为本发明实施例之一的步骤107的文字行示意图。
图10为本发明实施例之一的步骤20的基准文字行示意图。
图11为本发明实施例流程图中步骤30的一个具体执行流程图。
图12为本发明实施例之一的步骤30中的子步骤的结果。
图13为本发明实施例流程图中步骤40的一个具体执行流程图。
图14为本发明实施例之一的步骤401的基准文字行的连通域合并结果示意图。
图15为本发明实施例之一的步骤40中的子步骤的结果。
图16为本发明实施例之一的步骤406的基准文字行的初始抹黑图像的示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汉王科技股份有限公司,未经汉王科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010568404.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:液晶显示装置
- 下一篇:泵送损失减少系统和方法