[发明专利]一种OCR漏识判断方法及系统无效
申请号: | 201110446365.3 | 申请日: | 2011-12-28 |
公开(公告)号: | CN102592121A | 公开(公告)日: | 2012-07-18 |
发明(设计)人: | 兰荣春 | 申请(专利权)人: | 方正国际软件有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20 |
代理公司: | 北京天悦专利代理事务所(普通合伙) 11311 | 代理人: | 田明;任晓航 |
地址: | 215123 江苏省苏州市工*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 ocr 判断 方法 系统 | ||
技术领域
本发明涉及计算机文字识别处理技术领域,尤其涉及一种基于图像区域增长算法的OCR漏识判断方法及系统。
背景技术
随着计算机技术及数字化技术的不断发展,需要将传统的纸质书籍、文档、报纸等电子化。在将这些物理实体数据到电子数据的转换加工过程中,纸质的书籍、文档、报纸最终转换为电子数据(TXT、WORD,PDF等格式的电子文件),不可避免的使用文字识别技术(OCR技术,Optical Character Recognition,光学字符识别)。
基于图书数字化加工的特点,要求有效图像内容不能“丢失”,现在的有很多OCR引擎,如汉王,ABBYY,文通等。这些OCR技术虽然已经比较成熟,但在应用过程中并不能完全满足实际的需求,特别是OCR的漏识问题。
OCR漏识的原因主要是:
1.被识别文档本身的原因,如印刷的油墨问题,或者被识别文档年代久远或破损,字迹模糊不清晰等;
2.扫描文档时存在的问题,如扫描的质量,图像的分辨率等,容易造成文字笔画不规则,为后续的正确识别造成障碍;
3.OCR技术本身给出的文字坐标不能将整个文字包围,也会造成漏识。
OCR漏识后,就会造成了页面有效内容的丢失,现在采用通过识别后的文字与原图人工对比查找漏识区的方法,效率低。
因此,在OCR识别过程中,OCR识别图像的正确性与效率固然重要,但如何找到OCR的漏识区间也是非常重要的。目前还未见针对OCR识别中的漏识问题提出的技术解决方案及相关文献。
发明内容
针对现有技术中所存在的不足,本发明的目的在于提供一种能够快速找到OCR过程中的漏识区间的基于图像区域增长算法的OCR漏识判断方法及系统。
为实现上述发明目的,本发明采用的技术方案如下:
一种OCR漏识判断方法,包括以下步骤:
(1)数据输入:输入原始图像,所述的原始图像为二值图;
(2)对输入的原始图像进行OCR识别,输出识别结果;
(3)漏识判断:根据步骤(2)中的输出识别结果,判断漏识区间;
(4)搜索漏识区间里的联通区,过滤图像与噪点;
(5)输出漏识文字。
进一步,步骤(2)中所述的输出识别结果包括识别出的文字及其矩形坐标即矩形框。
进一步,步骤(3)中,判断漏识区间的方法如下:对输出的文字逐个处理,判断文字笔画是否全部在矩形框内,如果不是,则根据输出的该文字的矩形坐标从矩形四边向外做图像增长,将与矩形框相邻的黑点也视作该文字的像素点,得到该文字的所有像素点,从图像中删除该文字的所有像素点;如果是,则继续处理下一个文字,直到完成所有文字的处理,最后就得到了图像中的漏识区间。
更进一步,在对文字的矩形框作增长时,具体方法是:从矩形框边缘开始,遇与文字连接有效像素点的就向外扩边,直到无有效像素点为止,这就得到了该文字新的边界。
再进一步,在对文字矩形框向外增长时,按像素点逐点向外增长,增长的比例控制在50%以内。
进一步,步骤(4)中,搜索联通区时,对步骤(3)中得到的所有漏识区间中的黑色像素点周围进行扫描,得到所有联通区;
然后根据联通区面积及文字矩形框面积的大小,将联通区面积远大于文字矩形框面积的区域视作图像,将联通区面积远小于文字矩形框面积的区域视作噪点,然后对这些图像与噪点进行过滤。
更进一步,将大于文字矩形框面积4-8倍以上的联通区视作图像。将小于文字矩形框面积1/8-1/16以下的联通区视作噪点。
进一步,步骤(5)中,将接近于文字矩形框面积的联通区域视作漏识文字进行输出。
一种OCR漏识判断系统,包括以下装置:
数据输入装置,用于输入原始图像,所述的原始图像为二值图;
OCR识别装置,用于对输入的原始图像进行OCR识别,输出识别结果,所述识别结果包括识别出的文字及其矩形坐标即矩形框;
漏识判断装置,用于对输出的文字逐个处理,判断文字笔画是否全部在矩形框内,如果不是,则根据输出的该文字的矩形坐标从矩形四边向外做图像增长,将与矩形框相邻的黑点也视作该文字的像素点,得到该文字的所有像素点,从图像中删除该文字的所有像素点;如果是,则继续处理下一个文字,直到完成所有文字的处理,最后就得到了图像中的漏识区间;
联通区搜索装置,用于搜索漏识区间里的联通区;
图像与噪点过滤装置,用于过滤漏识区间里的图像与噪点;
输出装置,用于输出漏识文字。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于方正国际软件有限公司,未经方正国际软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110446365.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种手机及其分格显示屏
- 下一篇:触摸式立体感应开关与触摸式立体感应控制面板