[发明专利]一种产证文字的识别方法及系统在审
申请号: | 202110256783.X | 申请日: | 2021-03-09 |
公开(公告)号: | CN112818949A | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 冯瑜;姚松妹 | 申请(专利权)人: | 浙江天派科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/46;G06N3/04;G06N3/08 |
代理公司: | 北京高沃律师事务所 11569 | 代理人: | 王爱涛 |
地址: | 315195 浙江省宁*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文字 识别 方法 系统 | ||
本发明涉及一种产证文字的识别方法即系统。所述方法包括获取产证图像;采用可微分二值化处理算法对所述产证图像进行文字检测得到文字区域;采用卷积递归神经网络对所述文字区域进行文本识别得到所述产证图像的文本识别结果。本发明能快速精确的在离线状态下识别出产证图片上的文字。
技术领域
本发明涉及文字识别领域,特别是涉及一种产证文字的识别方法及系统。
背景技术
复杂背景下的光学字符识别(Optical Character Recognition,OCR)技术涉及的图像处理与模式识别技术比通用的OCR技术更为复杂。由于图像中的文字通常叠加在复杂的图像背景之上,背景成分的干扰使得现有的OCR技术难以识别出文字。
根据OCR技术的应用场景而言,我们可以大致分成识别特定场景下的专用OCR技术以及识别多种场景下的通用OCR技术。就前者而言,证件识别以及车牌识别就是专用OCR技术的典型案例。针对特定场景进行设计、优化以达到最好的特定场景下的效果展示。那通用的OCR技术就是使用在更多、更复杂的场景下,拥有比较好的泛性。在这个过程中由于场景的不确定性,比如:图片背景极其丰富、亮度不均衡、光照不均衡、残缺遮挡、文字扭曲和字体多样等等问题,会带来极大的挑战。
典型的OCR技术路线为输入、图像预处理、文字检测、文本识别和输出,其中OCR技术的关键路径在于文字检测和文本识别部分,这也是目前技术可以充分发挥功效的地方。当然现在的OCR技术已经比较成熟了,但像百度和图鉴等提供的识别大多都是线上识别,离线识别技术是比较匮乏的。比如Tessract-OCR这一门传统的OCR离线识别技术,对于背景单一、数据场景简单(word文档截图)的情况,它还能达到比较好的效果,但在复杂背景(现场拍摄图片)的情况下识别率上却大打折扣,和理想识别率有较大差距,即使对图像做了一些二值化处理,缺乏自然语言处理能力,受光线、清晰度影响较大,在干扰因素较多的情况下它的文本检测和文字切割等算法(连通域分析和垂直投影)会出现较大误差,导致识别率不高。
传统OCR技术按处理方式划分为三个阶段:预处理阶段、识别阶段和后处理阶段。首先文本定位,接着进行倾斜文本矫正,分割出单字后,使用人工特征HOG或者CNN特征,结合分类模型对单字进行识别,最后基于统计语言模型(如隐马尔科夫链,HMM)或者规则进行语义纠错,其中关键在于预处理阶段,预处理阶段的质量直接决定了最终的识别效果。
传统OCR技术发展至今,已经解决了大部分简单场景,并且取得很好效果,但是在一些复杂场景,传统OCR技术面临了巨大的挑战,精度很难满足实际应用需求。
发明内容
本发明的目的是提供一种产证文字的识别方法及系统,能快速精确的在离线状态下识别出产证图片上的文字。
为实现上述目的,本发明提供了如下方案:
一种产证文字的识别方法,包括:
获取产证图像;
采用可微分二值化处理算法对所述产证图像进行文字检测得到文字区域;
采用卷积递归神经网络对所述文字区域进行文本识别得到所述产证图像的文本识别结果。
可选的,所述采用可微分二值化处理算法对所述产证图像进行文字检测得到文字区域,具体包括:
采用不同的设定比例分别对所述产证图像进行特征提取,得到多个特征图,不同的设定比例对应不同的特征图;
将多个所述特征图进行融合得到目标特征图;
确定所述目标特征图的概率图和阈值图;
根据所述阈值图和所述概率图得到二值图;
对所述二值图进行轮廓提取得到文字区域。
可选的,所述根据所述阈值图和所述概率图得到二值图,具体为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江天派科技有限公司,未经浙江天派科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110256783.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种发动机调压阀外置结构
- 下一篇:一种双扭簧张力放线装置