[发明专利]光学字符识别方法、装置、设备及存储介质有效
申请号: | 201911076214.6 | 申请日: | 2019-11-06 |
公开(公告)号: | CN110826567B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 庄妮 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V10/82;G06V30/19;G06N3/0464;G06N3/08 |
代理公司: | 北京远智汇知识产权代理有限公司 11659 | 代理人: | 范坤坤 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 光学 字符 识别 方法 装置 设备 存储 介质 | ||
本公开实施例公开了一种光学字符识别方法、装置、设备及存储介质。包括:对待识别图像进行归一化处理;将归一化处理后的待识别图像输入训练好的神经网络模型中,通过卷积块进行特征提取,获得待识别图像的深度特征矩阵;所述卷积块包括卷积层和池化层;对所述深度特征矩阵进行字符预测,获得待识别图像中的光学字符。本公开实施例的技术方案,将待识别图像依次输入训练好的神经网络中的卷积块获得深度特征矩阵,实现对光学字符的识别,无需输入整个训练好的神经网络,可以提高光学字符识别的准确性及效率。
技术领域
本公开实施例涉及光学字符识别技术领域,尤其涉及一种光学字符识别方法、装置、设备及存储介质。
背景技术
对图片中的字符串进行识别,是大部分光学字符识的一个重要环节。字符串图片识别的技术常见的应用有:身份证号识别和车牌号识别等。常见的应用场景有单据信息识别和街景商店名称识别等。
传统的光学字符识别方法处理步骤为:将包含有文本的图片中的字符串通过字符串切割方法进行切割,得到多个仅包含单个字符的图片后再进行识别,最后将多个单字符图片的识别结果进行串接得到最终结果。该种方法很大程度上依赖于字符切割模型的效果,如果字符切割出现错误,则识别过程会产生一系列的错误;并且字符切割模型对于样本图片质量要求较高,且要求字符串本身可切割,对于一些字符串本身字符间存在粘连或者交叉的情况则无法正确处理。
发明内容
本公开实施例提供一种光学字符识别方法、装置、设备及存储介质,可以提高光学字符识别的准确性。
第一方面,本公开实施例提供了一种光学字符识别方法,包括:
对待识别图像进行归一化处理;
将归一化处理后的待识别图像输入训练好的神经网络模型中,通过卷积块进行特征提取,获得待识别图像的深度特征矩阵;所述卷积块包括卷积层和池化层;
对所述深度特征矩阵进行字符预测,获得待识别图像中的光学字符。
第二方面,本公开实施例还提供了一种光学字符识别装置,包括:
归一化处理模块,用于对待识别图像进行归一化处理;
深度特征矩阵获取模块,用于将归一化处理后的待识别图像输入训练好的神经网络模型中,通过卷积块进行特征提取,获得待识别图像的深度特征矩阵;所述卷积块包括卷积层和池化层;
光学字符预测模块,用于对所述深度特征矩阵进行字符预测,获得待识别图像中的光学字符。
第三方面,本公开实施例还提供了一种电子设备,所述电子设备包括:
一个或多个处理装置;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理装置执行,使得所述一个或多个处理装置实现如本公开实施例所述的光学字符识别方法。
第四方面,本公开实施例还提供了一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理装置执行时实现如本公开实施例所述的光学字符识别方法。
本公开实施例,首先对待识别图像进行归一化处理,然后将归一化处理后的待识别图像输入训练好的神经网络模型中,通过卷积块进行特征提取,获得待识别图像的深度特征矩阵,最后对深度特征矩阵进行字符预测,获得待识别图像中的光学字符。本公开实施例的技术方案,将待识别图像依次输入训练好的神经网络中的卷积块获得深度特征矩阵,实现对光学字符的识别,无需输入整个训练好的神经网络,可以提高光学字符识别的准确性及效率。
附图说明
图1是本公开实施例一中的一种神经网络的结构示意图;
图2是本公开实施例一中的一种光学字符识别方法的流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911076214.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种浮船坞接驳下水自调整高度的装置
- 下一篇:现代沪语输入法