[发明专利]字符识别方法、装置、电子设备和存储介质有效

专利信息
申请号: 202110878449.8 申请日: 2021-08-02
公开(公告)号: CN113344145B 公开(公告)日: 2021-11-19
发明(设计)人: 孟鹏飞;朱磊;贾双成;潘冰;李成军 申请(专利权)人: 智道网联科技(北京)有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06N3/04
代理公司: 北京市隆安律师事务所 11323 代理人: 权鲜枝
地址: 100029 北京市东*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 字符 识别 方法 装置 电子设备 存储 介质
【说明书】:

本申请公开了字符识别方法、装置、电子设备和存储介质。字符识别方法包括:获取包含待识别字符的图像;将包含待识别字符的图像输入预设字符识别模型,得到字符识别结果;其中,预设字符识别模型依次包括:卷积神经网络CNN、循环神经网络RNN以及转录网络CTC,CNN的输出与RNN的输出之间设有短路连接,短路连接用于根据CNN的输出与RNN的输出得到中间输出结果;CTC用于对中间输出结果进行处理,输出字符识别结果。该技术方案基于对CRNN算法的改进,在原始CRNN的基础上添加CNN的输出与RNN的输出之间的短路连接,从而提升了字符识别结果的准确度。

技术领域

本申请涉及图像识别技术领域,尤其涉及字符识别方法、装置、电子设备和存储介质。

背景技术

字符识别方法总的来说主要分为两大类,传统算法识别和神经网络算法识别。用传统算法识别时,在设计算法时,需要对图片的噪声,图像质量,分辨率等做出较多的设计和思考。而随着神经网络技术的不断发展,目前,基于神经网络的字符识别算法取得了很多突破,已经成为了主流。但是,识别准确度还有一定的提升空间。

发明内容

本申请实施例提供了字符识别方法、装置、电子设备和存储介质,以提升字符识别的准确度。

本申请实施例采用下述技术方案:

第一方面,本申请实施例提供一种字符识别方法,包括:获取包含待识别字符的图像;将包含待识别字符的图像输入预设字符识别模型,得到字符识别结果;其中,预设字符识别模型依次包括:卷积神经网络CNN、循环神经网络RNN以及转录网络CTC,CNN的输出与RNN的输出之间设有短路连接,短路连接用于根据CNN的输出与RNN的输出得到中间输出结果;CTC用于对中间输出结果进行处理,输出字符识别结果。

在一些实施例中,CNN具有多感受野结构,CNN用于根据多感受野结构,对包含待识别字符的图像进行字符特征提取,从而能够适应不同字形的字符。

在一些实施例中,多感受野结构基于平行多池化层实现,平行多池化层中的各池化层不同;平行多池化层用于接收CNN中前一层的输出,相应地得到各池化层的输出结果,对各输出结果进行第一指定运算,得到第一运算结果作为CNN中下一层的输入。

在一些实施例中,平行多池化层有多组,其中,CNN中第一卷积层之后以及第二卷积层之后的两组平行多池化层中,每组平行多池化层中的最大池化层分别使用1×2的池化核和2×2的池化核;CNN的最后两组平行多池化层中,每组平行多池化层中的最大池化层分别使用1×2的池化核和3×2的池化核。

在一些实施例中,CNN的第三个卷积层与第四个卷积层之间设置有批标准化层,批标准化层用于对第三个卷积层的卷积结果进行批标准化处理后,将批标准化结果输入到第四个卷积层。

在一些实施例中,RNN用于对CNN的输出结果进行处理,得到第一RNN输出结果;短路连接,用于对CNN的输出结果和第一RNN输出结果进行第二指定运算,得到中间运算结果;RNN还用于对中间运算结果进行处理,得到第二RNN输出结果;短路连接,还用于对CNN的输出结果、中间运算结果和第二RNN输出结果进行第三指定运算,得到中间输出结果。

在一些实施例中,RNN具体为长短期记忆循环神经网络LSTM,LSTM,用于将CNN的输出结果或中间运算结果作为输入量,根据输入量依次计算遗忘门信息、记忆门信息、细胞状态、输出门信息,最终得到隐藏层信息作为与输入量对应的输出结果。

在一些实施例中,LSTM具体为双向长短期记忆循环神经网络BiLSTM,BiLSTM,用于将自身的正向网络得到的隐藏层信息,与自身的负向网络得到的隐藏层信息进行拼接,作为与输入量对应的输出结果。

第二方面,本申请实施例还提供一种字符识别装置,用于实现如上任一的字符识别方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于智道网联科技(北京)有限公司,未经智道网联科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110878449.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top