[发明专利]一种文字识别方法、装置、电子设备及存储介质在审

申请号：	202010172679.8	申请日：	2020-03-12
公开（公告）号：	CN111428593A	公开（公告）日：	2020-07-17
发明（设计）人：	宋祺;姜仟艺;刘曦;张睿	申请（专利权）人：	北京三快在线科技有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62;G06N3/04
代理公司：	北京市隆安律师事务所 11323	代理人：	权鲜枝
地址：	100190 北京市海***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种文字识别方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种文字识别方法、装置、电子设备及存储介质，该方法包括：对目标图像进行纹理特征编码，生成第一特征序列；对第一特征序列进行解码，得到第一识别结果；基于递归神经网络对第一特征序列进行上下文互信息编码，生成第二特征序列；对第二特征序列进行解码，得到第二识别结果；根据第一识别结果和第二识别结果联合确定文字识别结果。本申请的有益效果在于，将文字本身特征与上下文互信息相结合，显著提高文字识别的准确率，且计算量小、计算速度快、可用性强。

技术领域

本申请涉及数据处理技术领域，具体涉及一种文字识别方法、装置、电子设备及存储介质。

背景技术

文字识别作为计算机视觉中的一种常用技术，被广泛应用于文档分析、证照识别、街景识别、资质审核、自动录入等场景中，为人们的日常生活和工作提供了很大的便利。但是现有技术依然存在着很多不足之处，如某些文字识别方法仅考虑到了字符本身的特征，忽略了字符之间的上下文语义特征，在某些字符由于光照、污渍等产生遮挡难以识别时，无法基于其它字符内容进行上下文联合推断识别。而某些文字识别方法又过于依赖上下文信息，导致极其容易混淆相似文字，例如，如果数据中“麦当劳”出现的次数远多于“麦肯基”，那么所有的“麦肯基”都可能被识别为“麦当劳”。

发明内容

鉴于上述问题，提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的一种文字识别方法、装置、电子设备及存储介质。

依据本申请的一个方面，提供了一种文字识别方法，该方法包括：

对目标图像进行纹理特征编码，生成第一特征序列；

对第一特征序列进行解码，得到第一识别结果；

基于递归神经网络对第一特征序列进行上下文互信息编码，生成第二特征序列；

对第二特征序列进行解码，得到第二识别结果；

根据第一识别结果和第二识别结果联合确定文字识别结果。

可选的，在上述方法中，对用于文字识别的图像进行纹理特征编码，生成第一特征序列包括：

根据卷积神经网络对目标图像进行特征提取，得到目标图像的图像特征；

对图像特征进行注意力处理，确定目标图像中文字前景的掩模；

将掩模与图像特征进行融合，得到第一特征序列。