[发明专利]文本识别方法及装置、电子设备和存储介质在审
| 申请号: | 201910251661.4 | 申请日: | 2019-03-29 |
| 公开(公告)号: | CN111753822A | 公开(公告)日: | 2020-10-09 |
| 发明(设计)人: | 刘学博 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
| 主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/46;G06N3/04;G06N3/08 |
| 代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
| 地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 识别 方法 装置 电子设备 存储 介质 | ||
本公开涉及一种文本识别方法及装置、电子设备和存储介质。该方法包括:对待检测图像进行特征提取处理,获得多个语义向量,其中,所述多个语义向量与所述待检测图像中的文本序列的多个字符对应;通过卷积神经网络对多个语义向量依次进行识别处理,得到文本序列的识别结果。根据本公开的实施例的文本识别方法,可在待检测图像中提取语义向量,并通过卷积神经网络依次处理语义向量,确定文本序列的识别结果,可提高文本识别的精确度。
技术领域
本公开涉及计算机技术领域,尤其涉及一种文本识别方法及装置、电子设备和存储介质。
背景技术
图像中的文本识别是图像识别和文本识别技术中的重要问题。精确的文本识别能够用于多个领域,例如图片理解,自动翻译,盲人引导,机器人导航等。在相关技术中,图像中的文本识别具有多种问题,图像中复杂多样背景、低分辨率、不同的字体、不同的光照条件、不同大小尺度、不同倾斜方向、模糊等因素,都使得图像中的文本识别更加复杂和困难。
发明内容
本公开提出了一种文本识别方法及装置、电子设备和存储介质。
根据本公开的一方面,提供了一种文本识别方法,包括:
对待检测图像进行特征提取处理,获得多个语义向量,其中,所述多个语义向量与所述待检测图像中的文本序列的多个字符对应;
通过卷积神经网络对所述多个语义向量依次进行识别处理,得到所述文本序列的识别结果。
根据本公开的实施例的文本识别方法,可在待检测图像中提取语义向量,并通过卷积神经网络依次处理语义向量,确定文本序列的识别结果,可提高文本识别的精确度。
在一些实施例中,所述通过卷积神经网络对所述多个语义向量依次进行识别处理,得到所述文本序列的识别结果,包括:
通过卷积神经网络对目标语义向量的先验信息进行处理,获得所述目标语义向量的权值参数,其中,所述多个语义向量包括所述目标语义向量;
根据所述权值参数和所述目标语义向量,确定与所述目标语义向量对应的文本识别结果。
通过这种方式,可使用根据先验信息获得的权值参数对目标语义向量进行加权,可在对目标语义向量的识别过程中参考先验信息,提高对目标语义向量的识别精度。
在一些实施例中,所述先验信息包括所述目标语义向量的前一语义向量对应的文本识别结果和/或起始符。
在一些实施例中,所述通过卷积神经网络对目标语义向量的先验信息进行处理,获得所述目标语义向量的权值参数,包括:
通过所述卷积神经网络中的至少一个第一卷积层对所述目标语义向量进行编码处理,获得所述目标语义向量的第一向量;
通过所述卷积神经网络中的至少一个第二卷积层对所述目标语义向量的先验信息进行编码处理,获得与所述先验信息对应的第二向量;
基于所述第一向量和所述第二向量,确定所述权值参数。
通过这种方式,可通过卷积神经网络获取与先验信息对应的第二向量,进一步地,可获取权值参数,使权值参数中包含先验信息,为识别目标语义向量提供依据。
在一些实施例中,通过所述卷积神经网络中的至少一个第二卷积层对所述目标语义向量的先验信息进行编码处理,获得与所述先验信息对应的第二向量,包括:
响应于所述先验信息包括所述目标语义向量的前一语义向量对应的文本识别结果,对所述前一语义向量对应的文本识别结果进行词嵌入处理,获得与先验信息对应的特征向量;
对所述特征向量进行编码处理,得到所述第二向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910251661.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:燃气制热水设备
- 下一篇:用户认证方法、多媒体内容的推送方法及装置





