[发明专利]文本识别方法及装置、电子设备和存储介质在审

申请号：	201910251661.4	申请日：	2019-03-29
公开（公告）号：	CN111753822A	公开（公告）日：	2020-10-09
发明（设计）人：	刘学博	申请（专利权）人：	北京市商汤科技开发有限公司
主分类号：	G06K9/32	分类号：	G06K9/32;G06K9/46;G06N3/04;G06N3/08
代理公司：	北京林达刘知识产权代理事务所(普通合伙) 11277	代理人：	刘新宇
地址：	100084 北京市海淀区中***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文本识别方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开涉及一种文本识别方法及装置、电子设备和存储介质。该方法包括：对待检测图像进行特征提取处理，获得多个语义向量，其中，所述多个语义向量与所述待检测图像中的文本序列的多个字符对应；通过卷积神经网络对多个语义向量依次进行识别处理，得到文本序列的识别结果。根据本公开的实施例的文本识别方法，可在待检测图像中提取语义向量，并通过卷积神经网络依次处理语义向量，确定文本序列的识别结果，可提高文本识别的精确度。

技术领域

本公开涉及计算机技术领域，尤其涉及一种文本识别方法及装置、电子设备和存储介质。

背景技术

图像中的文本识别是图像识别和文本识别技术中的重要问题。精确的文本识别能够用于多个领域，例如图片理解，自动翻译，盲人引导，机器人导航等。在相关技术中，图像中的文本识别具有多种问题，图像中复杂多样背景、低分辨率、不同的字体、不同的光照条件、不同大小尺度、不同倾斜方向、模糊等因素，都使得图像中的文本识别更加复杂和困难。

发明内容

本公开提出了一种文本识别方法及装置、电子设备和存储介质。

根据本公开的一方面，提供了一种文本识别方法，包括：

对待检测图像进行特征提取处理，获得多个语义向量，其中，所述多个语义向量与所述待检测图像中的文本序列的多个字符对应；

通过卷积神经网络对所述多个语义向量依次进行识别处理，得到所述文本序列的识别结果。

根据本公开的实施例的文本识别方法，可在待检测图像中提取语义向量，并通过卷积神经网络依次处理语义向量，确定文本序列的识别结果，可提高文本识别的精确度。

在一些实施例中，所述通过卷积神经网络对所述多个语义向量依次进行识别处理，得到所述文本序列的识别结果，包括：

通过卷积神经网络对目标语义向量的先验信息进行处理，获得所述目标语义向量的权值参数，其中，所述多个语义向量包括所述目标语义向量；

根据所述权值参数和所述目标语义向量，确定与所述目标语义向量对应的文本识别结果。

通过这种方式，可使用根据先验信息获得的权值参数对目标语义向量进行加权，可在对目标语义向量的识别过程中参考先验信息，提高对目标语义向量的识别精度。

在一些实施例中，所述先验信息包括所述目标语义向量的前一语义向量对应的文本识别结果和/或起始符。

在一些实施例中，所述通过卷积神经网络对目标语义向量的先验信息进行处理，获得所述目标语义向量的权值参数，包括：