[发明专利]文字识别方法、装置、电子设备及存储介质在审
申请号: | 202011098938.3 | 申请日: | 2020-10-14 |
公开(公告)号: | CN112329766A | 公开(公告)日: | 2021-02-05 |
发明(设计)人: | 李楠;姜仟艺;宋祺;张睿 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 任亚娟 |
地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字 识别 方法 装置 电子设备 存储 介质 | ||
本申请实施例公开了一种文字识别方法、装置、电子设备及存储介质,该方法包括:通过标准卷积提取待识别图像的图像特征并扩展通道数,生成第一特征图;通过包括逐点组卷积和深度卷积的模块化结构对所述第一特征图进行特征提取处理,得到处理后特征图;对所述处理后特征图进行池化处理,得到池化特征图;将所述池化特征图作为所述模块化结构的输入,循环执行上述的模块化结构处理和池化处理,直至得到的池化特征图满足预设条件;对所述池化特征图进行标准卷积处理,得到编码结果;对所述编码结果进行解码,得到识别结果。本申请实施例在保证识别精度的前提下,降低了计算复杂度,提高了识别速度,而且降低了计算资源的消耗。
技术领域
本申请实施例涉及图像识别技术领域,特别是涉及一种文字识别方法、装置、电子设备及存储介质。
背景技术
传统的文字识别首先对图片进行预处理,采用二值化、边缘平滑等方式减少图片上噪声的干扰,然后用分割算法将图片分割为每个字符子块,对每一子块进行字符识别后拼接为整个文字识别结果。
对于具有较强干扰噪声的文字图像进行识别时,传统方法的准确性不能满足识别的要求。与传统的文字识别方法相比,深度卷积神经网络(Deep Convolutional NeuralNetwork,DCNN)在文字识别上有着更好的准确率。但是目前基于DCNN的验证码识别研究多采用标准的卷积网络,计算复杂度高,预测耗时多,计算资源消耗大,算法运行依赖于GPU机器,无法满足实时性与高并发的应用需求。
发明内容
本申请实施例提供一种文字识别方法、装置、电子设备及存储介质,有助于降低计算复杂度,提高识别速度并降低计算资源的消耗。
为了解决上述问题,第一方面,本申请实施例提供了一种文字识别方法,包括:
通过标准卷积提取待识别图像的图像特征并扩展通道数,生成第一特征图;
通过包括逐点组卷积和深度卷积的模块化结构对所述第一特征图进行特征提取处理,得到处理后特征图;
对所述处理后特征图进行池化处理,得到池化特征图;
将所述池化特征图作为所述模块化结构的输入,循环执行上述的模块化结构处理和池化处理,直至得到的池化特征图满足预设条件;
对所述池化特征图进行标准卷积处理,得到编码结果;
对所述编码结果进行解码,得到识别结果。
第二方面,本申请实施例提供了一种文字识别装置,包括:
通道扩展模块,用于通过标准卷积提取待识别图像的图像特征并扩展通道数,生成第一特征图;
特征提取模块,用于通过包括逐点组卷积和深度卷积的模块化结构对所述第一特征图进行特征提取处理,得到处理后特征图;
池化处理模块,用于对所述处理后特征图进行池化处理,得到池化特征图;
循环控制模块,用于将所述池化特征图作为所述模块化结构的输入,循环执行上述的模块化结构处理和池化处理,直至得到的池化特征图满足预设条件;
标准卷积处理模块,用于对所述池化特征图进行标准卷积处理,得到编码结果;
解码模块,用于对所述编码结果进行解码,得到识别结果。
第三方面,本申请实施例还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本申请实施例所述的文字识别方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时本申请实施例公开的文字识别方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011098938.3/2.html,转载请声明来源钻瓜专利网。