[发明专利]一种字符识别方法、装置、设备及可读存储介质在审
| 申请号: | 202110942584.4 | 申请日: | 2021-08-17 |
| 公开(公告)号: | CN113642477A | 公开(公告)日: | 2021-11-12 |
| 发明(设计)人: | 张召;郑欢;张莉;王邦军 | 申请(专利权)人: | 苏州大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王晓坤 |
| 地址: | 215131 *** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 字符 识别 方法 装置 设备 可读 存储 介质 | ||
本申请公开了一种字符识别方法、装置、设备及可读存储介质,该方法包括:采集原始字符图像,生成训练样本;构建字符识别模型;该模型包括用于利用轻量级密集块提取特征的压缩密集神经网络、用于对提取到的特征进行耦合处理的耦合压缩密集特征流卷积网络,以及用于对处理后的特征进行预测,并将预测结果转换为文字输出的转录模块;轻量级密集块为同时使用求和操作和串联操作将每个密集块中的内部特征组合在一起的卷积块;采用训练样本对该模型进行训练;将待处理字符图像输入至训练完成的模型进行处理,输出字符识别结果。这样利用轻量级密集块可以捕获到深层次的结构特征用于字符识别,进而减少计算成本和权重大小,有效提升字符的识别能力。
技术领域
本发明涉及图像识别技术领域,特别是涉及一种字符识别方法、装置、设备及可读存储介质。
背景技术
文本和图像是计算机视觉领域中最流行的两种视觉数据,在实践中,通常总是将文本嵌入图像中,因此,如何通过学习算法准确地检测和识别图像中的文本或字符仍然是具有挑战性的,并且是视觉和模式识别领域中的重要课题,例如光学字符识别(OpticalCharacter Recognition,OCR)。由于背景复杂且图像内容复杂,因此OCR仍然是一项非常具有挑战性的任务。
对于OCR,两个关键的子任务是文本行提取和文本行识别:第一个任务是提取图像中文本的区域,第二个任务是识别已提取区域的文本内容。为了处理OCR,目前有两个主流框架:第一个是训练一个端到端网络,该网络可以共同解决文本行提取和识别的任务,例如任意方向网络,虽然统一网络模型的适应性较强和速度较快,但字符识别结果准确率略低;另一种流行的方案是两阶段方案,即为两个子任务训练两个网络,例如卷积递归神经网络(Convolutional Recurrent Neural Network,CRNN),虽然两阶段模型通常具有较高的字符识别准确性,但效率较低,计算成本高,计算量大,同时需要更多的空间去保存权重,从而限制了密集块的深度。
发明内容
有鉴于此,本发明的目的在于提供一种字符识别方法、装置、设备及可读存储介质,可以减少计算成本和权重大小,有效提升字符识别能力。其具体方案如下:
一种字符识别方法,包括:
采集原始字符图像,生成训练样本;
构建字符识别模型;所述字符识别模型包括用于利用轻量级密集块提取特征的压缩密集神经网络、用于对提取到的特征进行耦合处理的耦合压缩密集特征流卷积网络,以及用于对处理后的特征进行预测,并将预测结果转换为文字输出的转录模块;所述轻量级密集块为同时使用求和操作和串联操作将每个密集块中的内部特征组合在一起的卷积块;
采用所述训练样本对构建的所述字符识别模型进行训练;
将待处理字符图像输入至训练完成的所述字符识别模型进行处理,输出字符识别结果。
优选地,在本发明实施例提供的上述字符识别方法中,所述压缩密集神经网络包括用于对输入图像进行卷积和下采样并输出密集特征的编码模块;
所述编码模块包括一个卷积层、三个所述轻量级密集块和两个过渡层。
优选地,在本发明实施例提供的上述字符识别方法中,所述压缩密集神经网络还包括用于对所述密集特征进行优化处理并输出上采样特征的上采样模块;所述上采样模块使用反卷积构造而成;
所述上采样模块包括上采样操作、两个所述轻量级密集块、一个过渡层和一个卷积层。
优选地,在本发明实施例提供的上述字符识别方法中,所述压缩密集神经网络采用深度可分离卷积进行卷积操作。
优选地,在本发明实施例提供的上述字符识别方法中,所述耦合压缩密集特征流卷积网络包括用于增强所述轻量级密集块中不同层之间的特征流和耦合的耦合轻量级密集块;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110942584.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:自助式寄件柜支付系统及方法
- 下一篇:一种智能运维平台





