[发明专利]基于深度学习的零件喷码字符端到端识别方法在审
| 申请号: | 202011163492.8 | 申请日: | 2020-10-27 |
| 公开(公告)号: | CN112508023A | 公开(公告)日: | 2021-03-16 |
| 发明(设计)人: | 唐倩;郭伏雨;李代杨;罗超 | 申请(专利权)人: | 重庆大学 |
| 主分类号: | G06K9/34 | 分类号: | G06K9/34;G06N3/04;G06N3/08 |
| 代理公司: | 重庆谢成律师事务所 50224 | 代理人: | 谢殿武 |
| 地址: | 400044 *** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 深度 学习 零件 码字 符端到端 识别 方法 | ||
本发明提供一种基于深度学习的零件喷码字符端到端识别方法,所述方法包括以下步骤:S1:采用卷积层提取目标图片的图像特征,所述目标图片为含有待识别字符的图片;S2:采用循环神经网络RNN,以所述图像特征为输入,识别图像特征的感受野信息,获得所述图像特征的特征序列;S3:利用联结主义时间分类CTC训练后的循环神经网络对所述特征序列进行学习,获得所述特征序列的预测序列;S4:根据CTC Beam Search Decoding算法,以所述预测序列为输入,获得字符序列。本申请提供的识别方法采用了卷积神经网络(CNN)、循环神经网络(RNN)和联结主义时间分类(CTC)的网络结构,实现一行喷码字符的端到端识别;本申请的识别方法不依赖于字符分割,通用性强;字符识别效率更高。
技术领域
本发明涉及字符识别技术领域,尤其涉及一种基于深度学习的零件喷码字符 端到端识别方法。
背景技术
在汽车发动机的生产过程中,有特定工位需要检测发动机的喷码信息,传 统的人工喷码检测存在劳动强度大、用人成本高、检测精度低等缺点。目前, 对于端到端字符识别已经提出了以字符分割为基础的喷码字符的识别方法,虽 然这种识别方法虽然在识别效果上非常理想,但是严重依赖于字符分割的效果, 即字符分割效果不佳的话,会严重影响字符的识别。而字符分割通常采用的图 像处理方法,往往是针对一类图像而特殊设计的,通用性不佳。
因此,亟需一种对字符分割的依赖性要小、通信性高的端到端字符识别方 法。
发明内容
有鉴于此,本发明提供一种基于深度学习的零件喷码字符端到端识别方法, 其特征在于:所述方法包括以下步骤:
S1:采用卷积层提取目标图片的图像特征,所述目标图片为含有待识别字 符的图片;
S2:采用循环神经网络RNN,以所述图像特征为输入,识别图像特征的感 受野信息,获得所述图像特征的特征序列;
S3:利用联结主义时间分类CTC训练后的循环神经网络对所述特征序列进 行学习,获得所述特征序列的预测序列;
S4:根据CTC Beam Search Decoding算法,以所述预测序列为输入,获得 字符序列。
进一步,所述卷积层包括7个卷积层和4个池化层,其网络架构从输入到 输出依次为输入、卷积1、池化1、卷积2、池化2、卷积3、卷积4、池化3、 卷积5、卷积6、池化4、卷积7;
其中,卷积1、卷积2、卷积3、卷积4、卷积5和卷积6的卷积核大小均 为(3,3)、步长均为1和周边填充系数均为1,卷积7的卷积核大小为(2, 2)、步长为1和周边填充系数为0;
池化1和池化2的系数为(2,2),池化3和池化4的系数为(2,1)。
进一步,所述步骤S3包括如下步骤:
S31:联结主义时间分类CTC定义CTC Loss损失函数,构建预测的字符序 列和训练标签之间的多对一映射;
S32:联结主义时间分类CTC采用了动态规划算法计算CTC Loss,实现循 环神经网络RNN端到端训练。
进一步,所述CTC Loss损失函数采用如下方法确定:
其中,L表示CTC Loss损失函数,x表示输入特征序列,Z表示预测结果, S表示训练数据集,πt表示t时刻预测序列π中对应的字符,表示BiLSTM网 络预测得到的概率矩阵y中时序为t时预测结果为πt的概率;
所述动态规划算法计算CTC Loss采用如下方法确定:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011163492.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种激光切割机用机架
- 下一篇:一种动能开关与灯具绑定的方法及系统





