[发明专利]基于多任务的模型训练方法、字符识别方法及装置在审

专利信息
申请号: 202010151852.6 申请日: 2020-03-06
公开(公告)号: CN111401374A 公开(公告)日: 2020-07-10
发明(设计)人: 吴红;欧阳潘义;向钊豫 申请(专利权)人: 湖南快乐阳光互动娱乐传媒有限公司
主分类号: G06K9/34 分类号: G06K9/34;G06N3/04;G06N3/08
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 张静
地址: 410003 湖南省*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 任务 模型 训练 方法 字符 识别 装置
【权利要求书】:

1.一种字符识别模型的训练方法,其特征在于,包括:

获取训练样本;所述训练样本为包含字符的图片;

对所述训练样本进行预处理;

采用编码器提取训练样本中字符的特征;

将提取到的训练样本的字符特征分别输入到CTC神经网络的时序分类模型和注意力模型中进行解码操作,并获取CTC神经网络的时序类分类模型的损失以及注意力模型的损失;

基于CTC神经网络的时序分类模型的损失以及注意力模型的损失,计算联合损失;

基于联合损失对编码器、CTC神经网络的时序分类模型和注意力模型进行训练。

2.根据权利要求1所述的方法,其特征在于,所述预设的编码器包括:深度卷积神经网络模型和双向长短记忆网络模型;

所述采用预设的编码器提取训练样本中字符的特征信息,包括:

采用卷积神经网络模型提取所述训练样本中第一特征;

将所述第一特征信息输入到双向长短记忆网络模型中,提取第二特征;所述第二特征为保证各字符之间关联关系的特征。

3.根据权利要求1所述的方法,其特征在于,所述基于CTC神经网络的时序分类模型的损失以及注意力模型的损失,计算联合损失,包括:

获取CTC神经网络的时序分类模型的损失以及注意力模型的损失的权重;

基于CTC神经网络的时序分类模型的损失以及注意力模型的损失的权重,计算CTC神经网络的时序分类模型的损失以及注意力模型的损失的加权和。

4.根据权利要求1所述的方法,其特征在于,所述基于联合损失对编码器、CTC神经网络的时序分类模型和注意力模型进行训练,包括:

应用梯度下降方法回传联合损失更新编码器各层的参数;

应用梯度下降方法回传联合损失更新CTC神经网络的时序分类模型各层的参数;

应用梯度下降方法回传联合损失更新注意力模型各层的参数。

5.根据权利要求1所述的方法,其特征在于,还包括:

获取验证样本;所述验证样本与所述待识别的图片类型一致;

将所述验证样本输入到预先训练的初始的字符识别模型中,得到第一预测结果和第二预测结果;所述第一预测结果是基于CTC神经网络的时序分类模型输出的结果,所述第二预测结果是基于注意力模型输出的结果;所述初始的字符识别模型是通过上述权利要求1-5所述的方法训练得到的;

基于第一预测结果和第二预测结果的准确度,确定执行对待识别的图片进行识别操作的任务模型。

6.一种字符识别方法,其特征在于,包括:

获取待识别的图片;

将所述待识别的图片进行预处理;

通过预先训练的字符识别模型识别所述预处理后的图片中的字符;所述字符识别模型是通过上述权利要求1-5所述的方法进行训练得到的。

7.一种字符识别模型的训练装置,其特征在于,包括:

第一获取单元,用于获取训练样本;所述训练样本为包含字符的图片;

第一预处理单元,用于对所述训练样本进行预处理;

特征提取单元,用于采用编码器提取训练样本中字符的特征;

多任务解码单元,用于将提取到的训练样本的字符特征分别输入到CTC神经网络的时序分类模型和注意力模型中进行解码操作,并获取CTC神经网络的时序类分类模型的损失以及注意力模型的损失;

计算单元,用于基于CTC神经网络的时序分类模型的损失以及注意力模型的损失,计算联合损失;

训练单元,用于基于联合损失对编码器、CTC神经网络的时序分类模型和注意力模型进行训练。

8.根据权利要求1所述的方法,其特征在于,所述预设的编码器包括:深度卷积神经网络模型和双向长短记忆网络模型;

所述特征提取单元,包括:

第一特征提取子单元,用于采用卷积神经网络模型提取所述训练样本中第一特征;

第二特征提取子单元,用于将所述第一特征信息输入到双向长短记忆网络模型中,提取第二特征;所述第二特征为保证各字符之间关联关系的特征。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南快乐阳光互动娱乐传媒有限公司,未经湖南快乐阳光互动娱乐传媒有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010151852.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top