[发明专利]图像识别模型的训练方法及装置、图像识别方法及装置有效
申请号: | 201910760045.1 | 申请日: | 2019-08-16 |
公开(公告)号: | CN110458243B | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 史红亮;廖敏鹏;李长亮 | 申请(专利权)人: | 北京金山数字娱乐科技有限公司;成都金山数字娱乐科技有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V30/10;G06V10/82;G06N3/08;G06T9/00 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 王治东 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 模型 训练 方法 装置 | ||
1.一种图像识别模型的训练方法,其特征在于,包括:
获取预训练的图像识别模型和样本数据,其中,所述样本数据包括图像和所述图像对应的真值序列;
将所述样本数据中的图像输入所述图像识别模型,使用随机策略获取随机策略序列,使用确定策略获取确定策略序列;
将所述随机策略序列和所述样本数据中图像对应的真值序列通过编辑距离计算奖励,获取随机策略奖励;
将所述确定策略序列和所述样本数据中图像对应的真值序列通过编辑距离计算奖励,获取确定策略奖励;
根据所述随机策略奖励、所述确定策略奖励和所述随机策略序列计算损失值;
通过对所述损失值进行反向传播以训练所述图像识别模型。
2.如权利要求1所述的图像识别模型的训练方法,其特征在于,使用随机策略获取随机策略序列,包括:
S21、将所述图像在所述图像识别模型的编码端进行编码,获得所述图像的编码向量;
S22、将所述图像的编码向量在所述图像识别模型的解码端进行解码,生成解码字符集;
S23、使用随机策略在所述解码字符集中随机选取解码字符;
S24、判断所述图像识别模型的解码端是否完成解码,若是,则执行S25,若否,执行S21;
S25、根据随机选取的解码字符生成随机策略序列。
3.如权利要求1所述的图像识别模型的训练方法,其特征在于,使用确定策略获取确定策略序列,包括:
S31、将所述图像在所述图像识别模型的编码端进行编码,获得所述图像的编码向量;
S32、将所述图像的编码向量在所述图像识别模型的解码端进行解码,生成解码字符集;
S33、使用确定策略在所述解码字符集中选取最大概率的解码字符;
S34、判断所述图像识别模型的解码端是否完成解码,若是,则执行S35,若否,执行S31;
S35、根据最大概率选取的解码字符生成确定策略序列。
4.如权利要求2或3所述的图像识别模型的训练方法,其特征在于,将所述图像的编码向量在所述图像识别模型的解码端进行解码,生成解码字符集,包括:
将上一次的输出作为参考编码向量输入至所述图像识别模型的解码端,解码端根据所述参考编码向量和所述图像的编码向量生成当前次的解码字符集。
5.如权利要求1所述的图像识别模型的训练方法,其特征在于,通过对所述损失值进行反向传播以训练所述图像识别模型,包括:
在损失值大于预设阈值范围最大值的情况下,所述随机策略奖励大于所述确定策略奖励,所述图像识别模型增加获取随机策略解码序列的参数权重;
在损失值小于预设阈值范围最小值的情况下,所述随机策略奖励小于所述确定策略奖励,所述图像识别模型减少获取随机策略解码序列的参数权重。
6.如权利要求1所述的图像识别模型的训练方法,其特征在于,通过对所述损失值进行反向传播以训练所述图像识别模型,包括:
在损失值在预设阈值范围内的情况下,停止训练所述图像识别模型。
7.一种图像识别方法,其特征在于,包括:
获取待识别图像;
将所述待识别图像输入利用如权利要求1-6任意一项所述的图像识别模型训练方法预先训练好的图像识别模型,所述图像识别模型被训练于根据输入的图像获取所述图像的描述信息;
所述图像识别模型响应于所述待识别图像作为输入而获取所述待识别图像的描述信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山数字娱乐科技有限公司;成都金山数字娱乐科技有限公司,未经北京金山数字娱乐科技有限公司;成都金山数字娱乐科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910760045.1/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序