[发明专利]一种多任务模型的训练方法、装置及存储介质有效
申请号: | 202010744149.6 | 申请日: | 2020-07-29 |
公开(公告)号: | CN111931929B | 公开(公告)日: | 2023-06-16 |
发明(设计)人: | 谢粤超 | 申请(专利权)人: | 深圳地平线机器人科技有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08 |
代理公司: | 北京乐知新创知识产权代理事务所(普通合伙) 11734 | 代理人: | 张洋 |
地址: | 518000 广东省深圳市南山区粤海街道高新区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 任务 模型 训练 方法 装置 存储 介质 | ||
1.一种多任务模型的训练方法,包括:
利用第一训练图像集对骨干网络进行训练,以得到经训练的骨干网络;
根据预设类别任务间的关联性进行分支网络的整合,得到多分支网络,所述多分支网络中每一个分支网络分别对应不同的关联任务;
利用已训练的所述骨干网络对第二训练图像集进行处理,以得到所述第二训练图像集中每一样本图像对应的特征图;
利用所述每一样本图像对应的特征图对所述多分支网络进行训练。
2.根据权利要求1所述的方法,其中,所述利用所述每一样本图像对应的特征图对所述多分支网络进行训练,包括:
利用所述多分支网络中不同分支网络分别对所述每一样本图像对应的特征图进行预测,得到对应不同分支网络的预测结果;
基于特定损失函数分别计算所述对应不同分支网络的预测结果与所述训练图像对应的真值之间的损失值;
根据所计算得到的对应不同分支网络的损失值更新所述骨干网络和/或多分支网络的模型参数;
利用所述特征图对所述多分支网络进行训练,并在训练效果达到预设训练条件时停止训练,得到所述训练好的多任务模型。
3.根据权利要求2所述的方法,其中,所述利用所述多分支网络中不同分支网络分别对所述每一样本图像对应的特征图进行预测,得到对应不同分支网络的预测结果,包括:
利用对应语义分割任务的分支网络对所述每一样本图像对应的特征图进行预测,得到对应所述训练图像或特征变换后的训练图像中每一个像素点对应类别的预测结果;
或,利用对应检测任务的分支网络对所述每一样本图像对应的特征图进行预测,得到对应所述训练图像中检测目标的类别及坐标的预测结果。
4.根据权利要求1所述的方法,其中,所述根据预设类别任务间的关联性进行分支网络的整合,包括:
通过单任务模型对不同类别的任务进行训练的方式确定关联任务;
将所确定的关联任务合并到同一个分支网络中,以进行分支网络的整合。
5.根据权利要求4所述的方法,其中,通过单任务模型对不同类别的任务进行训练的方式确定关联任务,包括:
选取预设类别任务中一特定任务的分支网络与所述骨干网络形成一个单任务模型;
将对应于所述特定任务的训练数据通过所述单任务模型进行预训练,得到第一损失值;
根据所述第一损失值调整所述骨干网络的权重;
将权重调整后的骨干网络和预设类别的任务中除所述特定任务之外的另一任务的分支网络形成新的单任务模型;
将对应于所述另一任务的训练数据通过所述新的单任务模型进行训练,得到第二损失值;
若所述第二损失值低于损失阈值,则确定所述另一任务与所述特定任务二者特征相似,属于关联任务。
6.一种多任务模型的训练装置,包括:
骨干网络单元,用于利用第一训练图像集对骨干网络进行训练,以得到经训练的骨干网络;
整合单元,用于根据预设类别任务间的关联性进行分支网络的整合,得到多分支网络,所述多分支网络中每一个分支网络分别对应不同的关联任务;
所述骨干网络单元,还用于利用已训练的所述骨干网络对第二训练图像集进行处理,以得到所述第二训练图像集中每一个样本图像对应的特征图;
多分支网络单元,用于利用所述每一个样本图像对应特征图对所述多分支网络进行训练。
7.根据权利要求6所述的装置,其中,所述多分支网络单元包括:
预测子单元,用于利用所述多分支网络中不同分支网络分别对所述每一样本图像对应的特征图进行预测,得到对应不同分支网络的预测结果;
损失函数计算子单元,用于基于特定损失函数分别计算所述对应不同分支网络的预测结果与所述训练图像对应的真值之间的损失值;
参数更新子单元,用于根据所计算得到的对应不同分支网络的损失值更新所述骨干网络和/或多分支网络的模型参数;
训练子单元,用于利用所述特征图对所述多分支网络进行训练,并在训练效果达到预设训练条件时停止训练,得到所述训练好的多任务模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳地平线机器人科技有限公司,未经深圳地平线机器人科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010744149.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种石墨烯PU鞋垫的生产工艺
- 下一篇:一种大豆清洗机