[发明专利]确定模型超参数及模型训练的方法和装置、存储介质有效
| 申请号: | 201910384551.5 | 申请日: | 2019-05-09 |
| 公开(公告)号: | CN110110861B | 公开(公告)日: | 2021-11-26 |
| 发明(设计)人: | 林宸;李楚鸣 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00 |
| 代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
| 地址: | 100080 北京市海淀区北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 确定 模型 参数 训练 方法 装置 存储 介质 | ||
1.一种确定模型超参数的方法,其特征在于,所述方法包括:
确定超参数的初始值;
根据所述超参数的初始值和样本图像集,通过并行的多个路径中每个路径对初始机器学习模型进行M1次迭代训练,得到所述每个路径的第一更新机器学习模型,其中,所述多个路径中不同路径的训练参数具有基于所述超参数进行采样得到的不同数值,M1大于或等于1且小于或等于第一数值;
基于所述多个路径中每个路径的第一更新机器学习模型的性能参数,将所述超参数的数值更新为第一更新值;
基于所述超参数的第一更新值和所述样本图像集,对所述多个路径的第一更新机器学习模型进行M2次迭代训练和所述超参数的进一步数值更新,直至达到预设截止条件,获得所述超参数的最终数值,其中,M2大于或等于1且小于或等于第一数值;
所述根据所述超参数的初始值和样本图像集,通过并行的多个路径中每个路径对初始机器学习模型进行M1次迭代训练,得到所述每个路径的第一更新机器学习模型,包括:
基于所述超参数的初始值和所述样本图像集中的至少一个第一样本图像,通过多个路径中每个路径对所述初始机器学习模型进行第一迭代训练,得到所述每个路径的第一内环更新机器学习模型;
基于所述超参数的初始值和所述样本图像集中的至少一个第二样本图像,通过所述多个路径中每个路径对所述每个路径的第一内环更新机器学习模型进行第二迭代训练,得到所述每个路径的第二内环更新机器学习模型;
基于所述多个路径中每个路径的第二内环更新机器学习模型,得到所述每个路径的第一更新机器学习模型。
2.根据权利要求1所述的方法,其特征在于,在所述对所述多个路径的第一更新机器学习模型进行M2次迭代训练和所述超参数的进一步数值更新之前,还包括:
从所述多个路径的第一更新机器学习模型中选取第一目标更新机器学习模型;
将所述多个路径的第一更新机器学习模型的模型参数更新为所述第一目标更新机器学习模型的模型参数。
3.根据权利要求2所述的方法,其特征在于,所述从所述多个路径的第一更新机器学习模型中选取第一目标更新机器学习模型,包括:
基于所述多个路径的第一更新机器学习模型的性能参数,从所述多个路径的第一更新机器学习模型中选取第一目标更新机器学习模型。
4.根据权利要求1所述的方法,其特征在于,所述基于所述超参数的初始值和所述样本图像集中的至少一个第一样本图像,通过多个路径中每个路径对所述初始机器学习模型进行第一迭代训练,得到所述每个路径的第一内环更新机器学习模型,包括:
基于所述超参数的初始值进行多次采样,得到所述多个路径中每个路径的第一训练参数;
基于所述多个路径中每个路径的第一训练参数和所述样本图像集中的至少一个第一样本图像,对所述初始机器学习模型进行第一迭代训练,得到所述每个路径的第一内环更新机器学习模型。
5.根据权利要求1或4所述的方法,其特征在于,所述每个路径的第一迭代训练和第二迭代训练中采用的训练参数是基于所述超参数的初始值进行不同采样得到的。
6.根据权利要求1所述的方法,其特征在于,所述基于所述多个路径中每个路径的第一更新机器学习模型的性能参数,将所述超参数的数值更新为第一更新值,包括:
基于所述多个路径中每个路径的第一更新机器学习模型的性能参数,确定所述每个路径的模型更新参数;
对所述多个路径的模型更新参数进行平均处理,得到平均更新参数;
根据所述平均更新参数,将所述超参数的数值更新为第一更新值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910384551.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:参数图形化处理的装置及方法
- 下一篇:LED显示屏





