[发明专利]确定模型超参数及模型训练的方法和装置、存储介质有效
| 申请号: | 201910384551.5 | 申请日: | 2019-05-09 |
| 公开(公告)号: | CN110110861B | 公开(公告)日: | 2021-11-26 |
| 发明(设计)人: | 林宸;李楚鸣 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00 |
| 代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
| 地址: | 100080 北京市海淀区北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 确定 模型 参数 训练 方法 装置 存储 介质 | ||
本公开实施例提供一种确定模型超参数的技术和图像处理技术,有利于提升机器学习模型的图像处理性能,其中,确定模型超参数的方法包括:确定超参数的初始值;根据所述超参数的初始值和样本图像集,通过并行的多个路径中每个路径对初始机器学习模型进行M1次迭代训练,得到所述每个路径的第一更新机器学习模型,基于所述多个路径中每个路径的第一更新机器学习模型的性能参数,将所述超参数的数值更新为第一更新值;基于所述超参数的第一更新值和所述样本图像集,对所述多个路径的第一更新机器学习模型进行M2次迭代训练和所述超参数的进一步数值更新,直至达到预设截止条件,获得所述超参数的最终数值。
技术领域
本公开涉及机器学习技术,具体涉及确定模型超参数及模型训练的方法和装置、存储介质。
背景技术
近年来,深度神经网络等机器学习模型在各种计算机视觉应用中取得了显著的成功。在大量标记数据的驱动下,网络的性能也达到了惊人的水平。然而,机器学习模型的超参数目前主要是采用人工设计,在人工设计好模型超参数后,保持该超参数不变,对机器学习模型进行训练,最终得到机器学习模型的模型参数,由于人工设计的局限性,最终得到的机器学习模型的性能还有待进一步优化。
发明内容
有鉴于此,本公开至少提供一种确定模型超参数的技术及模型训练技术。
第一方面,提供一种确定模型超参数的方法,所述方法包括:确定超参数的初始值;根据所述超参数的初始值和样本图像集,通过并行的多个路径中每个路径对初始机器学习模型进行M1次迭代训练,得到所述每个路径的第一更新机器学习模型,其中,所述多个路径中不同路径的训练参数具有基于所述超参数进行采样得到的不同数值,M1大于或等于1且小于或等于第一数值;基于所述多个路径中每个路径的第一更新机器学习模型的性能参数,将所述超参数的数值更新为第一更新值;基于所述超参数的第一更新值和所述样本图像集,对所述多个路径的第一更新机器学习模型进行M2次迭代训练和所述超参数的进一步数值更新,直至达到预设截止条件,获得所述超参数的最终数值,其中,M2大于或等于1且小于或等于第一数值。
在一种可能的实现方式中,在所述对所述多个路径的第一更新机器学习模型进行M2次迭代训练和所述超参数的进一步数值更新之前,还包括:从多个路径的第一更新机器学习模型中选取第一目标更新机器学习模型;将所述多个路径的第一更新机器学习模型的模型参数更新为所述第一目标更新机器学习模型的模型参数。
结合本公开提供的任一实施方式,在一种可能的实现方式中,所述从所述多个路径的第一更新机器学习模型中选取第一目标更新机器学习模型,包括:基于所述多个路径的第一更新机器学习模型的性能参数,从所述多个路径的第一更新机器学习模型中选取第一目标更新机器学习模型。
结合本公开提供的任一实施方式,在一种可能的实现方式中,所述根据所述超参数的初始值和样本图像集,通过并行的多个路径中每个路径对初始机器学习模型进行M1次迭代训练,得到所述每个路径的第一更新机器学习模型,包括:基于所述超参数的初始值和所述样本图像集中的至少一个第一样本图像,通过多个路径中每个路径对所述初始机器学习模型进行第一迭代训练,得到所述每个路径的第一内环更新机器学习模型;基于所述超参数的初始值和所述样本图像集中的至少一个第二样本图像,通过所述多个路径中每个路径对所述每个路径的第一内环更新机器学习模型进行第二迭代训练,得到所述每个路径的第二内环更新机器学习模型;基于所述多个路径中每个路径的第二内环更新机器学习模型,得到所述每个路径的第一更新机器学习模型。
结合本公开提供的任一实施方式,在一种可能的实现方式中,所述基于所述超参数的初始值和所述样本图像集中的至少一个第一样本图像,通过多个路径中每个路径对所述初始机器学习模型进行第一迭代训练,得到所述每个路径的第一内环更新机器学习模型,包括:基于所述超参数的初始值进行多次采样,得到所述多个路径中每个路径的第一训练参数;基于所述多个路径中每个路径的第一训练参数和所述样本图像集中的至少一个第一样本图像,对所述初始机器学习模型进行第一迭代训练,得到每个路径的第一内环更新机器学习模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910384551.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:参数图形化处理的装置及方法
- 下一篇:LED显示屏





