[发明专利]在多个机器学习任务上训练机器学习模型在审
申请号: | 201780054998.5 | 申请日: | 2017-07-18 |
公开(公告)号: | CN109690576A | 公开(公告)日: | 2019-04-26 |
发明(设计)人: | G.戴士贾汀斯;R.帕斯卡努;R.T.哈德塞尔;J.柯克帕特里克;J.W.韦内斯;N.C.拉比诺维茨 | 申请(专利权)人: | 渊慧科技有限公司 |
主分类号: | G06N3/00 | 分类号: | G06N3/00 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 金玉洁 |
地址: | 英国*** | 国省代码: | 英国;GB |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器学习 机器学习模型 训练机器 可接受 性能水平 训练数据 学习 度量 | ||
1.一种训练具有多个参数的机器学习模型的方法,
其中,所述机器学习模型已经在第一机器学习任务上进行训练以确定所述机器学习模型的参数的第一值,并且
其中,所述方法包括:
对于所述多个参数中的每一个参数,确定参数对所述机器学习模型在所述第一机器学习任务上实现可接受性能的重要性的相应度量;
获得用于在第二、不同的机器学习任务上训练所述机器学习模型的训练数据;以及
通过在所述训练数据上训练所述机器学习模型,在所述第二机器学习任务上训练所述机器学习模型以调节所述参数的第一值,使得所述机器学习模型在所述第二机器学习任务上实现可接受性能水平,同时在所述第一机器学习任务上保持可接受性能水平,
其中,在所述机器学习模型在所述第二机器学习任务上进行训练期间,对所述机器学习模型在所述第一机器学习任务上实现可接受性能更为重要的参数的值比对所述机器学习模型在所述第一机器学习任务上实现可接受性能不太重要的参数的值受到更强的约束以不偏离所述第一值。
2.根据权利要求1所述的方法,其中,所述第一机器学习任务和所述第二机器学习任务是不同的监督学习任务。
3.根据权利要求1所述的方法,其中,所述第一机器学习任务和所述第二机器学习任务是不同的强化学习任务。
4.根据权利要求1至3中任一项所述的方法,其中,在所述训练数据上训练所述机器学习模型包括:
调节所述参数的第一值以使目标函数最优化,所述目标函数包括:
(i)第一项,度量所述机器学习模型在所述第二机器学习任务上的性能,和
(ii)第二项,对偏离所述第一参数值的参数值施加惩罚,其中,所述第二项对于对在所述第一机器学习任务上实现可接受性能更为重要的参数与所述第一值的偏差的惩罚比对在所述第一机器学习任务上实现可接受性能不太重要的参数更重。
5.根据权利要求4所述的方法,其中,对于所述训练数据中的每个训练示例,在所述训练数据上训练所述机器学习模型包括:
按照所述机器学习模型的参数的当前值,使用所述机器学习模型处理所述训练示例以确定模型输出;
使用所述模型输出、所述训练示例的目标输出、所述机器学习模型的参数的当前值和所述机器学习模型的参数的第一值来确定所述目标函数的梯度;以及
使用所述梯度调节所述参数的当前值以使所述目标函数最优化。
6.根据权利要求4或5中任一项所述的方法,其中,对于所述多个参数中的每一个参数,所述第二项取决于所述参数的重要性的相应度量和所述参数的当前值与所述参数的第一值之间的差的乘积。
7.根据权利要求1至6中任一项所述的方法,其中,对于所述多个参数中的每一个参数,确定参数对所述机器学习模型在所述第一机器学习任务上实现可接受性能的重要性的相应度量包括:
对于所述多个参数中的每一个参数,在给定用于在所述第一任务上训练所述机器学习模型的第一训练数据的情况下,确定参数的当前值是参数的正确值的概率的近似值。
8.根据权利要求1至7中任一项所述的方法,其中,对于所述多个参数中的每一个参数,确定参数对所述机器学习模型在所述第一机器学习任务上实现可接受性能的重要性的相应度量包括:
确定所述机器学习模型的多个参数相对于所述第一机器学习任务的费歇尔信息矩阵FIM,其中,对于所述多个参数中的每一个参数,所述参数的重要性的相应度量是所述FIM对角线上的对应值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于渊慧科技有限公司,未经渊慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780054998.5/1.html,转载请声明来源钻瓜专利网。