[发明专利]选择性反向传播在审
申请号: | 201680056229.4 | 申请日: | 2016-09-07 |
公开(公告)号: | CN108140142A | 公开(公告)日: | 2018-06-08 |
发明(设计)人: | R·B·托瓦;D·J·朱里安 | 申请(专利权)人: | 高通股份有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 袁逸;陈炜 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 反向传播 机器学习模型 成本函数 数据集中 训练数据 应用梯度 频度 关联 平衡 | ||
1.一种修改机器学习模型的各类别之间的训练数据的平衡的方法,包括:
至少部分地基于具有最少成员的类别的示例数目与当前类别的示例数目的比率来在训练所述模型时修改反向传播过程的梯度。
2.如权利要求1所述的方法,其特征在于,所述修改包括缩放所述梯度。
3.如权利要求1所述的方法,其特征在于,所述修改包括至少部分地基于对所述类别示例的采样来选择性地应用所述梯度。
4.如权利要求3所述的方法,其特征在于,对所述类别的所述采样是通过从每个训练历元中选择固定数目的示例来发生的。
5.如权利要求1所述的方法,其特征在于,所述采样是在不将示例放回训练历元中的情况下发生的。
6.一种用于修改机器学习模型的各类别之间的训练数据的平衡的装备,包括:
用于至少部分地基于具有最少成员的类别的示例数目与当前类别的示例数目的比率来确定用于修改梯度的因子的装置;以及
用于基于所确定的因子来修改与所述当前类别相关联的所述梯度的装置。
7.如权利要求6所述的装备,其特征在于,所述修改装置包括用于缩放所述梯度的装置。
8.如权利要求6所述的装备,其特征在于,所述修改装置包括用于至少部分地基于对所述类别示例的采样来选择性地应用所述梯度的装置。
9.如权利要求8所述的装备,其特征在于,对所述类别的所述采样是通过从每个训练历元中选择固定数目的示例来发生的。
10.如权利要求6所述的装备,其特征在于,所述采样是在不将示例放回训练历元中的情况下发生的。
11.一种用于修改机器学习模型的各类别之间的训练数据的平衡的装置,包括:
存储器;以及
耦合至所述存储器的至少一个处理器,所述至少一个处理器被配置成至少部分地基于具有最少成员的类别的示例数目与当前类别的示例数目的比率来在训练所述模型时修改反向传播过程的梯度。
12.如权利要求11所述的装置,其特征在于,所述至少一个处理器被配置成通过缩放所述梯度来进行修改。
13.如权利要求11所述的装置,其特征在于,所述至少一个处理器被配置成通过至少部分地基于对所述类别示例的采样选择性地应用所述梯度来进行修改。
14.如权利要求13所述的装置,其特征在于,对所述类别的所述采样是通过从每个训练历元中选择固定数目的示例来发生的。
15.如权利要求11所述的装置,其特征在于,所述采样是在不将示例放回训练历元中的情况下发生的。
16.一种用于修改机器学习模型的各类别之间的训练数据的平衡的非瞬态计算机可读介质,所述非瞬态计算机可读介质上记录有程序代码,所述程序代码包括:
用于至少部分地基于具有最少成员的类别的示例数目与当前类别的示例数目的比率来在训练所述模型时修改反向传播过程的梯度的程序代码。
17.如权利要求16所述的非瞬态计算机可读介质,其特征在于,所述用于修改的程序代码包括用于缩放所述梯度的程序代码。
18.如权利要求16所述的非瞬态计算机可读介质,其特征在于,所述用于修改的程序代码包括用于至少部分地基于对所述类别示例的采样来选择性地应用所述梯度的程序代码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680056229.4/1.html,转载请声明来源钻瓜专利网。