[发明专利]一种预测模型训练方法及装置、存储介质、电子设备有效
| 申请号: | 201810074890.9 | 申请日: | 2018-01-25 |
| 公开(公告)号: | CN108304354B | 公开(公告)日: | 2021-08-24 |
| 发明(设计)人: | 马文晔;郑胤 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06F17/18 | 分类号: | G06F17/18 |
| 代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 预测 模型 训练 方法 装置 存储 介质 电子设备 | ||
本发明实施例公开一种预测模型训练方法及装置、存储介质、电子设备。其中方法步骤包括基于采用第一模型参数的预测模型,获取多个第一样本数据中每个第一样本数据的中间梯度向量,第一样本数据包括N个特征,N为正整数;根据多个第二样本数据的有效特征值,获取N个特征中每个特征对应的权重,其中,第二样本数据与第一样本数据同属于一个样本数据集合;按照每个特征对应的权重、中间梯度向量、多个第一样本数据的样本总数,获取多个第一样本数据的目标梯度向量;根据目标梯度向量对第一模型参数进行更新,以得到第二模型参数。采用本申请,可以提高该特征在模型参数更新中的影响力度,进而提高预测模型的准确性。
技术领域
本发明涉及预测模型技术领域,尤其涉及一种预测模型训练方法及装置、存储介质、电子设备。
背景技术
基于机器学习的预测模型训练通常是利用样本数据集合训练一个适用于该任务的预测模型;其中,样本数据集合通常包含多维特征的特征值。现有的基于多样本的预测模型训练是对多个样本数据中每个样本数据计算各自的梯度值,再根据多个样本数据的总数对全部的梯度值的和求平均,并根据平均梯度值来更新预测模型参数。然而,样本数据集合的每个特征值并非都是有效的,这样会使得各维特征中的有效的特征值的数量是不一样的,例如个别特征的有效的特征值较为稀疏,这样在对全部的梯度值的和求平均之后,该维特征对应的平均梯度值极小,从而不会对预测模型的模型参数的更新产生影响,降低了该特征在模型参数更新中的影响力度,也降低了预测模型的准确性。
发明内容
本发明实施例提供一种预测模型训练方法及装置、存储介质、电子设备,可以提高该特征在模型参数更新中的影响力度,进而提高预测模型的准确性。
一方面,为本发明实施例提供了预测模型训练方法,包括:
基于采用第一模型参数的预测模型,获取多个第一样本数据中每个第一样本数据的中间梯度向量,所述第一样本数据包括N个特征,N为正整数;
根据多个第二样本数据的有效特征值,获取所述N个特征中每个特征对应的权重,其中,所述第二样本数据与所述第一样本数据同属于一个样本数据集合;
按照所述每个特征对应的权重、所述中间梯度向量、所述多个第一样本数据的样本总数,获取所述多个第一样本数据的目标梯度向量;
根据所述目标梯度向量对所述第一模型参数进行更新,以得到第二模型参数。
另一方面,为本发明实施例提供了一种预测模型训练装置,包括:
第一向量获取模块,基于采用第一模型参数的预测模型,获取多个第一样本数据中每个第一样本数据的中间梯度向量,所述第一样本数据包括N个特征,N为正整数;
权重获取模块,用于根据多个第二样本数据的有效特征值,获取所述N个特征中每个特征对应的权重,其中,所述第二样本数据与所述第一样本数据同属于一个样本数据集合;
第二向量获取模块,用于按照所述每个特征对应的权重、所述中间梯度向量、所述多个第一样本数据的样本总数,获取所述多个第一样本数据的目标梯度向量;
参数更新模块,用于根据所述目标梯度向量对所述第一模型参数进行更新,以得到第二模型参数。
另一方面,为本发明实施例提供了计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行第一方面和基于第一方面的可能的实现方案中任意一项的方法步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810074890.9/2.html,转载请声明来源钻瓜专利网。





