[发明专利]一种预测模型训练方法及装置、存储介质、电子设备有效
| 申请号: | 201810074890.9 | 申请日: | 2018-01-25 |
| 公开(公告)号: | CN108304354B | 公开(公告)日: | 2021-08-24 |
| 发明(设计)人: | 马文晔;郑胤 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06F17/18 | 分类号: | G06F17/18 |
| 代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 预测 模型 训练 方法 装置 存储 介质 电子设备 | ||
1.一种预测模型训练方法,其特征在于,包括:
通过应用平台产生用户查阅数据,通过用户查阅数据产生多个第一样本数据;多个第一样本数据是关于用户是否点击内容的数据,多个第一样本数据中对应的第一样本标签是指用户对该内容是否点击的结果;
基于采用第一模型参数的预测模型,对多个第一样本数据中每个第一样本数据进行预测,得到每个第一样本数据的用户点击概率,基于用户点击概率和第一样本标签之间的偏差确定每个第一样本数据的预测损失,通过计算每个第一样本数据的预测损失的梯度,得到多个第一样本数据中每个第一样本数据的中间梯度向量,所述第一样本数据包括N个特征,N为正整数;
获取多个第二样本数据;所述第二样本数据和所述第一样本数据是基于同一应用场景下提取到的样本数据;所述第二样本数据包括N个特征中每个特征对应的特征值;
根据多个第二样本数据的有效特征值,获取所述N个特征中每个特征对应的权重,其中,所述第二样本数据与所述第一样本数据同属于一个样本数据集合;所述有效特征值为在第一阈值范围内的特征值,每个特征对应的权重与该特征的有效特征值的数量成反比;
按照所述每个特征对应的权重、所述中间梯度向量、所述多个第一样本数据的样本总数,获取所述多个第一样本数据的目标梯度向量;
根据所述目标梯度向量对所述第一模型参数进行更新,以得到第二模型参数,在所述应用平台中,通过包含所述第二模型参数的预测模型向用户提供被用户点击概率大的内容。
2.根据权利要求1所述的方法,其特征在于,所述中间梯度向量包括所述每个特征对应的预测损失梯度值;
所述按照所述每个特征对应的权重、所述中间梯度向量、所述多个第一样本数据的样本总数,获取所述多个第一样本数据的目标梯度向量,包括:
根据所述多个第一样本数量的样本总数和所述每个第一样本数据的中间梯度向量,计算所述多个第一样本数量的平均梯度向量,所述平均梯度向量包括由多个所述中间梯度向量中所述每个特征对应的预测损失梯度值所计算的梯度平均值;
根据所述平均梯度向量和所述每个特征对应的权重,计算所述多个第一样本数据的目标梯度向量。
3.根据权利要求2所述的方法,其特征在于,所述目标梯度向量包括所述每个特征对应的目标梯度值;
所述根据所述平均梯度向量和所述每个特征对应的权重,计算所述多个第一样本数据的目标梯度向量,包括:
将所述平均梯度向量中所述每个特征对应的梯度平均值和所述每个特征对应的权重相乘,得到所述每个特征对应的目标梯度值。
4.根据权利要求1所述的方法,其特征在于,所述根据多个第二样本数据的有效特征值,获取所述N个特征中每个特征对应的权重之前,还包括:
获取多个第二样本数据,所述第二样本数据包括N个特征中每个特征对应的特征值;
在所述多个第二样本数据中,统计所述每个特征的有效特征值的数量,所述有效特征值为在第一阈值范围内的特征值。
5.根据权利要求4所述的方法,其特征在于,所述根据多个第二样本数据的有效特征值,获取所述N个特征中每个特征对应的权重,包括:
按照所述每个特征的有效特征值的数量,将所述N个特征划分为M个特征分组,所述M个特征分组中每个特征分组包含的特征的有效特征值的数量在第二阈值范围内,M为小于或等于N的正整数;
根据所述每个特征分组包含的特征的有效特征值的数量,确定所述每个特征分组的权重,且所述权重与所述有效特征值的数量成反比。
6.根据权利要求5所述的方法,其特征在于,所述根据所述每个特征分组包含的特征的有效特征值的数量,确定所述每个特征分组的权重,包括:
基于所述每个特征分组包含的特征的数量和有效特征值的数量,计算所述每个特征分组对应的有效特征值的平均数量;
根据所述每个特征分组对应的有效特征值的平均数量,确定为所述每个特征分组的权重,且所述权重与所述有效特征值的平均数量成反比。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810074890.9/1.html,转载请声明来源钻瓜专利网。





