[发明专利]一种信息推荐模型的训练方法和相关装置在审
| 申请号: | 202010887619.4 | 申请日: | 2020-08-28 |
| 公开(公告)号: | CN111931062A | 公开(公告)日: | 2020-11-13 |
| 发明(设计)人: | 郝晓波;葛凯凯;刘雨丹;唐琳瑶;谢若冰;张旭;林乐宇 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06N20/00;G06N3/04;G06N3/08 |
| 代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王兆林 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 信息 推荐 模型 训练 方法 相关 装置 | ||
1.一种信息推荐模型的训练方法,其特征在于,所述方法包括:
获取多个产品领域的历史用户行为数据;
采用生成对抗网络中的生成模型,根据所述历史用户行为数据生成所述多个产品领域中的待扩充产品领域中每个产品领域的候选样本数据;
将所述多个产品领域中每个产品领域分别作为目标产品领域,通过所述生成对抗网络中的判别模型,对所述目标产品领域的候选样本数据和采集到的用户点击样本数据进行判别,得到判别结果;
根据所述判别结果对所述生成模型的和所述判别模型进行对抗训练,得到训练后的生成对抗网络,所述生成对抗网络用于确定信息推荐模型。
2.根据权利要求1所述的方法,其特征在于,所述根据所述判别结果对所述生成模型的和所述判别模型进行对抗训练,得到训练后的生成对抗网络,包括:
固定所述生成模型的网络参数,采用目标损失函数对所述判别模型的网络参数进行训练,得到训练后的所述判别模型;
固定所述判别模型的网络参数,采用所述目标损失函数对所述生成模型的网络参数进行训练,得到训练后的所述生成模型;
在未满足训练结束条件时,交替执行上述两个训练步骤。
3.根据权利要求2所述的方法,其特征在于,所述目标损失函数的构建方式包括:
根据所述判别结果构建所述生成模型的第一损失函数和所述判别模型的第二损失函数;
根据所述第一损失函数和所述第二损失函数构建所述目标损失函数。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一损失函数和所述第二损失函数构建所述目标损失函数,包括:
根据所述用户点击样本数据的第一分布和所述候选样本数据的第二分布构建样本分布损失函数;所述样本分布损失函数的值越小表征所述第一分布和所述第二分布的分布差距越大;
根据所述第一损失函数、所述第二损失函数和所述本分布损失函数,构建所述目标损失函数。
5.根据权利要求4所述的方法,其特征在于,所述根据所述用户点击样本数据的第一分布和所述候选样本数据的第二分布构建样本分布损失函数,包括:
对所述第一分布和所述第二分布进行欧式距离计算、相对熵计算或最大均值差异计算,构建所述样本分布损失函数。
6.根据权利要求3-5任一项所述的方法,其特征在于,所述判别结果包括第一判别得分和第二判别得分,所述通过所述生成对抗网络中的判别模型,对所述目标产品领域的候选样本数据和采集到的用户点击样本数据进行判别,得到判别结果,包括:
将所述生成模型的第一全连接层输出的候选样本数据输入至所述判别模型的第二全连接层,通过所述第二全连接层对所述候选样本数据进行判别,得到所述第一判别得分;
将所述用户点击样本数据输入至所述第二全连接层,通过所述第二全连接层对所述用户点击样本数据进行判别,得到所述第二判别得分。
7.根据权利要求6所述的方法,其特征在于,所述根据所述判别结果构建所述生成模型的第一损失函数和所述判别模型的第二损失函数,包括:
获取所述生成模型对所述候选样本数据的置信得分;
根据所述第一判别得分和所述置信得分构建所述第一损失函数;
根据所述第一判别得分和所述第二判别得分构建所述第二损失函数。
8.根据权利要求1-5任一项所述的方法,其特征在于,所述方法还包括:
将所述训练后的生成对抗网络中的判别模型提供给线上推荐服务;
在所述线上推荐服务过程中,将所述判别模型作为所述目标产品领域的信息推荐模型。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
获取目标用户的推荐请求;
根据所述推荐请求确定所述目标用户对应的候选样本数据;
根据所述目标用户对应的候选样本数据,通过所述目标产品领域的信息推荐模型确定待推荐内容;
根据所述待推荐内容返回目标推荐信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010887619.4/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





