[发明专利]信息推荐方法、模型训练方法及相关装置有效
| 申请号: | 202011398840.X | 申请日: | 2020-12-03 |
| 公开(公告)号: | CN112380449B | 公开(公告)日: | 2021-11-23 |
| 发明(设计)人: | 钟子宏 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王兆林 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 信息 推荐 方法 模型 训练 相关 装置 | ||
本申请实施例公开了一种人工智能领域的信息推荐方法、模型训练方法及相关装置,其中该信息推荐方法包括:获取预测数据集,该预测数据集包括多个目标用户各自对应的预测数据,预测数据包括第T周期内目标用户的用户特征数据、目标推荐信息的信息特征数据和预测标签;根据预测数据集中各预测数据包括的预测标签,确定预测数据集中的正负样本比例作为预测状态转移概率;通过感兴趣概率预测模型,根据用户特征数据、信息特征数据和预测状态转移概率,确定第T+1周期内目标用户对目标推荐信息的感兴趣概率;根据该感兴趣概率,确定在第T+1周期内是否向目标用户推荐目标推荐信息。该方法能够确保信息推荐的准确性。
技术领域
本申请涉及人工智能(Artificial Intelligence,AI)技术领域,尤其涉及一种信息推荐方法、模型训练方法及相关装置。
背景技术
在互联网大数据时代,如何精准地向用户进行信息推荐,既满足用户个性化需求,又保证信息推荐的有效性,如今已成为很多网络平台关注的重点。
相关技术目前主要通过基于逻辑回归(Logistic Regression,LR)模型的二分类推荐方法,根据用户的行为特征(如点击通过率(Click Through Rate,CTR)等)相应地进行信息推荐。具体的,可以先利用第T周期的用户特征、推荐信息特征和用户对于推荐信息的查看情况,对逻辑回归模型进行训练;进而,利用训练得到的逻辑回归模型,根据第T+1周期的用户特征和推荐信息特征,预测用户对于推荐信息的感兴趣概率,并据此确定是否向用户推荐上述推荐信息。
然而,上述相关技术中的实现方式存在以下缺陷:受到特征数据稀疏、特征区分度低、模型效果不理想、分类阈值取值不合理等因素的影响,利用逻辑回归模型预测出的感兴趣概率往往分布较为集中,例如经常集中分布在分类阈值附近,如此,不利于准确地分辨用户对于推荐信息是否感兴趣,进而将影响信息推荐的效果。
发明内容
本申请实施例提供了一种信息推荐方法、模型训练方法及相关装置,能够降低感兴趣概率预测模型所预测的概率的集中度,便于准确地分辨用户对于推荐信息的感兴趣程度,进而确保信息推荐的准确性。
有鉴于此,本申请第一方面提供了一种信息推荐方法,所述方法包括:
获取预测数据集;所述预测数据集包括多个目标用户各自对应的预测数据,所述预测数据包括预测特征数据和预测标签,所述预测特征数据包括第T周期内所述目标用户的用户特征数据、以及所述第T周期内目标推荐信息的信息特征数据,所述预测标签是根据所述第T周期内所述目标用户对所述目标推荐信息的查看情况确定的;所述T为大于1的整数;
根据所述预测数据集中各所述预测数据包括的所述预测标签,确定所述预测数据集中的正负样本比例,作为预测状态转移概率;
通过感兴趣概率预测模型,根据所述目标用户对应的所述预测数据包括的所述预测特征数据、以及所述预测状态转移概率,确定第T+1周期内所述目标用户对所述目标推荐信息的感兴趣概率;
根据所述第T+1周期内所述目标用户对所述目标推荐信息的感兴趣概率,确定在所述第T+1周期内是否向所述目标用户推荐所述目标推荐信息。
本申请第二方面提供了一种模型训练方法,所述方法包括:
获取训练样本数据集;所述训练样本数据集包括多个用户各自对应的训练样本数据,所述训练样本数据包括训练特征数据、第一训练标签和第二训练标签,所述训练特征数据包括第T-1周期内所述用户的用户特征数据、以及所述第T-1周期内推荐信息的信息特征数据,所述第一训练标签是根据所述第T-1周期内所述用户对所述推荐信息的查看情况确定的,所述第二训练标签是根据所述第T周期内所述用户对所述推荐信息的查看情况确定的;所述T为大于1的整数;
根据所述训练样本数据集中各所述训练样本数据包括的所述第一训练标签,确定所述训练样本数据集中的正负样本比例,作为训练状态转移概率;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011398840.X/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





