[发明专利]对象推送方法、装置、计算机设备及存储介质在审
| 申请号: | 201910698531.5 | 申请日: | 2019-07-31 |
| 公开(公告)号: | CN110413893A | 公开(公告)日: | 2019-11-05 |
| 发明(设计)人: | 袁一方 | 申请(专利权)人: | 腾讯科技(北京)有限公司 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/735;G06F16/635 |
| 代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 黄晶晶 |
| 地址: | 100080 北京市海淀区海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 推送 候选对象 目标用户标识 计算机设备 存储介质 基本信息 历史对象 样本对象 样本 环境状态信息 目标对象标识 表征样本 动作信息 目标对象 评分模型 强化学习 样本数据 样本用户 兴趣度 奖励 迭代 申请 多样性 终端 输出 | ||
本申请涉及一种对象推送方法、装置、计算机设备及存储介质,该方法包括:获取与目标用户标识对应的候选对象标识和历史对象标识;获取各候选对象标识对应的基本信息;将所述候选对象标识和历史对象标识作为环境状态信息、以及将所述基本信息作为动作信息,输入评分模型,输出各候选对象标识对应的推送分值;根据所述推送分值,从所述候选对象标识中,选取向所述目标用户标识所对应的终端推送的目标对象标识;其中,所述评分模型,是通过对包括样本奖励值的样本数据进行迭代地强化学习训练得到;所述样本奖励值,用于表征样本用户对样本对象的兴趣度、以及表征向样本用户推送样本对象时的推送类别多样性。本申请的方案,能够提高推送的目标对象的准确性。
技术领域
本发明涉及计算机技术领域,特别是涉及一种对象推送方法、装置、计算机设备及存储介质。
背景技术
随着科学技术的飞速发展,大量先进技术不断涌现。对象推送是目前比较重要的一项技术,在日常生活和工作中的应用越来越广泛。比如,新闻推送在如今的信息时代,起着非常重要的作用。
传统方法中,是用待推送的对象的特征,与用户的特征进行一一匹配,根据匹配结果选择最终要推送的对象。显然,传统方法这种根据用户特征进行匹配的推送策略,会导致用户收到的对象形式过于局限,导致推送不够准确。
发明对象
基于此,有必要针对传统方法推送不够准确的问题,提供一种对象推送方法、装置、计算机设备及存储介质。
一种对象推送方法,所述方法包括:
获取与目标用户标识对应的候选对象标识和历史对象标识;
获取各候选对象标识对应的基本信息;
将所述候选对象标识和历史对象标识作为环境状态信息、以及将所述基本信息作为动作信息,输入评分模型,输出各候选对象标识对应的推送分值;
根据所述推送分值,从所述候选对象标识中,选取向所述目标用户标识所对应的终端推送的目标对象标识;
其中,所述评分模型,是通过对包括样本奖励值的样本数据进行迭代地强化学习训练得到;所述样本奖励值,用于表征样本用户对样本对象的兴趣度、以及表征向样本用户推送样本对象时的推送类别多样性。
在其中一个实施例中,所述根据所述推送分值,从所述候选对象标识中,选取向所述目标用户标识所对应的终端推送的目标对象标识包括:
选取推送分值最高的候选对象标识,作为目标对象标识;
所述方法还包括:
根据与所述目标对象标识对应的基本信息,生成推送信息;
按照所述目标用户标识,下发所述推送信息。
在其中一个实施例中,所述方法还包括:
获取目标用户标识对应的用户信息;
所述将所述候选对象标识和历史对象标识作为环境状态信息、以及将所述基本信息作为动作信息,输入评分模型,输出各候选对象标识对应的推送分值包括:
将所述候选对象标识、历史对象标识和所述用户信息作为环境状态信息、以及将所述基本信息作为动作信息,输入评分模型,输出各候选对象标识对应的推送分值。
在其中一个实施例中,所述评分模型的训练步骤包括:
获取样本数据;同一组样本数据中包括对应于同一样本用户的样本对象标识的集合、各样本对象标识的基本信息和样本奖励值;所述样本对象标识包括样本历史对象标识和样本候选对象标识;
在每轮强化学习迭代训练中,将集合作为当前环境状态信息及将各样本对象标识的基本信息作为动作信息,输入主网络,预测各样本对象标识的推送分值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(北京)有限公司,未经腾讯科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910698531.5/2.html,转载请声明来源钻瓜专利网。





