[发明专利]一种信息推送方法、装置、服务器及计算机可读存储介质在审

申请号：	201811486104.2	申请日：	2018-12-06
公开（公告）号：	CN109451038A	公开（公告）日：	2019-03-08
发明（设计）人：	王天驹;卞俊杰;姜飞;叶璨	申请（专利权）人：	北京达佳互联信息技术有限公司
主分类号：	H04L29/08	分类号：	H04L29/08;G06N20/00
代理公司：	北京柏杉松知识产权代理事务所(普通合伙) 11413	代理人：	李欣;马敬
地址：	100084 北京市海淀区***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本申请是关于一种信息推送方法、装置、服务器及计算机可读存储介质。该方法包括：当到达信息推送时间时，获得待推送信息及待推送的目标用户的状态信息；将状态信息和预设动作标识输入至预先训练得到的深度强化学习模型，得到每个预设动作标识对应的Q值；预设动作标识包括：推送动作的标识和放弃推送动作的标识；预设动作标识对应的Q值为：执行该预设动作标识对应的动作后所获得的长期反馈的估计值；根据深度强化学习模型输出的最大Q值所对应的动作，确定是否给目标用户推送待推送消息。这样，可以通过深度强化学习模型来捕捉用户对推送时间和推送内容的偏好，从而实现信息的个性化推送。
搜索关键词：	推送预设动作强化学习信息推送计算机可读存储介质目标用户服务器推送内容推送消息推送信息偏好个性化捕捉反馈输出放弃申请
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种信息推送方法，其特征在于，所述方法包括：当到达信息推送时间时，获得待推送信息及待推送的目标用户的状态信息；所述状态信息包括：所述目标用户在历史上接收到的历史推送信息、所述历史推送信息的推送时间和所述目标用户对历史推送信息的处理方式；将所述状态信息和预设动作标识输入至预先训练得到的深度强化学习模型，得到每个预设动作标识对应的Q值；其中，所述预设动作标识包括：推送动作的标识和放弃推送动作的标识；预设动作标识对应的Q值为：执行该预设动作标识对应的动作后所获得的长期反馈的估计值；根据所述深度强化学习模型输出的最大Q值所对应的动作，确定是否给所述目标用户推送所述待推送消息。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司，未经北京达佳互联信息技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201811486104.2/，转载请声明来源钻瓜专利网。

上一篇：CWS容错问题中的错误修复策略的选择方法
下一篇：基于边缘计算的物联网组网系统及组网方法

同类专利

专利分类

H 电学

H04 电通信技术
H04L 数字信息的传输，例如电报通信
H04L29-00 H04L 1/00至H04L 27/00单个组中不包含的装置、设备、电路和系统
H04L29-02 .通信控制；通信处理
H04L29-12 .以数据终端为特征的
H04L29-14 .故障的应对措施
H04L29-04 ..用于多条通信线路的
H04L29-06 ..以协议为特征的

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种信息推送方法、装置、服务器及计算机可读存储介质在审

专利文献下载