[发明专利]一种基于深度神经网络的在线内容推荐方法有效
| 申请号: | 201510883752.1 | 申请日: | 2015-12-04 | 
| 公开(公告)号: | CN105279288B | 公开(公告)日: | 2018-08-24 | 
| 发明(设计)人: | 陈亮;王娜;李霞 | 申请(专利权)人: | 深圳大学 | 
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N3/02 | 
| 代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 汤东凤 | 
| 地址: | 518060 广东*** | 国省代码: | 广东;44 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 神经网络 在线 内容 推荐 方法 | ||
本发明公开了一种基于深度神经网络的在线内容推荐方法,在传统基于内容推荐的基础上,引入深度神经网络(Deep Neural Network,DNN)词向量工具,根据待推送内容文本信息和用户的历史行为,将内容和用户映射在高维向量空间,通过计算向量间的余弦距离,筛选过滤对推荐内容感兴趣的用户群。通过在大规模移动内容服务系统中的实验证明,本发明所提出的推荐策略相比随机推荐、ContentKNN、以及ItemCF等算法,在推荐效果上获得显著提升。
技术领域
本发明涉及信息处理技术领域,具体涉及一种基于深度神经网络的在线内容推荐方法。
背景技术
伴随在线内容的不断丰富和移动互联网的快速发展,选择合适的内容推送给感兴趣的用户,成为在线内容服务商的重要需求之一。面对的主要挑战有:1、用户特征和内容特征的有效表示;2、个性化推荐的消息推送的精准性要求(无效的消息推送pushnotification过多会打扰用户、影响用户体验);3、推荐算法的复杂度适中,可以基于现有系统进行大规模数据的运算和执行。
现有技术基于传统推荐算法缺乏对用户和内容的深度挖掘,在大规模线上场景的实验中推荐点击率较低,以消息推送Push Notification方式推荐,因不能有效命中用户兴趣,导致推送给大部分的消息被忽略并给用户带来被打扰的体验,不能有效实现精准化个性化Push推荐。例如,对于推荐系统中的新物品、新用户都存在冷启动问题。针对这样的情况,目前大部分推荐系统会考虑使用混合模型和基于内容分析的推荐策略。传统基于内容的推荐算法主要用到物品和用户Tag等描述信息,这些信息通常是由人工添加,不同的人对同一事物有不同的看法,也有不同的描述方式,这样多少会造成数据的差别,从而导致推荐效果的波动和较低的推荐CTR点击率。
发明内容
针对现有技术的不足,本发明旨在提供一种基于深度神经网络的在线内容推荐方法,通过采用深度学习模型,基于深度神经网络对用户和在线内容进行深度分析,并通过有效建立用户、内容的向量化表示,在通用集群上高效实现面向用户的个性化Push推荐方法,使推荐命中率方面获得明显提升。
为了实现上述目的,本发明采用如下技术方案:
一种基于深度神经网络的在线内容推荐方法,包括如下步骤:
S1构建关于待推送内容的内容语料重要词汇库并对其提取关键词,然后将该内容语料重要词汇库作为词向量工具的输入进行词向量模型训练,获得词向量模型;
S2利用步骤S1中得到的词向量模型构建待推送内容向量;
S3基于步骤S1和步骤S2得到的词向量模型和待推送内容向量,定义用户点击已推送的消息为正行为,用户未点击已推送的消息为负行为,建立每个用户的正行为向量模型和负行为向量模型;
S4分别计算每个用户的正行为向量模型和负行为向量模型与步骤S2得到的待推送内容向量之间的距离,并据此确定推送目标用户。
需要说明的是,步骤S1中,通过对内容文本信息进行过滤、合并、分词、去停用词以构建内容语料重要词汇库。
需要说明的是,步骤S1中,采用word2vec作为词向量工具,并采用HS-CBOW模型建立内容语料重要词汇库的词向量。
需要说明的是,步骤S1中,所训练的内容语料重要词汇库中包含在线内容提供商的文本信息,每条信息包括内容本身以及描述内容的文字。
需要说明的是,步骤S1中,词向量维度设定为200维,文本窗口设定为5。
需要说明的是,步骤S2中,利用词向量在向量空间具有的加法运算性质构建待推送内容向量,具体按照下式进行构建:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510883752.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于回弹补偿的有限元模拟中的应力释放
 - 下一篇:调度主站端的点表组态方法
 





