[发明专利]一种基于深度神经网络的在线内容推荐方法有效
| 申请号: | 201510883752.1 | 申请日: | 2015-12-04 |
| 公开(公告)号: | CN105279288B | 公开(公告)日: | 2018-08-24 |
| 发明(设计)人: | 陈亮;王娜;李霞 | 申请(专利权)人: | 深圳大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N3/02 |
| 代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 汤东凤 |
| 地址: | 518060 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 神经网络 在线 内容 推荐 方法 | ||
1.一种基于深度神经网络的在线内容推荐方法,其特征在于,包括如下步骤:
S1构建关于待推送内容的内容语料重要词汇库并对其提取关键词,然后将该内容语料重要词汇库作为词向量工具的输入进行词向量模型训练,获得词向量模型;
S2利用步骤S1中得到的词向量模型构建待推送内容向量;
S3基于步骤S1和步骤S2得到的词向量模型和待推送内容向量,定义用户点击已推送的消息为正行为,用户未点击已推送的消息为负行为,建立每个用户的正行为向量模型和负行为向量模型;在构建用户的正行为向量模型和负行为向量模式时,作为负行为向量构建基础的负行为数据为作为正行为向量构建基础的正行为数据的1.7倍;利用词向量所具有的加法运算性质并结合TF-IDF方法构建用户的正行为向量和负行为向量,具体如下:
正行为向量化按照下式进行:
其中表示用户u的正行为向量,m+为用户u点击的内容个数、n+为内容V+的关键词个数、均为归一化系数,目的是为了防止不同用户点击内容个数不同,以及不同内容提取的关键词个数不同而产生差异;为内容V+中第i个关键词的TF-IDF权重;为用户点击的内容V+中的第i个关键词通过词向量工具表示的向量;系数N为对应的内容V+在系统中的点击量,该系数用于降低热门内容对结果的偏颇影响;
负行为向量化按照下式进行:
其中表示用户u的负行为向量,m-为用户u没有点击的内容的个数,n-为推送内容中没有点击的内容V-的关键词个数、为归一化系数,以应对不同用户没有点击内容个数不同,以及不同内容提取的关键词个数不同而产生差异;ai-为内容V-中第i个关键词的TF-IDF权重;为内容V-的第i个关键词通过词向量工具表示的向量;系数N为对应的内容V+在系统中的点击量,该系数用于降低热门内容的偏颇影响;
S4分别计算每个用户的正行为向量模型和负行为向量模型与步骤S2得到的待推送内容向量之间的距离,并据此确定推送目标用户。
2.根据权利要求1所述的基于深度神经网络的在线内容推荐方法,其特征在于,步骤S1中,通过对内容文本信息进行过滤、合并、分词、去停用词以构建内容语料重要词汇库。
3.根据权利要求1所述的基于深度神经网络的在线内容推荐方法,其特征在于,步骤S1中,采用word2vec作为词向量工具,并采用HS-CBOW模型建立内容语料重要词汇库的词向量。
4.根据权利要求1所述的基于深度神经网络的在线内容推荐方法,其特征在于,步骤S1中,词向量维度设定为200维,文本窗口设定为5。
5.根据权利要求1所述的基于深度神经网络的在线内容推荐方法,其特征在于,步骤S2中,利用词向量在向量空间具有的加法运算性质构建待推送内容向量,具体按照下式进行构建:
其中,VV表示待推送内容V的向量;n为待推送内容中抽取的关键词个数;为归一化系数,归一化系数的作用在于防止不同内容提取的关键词个数不同而产生差异;为内容V的第i个关键词通过词向量工具表示的向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510883752.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于回弹补偿的有限元模拟中的应力释放
- 下一篇:调度主站端的点表组态方法





