[发明专利]一种基于协同过滤优化的推荐算法和装置有效
申请号: | 201711375432.0 | 申请日: | 2017-12-19 |
公开(公告)号: | CN108228745B | 公开(公告)日: | 2020-09-22 |
发明(设计)人: | 陈本庚;刘芳彤;周海汉;陈杰;方勇 | 申请(专利权)人: | 哈勃智远(北京)科技有限公司 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/9536 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 王刚 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 协同 过滤 优化 推荐 算法 装置 | ||
1.一种基于协同过滤优化的推荐方法,其特征在于,应用于基础新闻库和新进新闻库,所述基础新闻库包括未读基础新闻文章及已读基础新闻文章,所述新进新闻库包括新进新闻文章;所述推荐方法包括:
接收目标用户的新闻推荐申请,预估所述目标用户对所述未读基础新闻文章的第一评分,根据所述第一评分对所述未读基础新闻文章进行排序,选取预设数量的所述未读基础新闻文章作为一级推荐列表;
计算所述一级推荐列表中的所述未读基础新闻文章与所述新进新闻文章的相似度,建立所述一级推荐列表中的所述未读基础新闻文章与所述新进新闻文章的对应关系;
根据所述一级推荐列表以及所述对应关系构建候选推荐列表;
计算所述候选推荐列表中各个元素的第二评分,根据所述第二评分排序生成二级推荐列表并发送给目标用户;
所述预估所述目标用户对所述未读基础新闻文章的第一评分包括:
对所述未读基础新闻文章、所述已读基础新闻文章以及所述新进新闻文章进行文章标签化的自然语言处理,提取关键信息;根据所述关键信息,计算所述目标用户对所述已读基础新闻文章的第三评分;
基于所述第三评分采用基于用户的协同过滤算法,计算所述目标用户对所述未读基础新闻文章的第一评分;
所述第三评分的计算公式包括:
其中,feature为关键信息列表,为用户的行为标签,为文章的对应标签;wi为列表中各类标签所占的权重;loved为用户收藏该文章的操作,收藏置为1,未收藏置为0;readingTime为用户阅读该文章的时长,ArticleLenth为文章长度;α1、β1和γ1为各部分对应的计算权重。
2.根据权利要求1所述的基于协同过滤优化的推荐方法,其特征在于,所述相似度的计算公式包括
其中,article1表示所述未读基础新闻文章,article2表示所述新进新闻文章,hot为article2新闻文章的热度值,TimeSpan为article2新闻文章的时间衰减程度,α2、β2和γ2为各部分对应的计算权重。
3.根据权利要求1所述的基于协同过滤优化的推荐方法,其特征在于,所述根据所述一级推荐列表以及所述对应关系构建候选推荐列表,包括:
根据所述对应关系,将所述一级推荐列表中的所述未读基础新闻文章更新为具有对应关系的所述新进新闻文章,得到所述候选推荐列表。
4.根据权利要求3所述的基于协同过滤优化的推荐方法,其特征在于,所述计算所述候选推荐列表中各个元素的第二评分,包括:
计算与所述候选推荐列表中的所述新进新闻文章具有对应关系的所述未读基础新闻文章的第一评分以及所述新进新闻文章、所述未读基础新闻文章的相似度的乘积作为所述第二评分。
5.根据权利要求4所述的基于协同过滤优化的推荐方法,其特征在于,若所述候选推荐列表中的所述新进新闻文章与多个所述未读基础新闻文章具有对应关系,则将所述未读基础新闻文章的第一评分以及所述新进新闻文章、所述未读基础新闻文章的相似度的乘积的和作为所述第二评分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈勃智远(北京)科技有限公司,未经哈勃智远(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711375432.0/1.html,转载请声明来源钻瓜专利网。