[发明专利]一种基于协同过滤优化的推荐算法和装置有效
申请号: | 201711375432.0 | 申请日: | 2017-12-19 |
公开(公告)号: | CN108228745B | 公开(公告)日: | 2020-09-22 |
发明(设计)人: | 陈本庚;刘芳彤;周海汉;陈杰;方勇 | 申请(专利权)人: | 哈勃智远(北京)科技有限公司 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/9536 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 王刚 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 协同 过滤 优化 推荐 算法 装置 | ||
本发明公开了一种基于协同过滤优化的推荐算法,包括:接收目标用户的新闻推荐申请,预估目标用户对未读基础新闻文章的第一评分,根据第一评分对未读基础新闻文章进行排序,选取预设数量的未读基础新闻文章作为一级推荐列表;计算第一推荐列表中的未读基础新闻文章与新进新闻文章的相似度,建立第一推荐列表中的未读基础新闻文章与新进新闻文章的对应关系;根据一级推荐列表以及对应关系构建候选推荐列表;计算候选推荐列表中各个元素的第二评分,根据第二评分排序生成二级推荐列表并发送给目标用户。该方法不仅能够挖掘用户潜在兴趣,还能够保证新闻的时效性,及时的将用户感兴趣的文章推送给用户。
技术领域
本发明涉及基于协同过滤的推荐方法领域,特别是指一种基于协同过滤优化的推荐算法和装置。
背景技术
目前,公知的基于用户的协同过滤的推荐算法是通过已有的用户行为数据,在海量的数据中挖掘出小部分与目标用户品味类似的用户,使这些用户成为邻居,然后根据他们喜欢的东西组织成一个排序后的目录推荐给目标用户。然而,新闻的推荐存在及时性问题,需要不断更新,协同过滤需要经过很长的时间收集用户点击日志数据,从而产生推荐。对于一般的新闻推荐系统不能承受训练数据积累所消耗的时间,容易延误新闻推荐的时效性。
发明内容
有鉴于此,本发明的目的在于提出一种基于协同过滤优化的推荐算法和装置,克服了现有的协同过滤算法收集数据时间长的问题,保证新闻推荐的时效性。
基于上述目的本发明提供的一种基于协同过滤优化的推荐算法,应用于基础新闻库和新进新闻库,所述基础新闻库包括未读基础新闻文章及已读基础新闻文章,所述新进新闻库包括新进新闻文章;所述推荐算法包括:
接收目标用户的新闻推荐申请,预估所述目标用户对所述未读基础新闻文章的第一评分,根据所述第一评分对所述未读基础新闻文章进行排序,选取预设数量的所述未读基础新闻文章作为一级推荐列表;
计算所述第一推荐列表中的所述未读基础新闻文章与所述新进新闻文章的相似度,建立所述第一推荐列表中的所述未读基础新闻文章与所述新进新闻文章的对应关系;
根据所述一级推荐列表以及所述对应关系构建候选推荐列表;
计算所述候选推荐列表中各个元素的第二评分,根据所述第二评分排序生成二级推荐列表并发送给目标用户。
进一步,在所述预估所述目标用户对所述未读基础新闻文章的第一评分之前,还包括:
对所述未读基础新闻文章、所述已读基础新闻文章以及所述新进新闻文章进行文章标签化的自然语言处理,提取关键信息。
进一步,所述预估所述目标用户对所述未读基础新闻文章的第一评分,包括:
根据所述关键信息,计算所述目标用户对所述已读基础新闻文章的第三评分;
基于所述第三评分采用基于用户的协同过滤算法,计算所述目标用户对所述未读基础新闻文章的第一评分。
进一步,所述第三评分的计算公式包括:
其中,feature为所述关键信息列表,为用户的行为标签,为文章的对应标签;w为列表中各类标签所占的权重;Loved为用户收藏该文章的操作,收藏置为1,未收藏置为0;ReadingTime为用户阅读该文章的时长,ArticleLenth为文章长度;α1、β1和γ1为各部分对应的计算权重。
进一步,所述相似度的计算公式包括
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈勃智远(北京)科技有限公司,未经哈勃智远(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711375432.0/2.html,转载请声明来源钻瓜专利网。