[发明专利]一种提高推荐系统多样性的推荐列表重排名方法有效
| 申请号: | 201911056270.3 | 申请日: | 2019-10-31 |
| 公开(公告)号: | CN110825967B | 公开(公告)日: | 2023-04-07 |
| 发明(设计)人: | 戴斯铭;潘嵘;毛明志 | 申请(专利权)人: | 中山大学 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/958 |
| 代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 陈伟斌 |
| 地址: | 510275 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 提高 推荐 系统 多样性 列表 排名 方法 | ||
本发明涉及一种提高推荐系统多样性的推荐列表重排名方法,首先采用原有的推荐方法获得推荐列表,然后计算用户的熵值,利用该熵值获得推荐列表的排名阀值,排名阀值结合本方法的重排名核心公式,获得新的推荐列表。本发明与现有的参数化排名方法相比,能够考虑到用户对于推荐列表多样性的不同需求,因此其推荐的物品更加贴合人们的真实感受,也考虑了不同用户对于同一物品的评分偏差。并且在准确性与多样性的平衡上,适当地提高多样性,但对于准确性的影响很小。
技术领域
本发明涉及推荐系统领域,更具体地,涉及一种提高推荐系统多样性的推荐列表重排名方法。
背景技术
在信息过剩的互联网时代,信息推荐技术对于互联网公司运营的重要性是不言而喻的,目前各种各样的网站都会在后台使用推荐系统。推荐根据用户的访问特点,计算出最适合推荐给该用户的候选产品,然后把这些产品展现给用户,供其选择。由于产品数量和用户数量非常庞大,推荐系统大量使用到基于云计算的数据挖掘,通过挖掘用户行为和商品信息,使用各种推荐算法来计算推荐列表,实现向不同用户展示不同内容的效果,提高页面的转化率。
现有的推荐系统集中在提高推荐的准确率上,而忽视了推荐列表多样性的重要性。而随着用户对个性化要求的不断提高,如今也出现了同时追求推荐多样性与准确性的方法。如对推荐列表进行重排序的方法,使用评分阈值对准确性和多样性进行平衡,以提高总体多样性,称为参数化排名方法;但参数化排名方法所使用的评分阈值对于所有的用户而言都是相同的,但却没有考虑到用户对于各自推荐列表的多样性的不同需求。比如,有的用户偏爱自己喜欢的东西,而不愿意去尝试新事物,如果我们贸然推荐新的物品给他,反而会引起用户的反感;相反,有些用户兴趣爱好广泛,喜欢尝试新事物,那么推荐新物品给这些用户则是再合适不过了。
发明内容
本发明为克服上述现有技术中参数化排名方法没有考虑到用户对于推荐列表多样性的不同需求这一缺陷,提供一种提高推荐系统多样性的推荐列表重排名方法,通过评分阀值来进行推荐列表排序,能够针对不同用户的不同需求。
为解决上述技术问题,本发明采用的技术方案是:提供一种提高推荐系统多样性的推荐列表重排名方法,包括以下步骤:
步骤一:输入用户-物品评分矩阵R,物品类型矩阵T,推荐列表长度N,通过推荐;采用推荐系统获得推荐列表,可以选用某一种现有的推荐方法获得推荐列表,并预测未知评分R*,未知评分指的就是矩阵R中的空白评分,需要用推荐系统使用算法进行预测;
步骤二:利用标准排名方法获得每个用户的推荐列表的标准排名,该方法对应排序公式为:
rankstandard(i)=R*(u,i)-1
其中,R*(u,i)指根据预测评分由低到高的排名,那么添加上-1的幂则表示按照预测评分由高到低进行排名;
步骤三:计算用户的熵值λ(u),包括物品流行度的熵值和物品类型的熵值,并通过将物品流行度的熵值和物品类型的熵值相加获得用户的熵值;
步骤四:根据用户的熵值计算用户的推荐列表的排名阀值Trank,使用该排名阀值对推荐列表进行重新排序,具体的核心公式如下:
Trank=M*N*λ(u)
其中,rankx(i)是非标准排名方法,rating则指某一个具体评分,TH是指加入推荐列表物品对应的最低评分或是该用户所有已评分物品的平均评分,N是指top-N推荐列表的长度,M是本方法中需要进行调节的超参数(超参数的选取需要进行搜索最优结果对应的值。
优选的,在所述步骤三中,物品流行度的熵值的计算公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911056270.3/2.html,转载请声明来源钻瓜专利网。





