[发明专利]基于多样性的电商推荐算法在审
申请号: | 202210922516.6 | 申请日: | 2022-08-02 |
公开(公告)号: | CN115115435A | 公开(公告)日: | 2022-09-27 |
发明(设计)人: | 王冠;武久国 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06K9/62 |
代理公司: | 湖北唯迈知识产权代理事务所(普通合伙) 42314 | 代理人: | 任伟民 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多样性 推荐 算法 | ||
1.基于多样性的电商推荐算法,其特征在于,包括:
①、为了解决在电商推荐场景下,优化推荐算法,提高推荐多样性,并且解决电商推荐算法推荐长尾现象,推荐算法模型的评价准则为:
(1)、准确率和召回率:准确率是针对预测结果而言的,它表示的是预测为正的样本中有多少是真正的正样本;而召回率是针对原来的样本而言的,它表示的是样本中的正例有多少被预测正确了;如下式:
式中,INu为用户u推荐的物品列表,Tu表示与用户u实际有过交互行为的物品列表;
(2)、覆盖率:指的是推荐系统中推荐的物品数占总物品集合的比例,如下式:
其中,|I|表示总物品数,覆盖率较高的推荐算法可以将物品空间中的大量物品推荐给系统的用户,这样的推荐算法才具有良好的长尾商品的挖掘能力,所以好的推荐算法需要在保持较高准确率和召回率的同时,提高其覆盖率;
(3)、平均流行度:为了更好的解决推荐算法推荐长尾物品的能力,使用平均流行度衡量推荐系统推荐长尾商品的能力;平均流行度越高,说明推荐算法倾向于推荐流行物品;所以为了提高推荐算法推荐长尾商品的能力,平均流行度需要尽可能的低,如下式:
其中,INu为用户u推荐的物品列表,表示与物品i有过交互的用户数占总用户数的比例;
②、上述基于长尾现象推荐算法的模型,传统的基于协同过滤的推荐算法均会受到不同程度的长尾效应的影响,为此,对传统的基于协同过滤的推荐算法进行改进,使长尾商品得到有效的推荐,具体为:
(1)、采用某网购平台100万条商品评分数据集进行实验,将商品转换成数据点的形式,采用K-Means聚类算法将商品进行分类,具体流程如下:
(11)、随机选取K个中心点,生成对应的k个簇;
(12)、遍历所有的数据点,依据“距离”将每一个数据点划分到最近的中心点所在的簇;
(13)、计算每个簇所有的数据点的平均值,并作为该簇新的中心;
(14)、重复2-3步,直到这k个簇的中心点不再变化,或者达到规定的迭代次数;
将K-Means算法的第(12)步中计算距离改成计算每一个数据点划分到最近的中心点所在的簇的相似度;相似度采用(2)中的修正的余弦相似度公式;
(2)、在基于用户的协同过滤算法计算相似度时采用修正的余弦相似度公式(在计算用户相似度时对用户u和用户v共同兴趣列表中的热门物品进行惩罚),公式如下:
其中,|H(i)|表示与物品i有过历史交互记录的用户集合,|H(i)|越大说明与物品i有过交互行为的用户数越多,也就是物品i越热门,热门物品在计算用户相似度时所占的比例就越小。
2.根据权利要求1所述的基于多样性的电商推荐算法,其特征在于:所述的采用某网购平台100万商品评述数据集进行实验,数据的格式为产品编号、产品ID、评分、用户ID。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210922516.6/1.html,转载请声明来源钻瓜专利网。