[发明专利]一种基于三支决策用户聚类的协同过滤电影推荐方法有效
| 申请号: | 202110238299.4 | 申请日: | 2021-03-04 |
| 公开(公告)号: | CN113032687B | 公开(公告)日: | 2023-05-30 |
| 发明(设计)人: | 胡军;康凯 | 申请(专利权)人: | 重庆邮电大学 |
| 主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/9535;G06F18/23213 |
| 代理公司: | 重庆市恒信知识产权代理有限公司 50102 | 代理人: | 陈栋梁 |
| 地址: | 400065 重*** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 决策 用户 协同 过滤 电影 推荐 方法 | ||
本发明请求保护一种基于三支决策用户聚类的协同过滤电影推荐方法,通过将用户划分为核心用户和边界用户两类,在核心用户集合上采用常规的聚类规则得到初始聚类结果的核心域,随后对边界用户采用三支决策划分规划分到初始聚类结果的核心域或边界域,从而实现了一种针对推荐系统中稀疏数据的用户软聚类算法。该算法在聚类时根据用户的潜在分布和实际评分数量将信息不充足的用户划分出来,避免了在核心用户聚类时造成干扰。从而提升了推荐预测精度,与采用单一聚类规则的方法相比聚类精度得以提高,而且不需要对用户进行重复多次的聚类。
技术领域
本发明属于推荐领域,尤其涉及电影推荐技术。
背景技术
协同过滤推荐系统(collaborative filtering recommender systems)是人们从互联网获取信息的重要渠道,传统协同过滤推荐系统由于其原理简单、容易实现且推荐效果良好在不同领域都取得了很好的推荐效果,例如电子商务、在线音乐和电影等。然而搜索近邻时需要遍历整个用户空间,导致算法效率随着数据规模增长而下降,不能满足可扩展性要求。文献[1]中首先提出了基于用户聚类的协同过滤算法(user-based clustering CF,UCCF),通过将聚类技术应用到用户近邻搜索环节可以有效缓解可扩展性问题,但代价是预测评分的精度有所下降。
在基于聚类的协同过滤算法提出之后,陆续有学者对聚类算法在推荐系统中的应用进行了拓展。其主要目标是在保持聚类推荐算法的可扩展性优势的同时提高推荐精度,采取的方法分别有数据填充、改进相似度计算方法和改进聚类结果等。文献[2]从数据稀疏性角度提出了基于用户聚类和物品聚类的联合推荐算法,该算法首先根据用户聚类结果对评分矩阵中的空白项进行填充,然后在填充后的评分矩阵上使用基于物品聚类的协同过滤算法进行预测推荐,实验证明该算法与不填充评分矩阵的协同过滤算法相比,预测评分精度得到了提高。文献[3]提出了一种使用加权平均的相似度计算方法,该方法在用户聚类后将更新用户到距离用户最近的簇中用户的相似度,最后使用更新后的相似度进行预测推荐,实验证明在选取合适的更新权重时,预测精度高于仅使用皮尔逊相关系数的协同过滤推荐算法。文献[4]认为多次聚类比单次聚类相比能得到多个不同的聚类簇,选择和目标用户最相似的簇作为近邻搜索空间能提高近邻质量,实验结果表明该算法可以提高推荐精度和在线推荐效率,但离线的聚类环节会消耗更多时间。文献[5]将模糊聚类与协同过滤结合,对目标用户在所属的所有簇中分别进行预测评分,将聚合后的评分作为最终的预测评分,并在MovieLens数据集验证表明优于使用K-Means聚类的协同过滤推荐算法。
然而,我们发现现有的研究方法中都采用了单一的聚类方法,即对所有样本采用一种规则一次性完成聚类,没有考虑信息不充足的样本和离散样本会对聚类结果产生干扰。
现有研究[1,4,5]表明聚类环节对协同过滤算法的用户近邻搜索结果有较大影响,因此通过改善聚类效果进而实现最终的提高推荐精度目标是一种可行的方案。
推荐系统中的用户物品评分数据的稀疏度很高,传统的样本划分规则往往针对稠密乃至完整的样本;同时聚类算法本身就会受到距离聚类中心较远的离散点干扰,同时有些用户的评分数据过少、信息不充足,直接在原始数据上进行聚类得到的分类结果往往也不够准确。为了解决现有推荐系统聚类环节的方案缺点,本文在聚类时引入三支决策思想[6],综合考虑了用户评分数量和用户总体的分布特征,提出了可操作的划分规则将用户分为核心用户(cores)和边界用户(fringes);随后对核心用户进行使用K-means聚类;在边界用户集合上使用三支决策(three-way decisions)划分规则分配到已有簇的核心域或边界域,将并允许部分用户同时属于多个簇的边界域。从而使得推荐系统在近邻搜索环节的邻居质量得到提高,不再额外的丢失潜在邻居,进而提供推荐的预测评分精度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110238299.4/2.html,转载请声明来源钻瓜专利网。





