[发明专利]一种麻雀算法优化模糊聚类的推荐方法在审
申请号: | 202111039921.5 | 申请日: | 2021-09-06 |
公开(公告)号: | CN113723551A | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 王永贵;何佳玉 | 申请(专利权)人: | 辽宁工程技术大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/00 |
代理公司: | 北京华夏正合知识产权代理事务所(普通合伙) 11017 | 代理人: | 韩登营 |
地址: | 123000 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 麻雀 算法 优化 模糊 推荐 方法 | ||
本发明公开了一种麻雀算法优化模糊聚类的推荐方法,步骤为:收集用户对项目进行评分的数据,构建用户‑项目矩阵;先利用麻雀搜索算法查找最优的初聚类中心,再使用最优的聚类中心对用户进行模糊聚类;找出目标用户候选邻居簇,计算目标用户与簇中候选邻居之间的相似度;对目标推荐用户未评分项目进行预测,通过上述相似度的度量,得到评分预测,并按照降序排列,将前N个项目推荐给用户。本发明的麻雀算法优化模糊聚类的推荐方法使推荐的准确度更加精确,用户个性也更加明显,提供麻雀算法优化模糊聚类的推荐方法,有效缓解数据稀疏性、主观性强等问题,推荐误差明显减小,具有良好的推荐效果。
技术领域
本发明属于个性化推荐的技术领域,尤其涉及一种麻雀算法优化模糊聚类的推荐方法。
背景技术
随着电子商务系统规模的进一步扩大,用户数目和项目数据急剧增加,导致用户评分数据的极端稀疏性。在用户评分数据极端稀疏的情况下,传统相似性度量方法存在一定的弊端,使得计算得到的目标用户的最近邻居不准确,推荐系统的推荐质量急剧下降。
协同过滤技术的一些缺点逐渐暴露出来,主要表现在:
(1)稀疏性:在许多推荐系统中,用户-项评估矩阵相当稀疏,一般用户评价信息所涉及到的商品。只能占总数的1%~2%左右(如亚马逊网站、 each-movie网站)。根据传统计算方法很难找到相似用户集,这就导致推荐效果大大降低。
(2)精确性:由于数据极端稀疏,推荐的精确度随之降低。
(3)用户主观性:总的来说推荐系统的产生的目的是在于帮助人们更好的找到感兴趣的信息物品,为用户提供便捷的服务,从原始的由“人找信息”到现在更加自动化的“信息找人”的转变。但是随着用户个人主观性的增强,用户对每个数据评论的评分也会受到主观臆断的干扰随之改变幅度变大,不能达到合理的评断,算法将受到严重的主观评分的影响。
发明内容
基于以上现有技术的不足,本发明所解决的技术问题在于提供一种麻雀算法优化模糊聚类的推荐方法,使推荐的准确度更加精确,用户个性也更加明显,提供麻雀算法优化模糊聚类的推荐方法,有效缓解数据稀疏性、主观性强等问题,推荐误差明显减小,具有良好的推荐效果。
为了解决上述技术问题,本发明通过以下技术方案来实现:
本发明提供一种麻雀算法优化模糊聚类的推荐方法,包括以下步骤:
步骤1:收集用户对项目进行评分的数据,构建用户-项目矩阵;
步骤2:先利用麻雀搜索算法查找最优的初聚类中心,再使用最优的聚类中心对用户进行模糊聚类;
步骤3:找出目标用户候选邻居簇,计算目标用户与簇中候选邻居之间的相似度;
步骤4:对目标推荐用户未评分项目进行预测,通过上述相似度的度量,得到评分预测,并按照降序排列,将前N个项目推荐给用户。
进一步的,步骤1包括以下步骤:
步骤1.1:如果存在用户在评分项并集中对某个类别都没有评分,则采用近邻所评价过这个项目的平均数作为该项目的被评分;
步骤1.2:如果两个用户在项目类别信息中存在评分的项目交集,且不为空,则采用邻域最近邻的方式进行评分填充公式如下:
式中表示uk对项目i的非空评分,分别表示用户uk和用户u在分类c中的平均评分,Uc表示用户u在项目类别c中的最近邻集合,sim(u,uk)表示用户u与用户uk的相似性。
可选的,在步骤2中,通过麻雀搜索算法有效地寻优能力对目标函数进行优化,寻找模糊聚类中的最优的初始聚类中心。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁工程技术大学,未经辽宁工程技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111039921.5/2.html,转载请声明来源钻瓜专利网。