[发明专利]一种面向推荐系统的改进协同过滤算法在审
申请号: | 202111525846.3 | 申请日: | 2021-12-14 |
公开(公告)号: | CN114282099A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 唐伟杰;韩立新 | 申请(专利权)人: | 河海大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/36 |
代理公司: | 北京中政联科专利代理事务所(普通合伙) 11489 | 代理人: | 邵娟 |
地址: | 211100 江苏省南京市江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 推荐 系统 改进 协同 过滤 算法 | ||
1.一种面向推荐系统的改进协同过滤算法,其特征在于,融合了知识图谱与基于协同过滤的推荐算法,将知识图谱对于电影的标签以及语义知识的解析作为辅助信息融入到协同过滤推荐算法中,降低了推荐算法对于评分信息的依赖程度,提高了推荐算法的可用性和准确率,算法的主要步骤如下:
步骤1:数据集构建:将文件形式的数据集拆分转换到数据库并进行预处理,转换成算法可直接使用的形式;
步骤2:优化存储方案:采用三元组的方式存储稀疏矩阵中的有效值;
步骤3:该步骤分为两部分:
第一部分:基于知识图谱的推荐算法的主要步骤,其中包括:
(1)构建电影知识图谱:根据电影的评分、标签等基本信息构建电影知识图谱;
(2)学习电影的内涵语义知识:根据构建出的知识图谱,学习电影的内涵语义知识;
(3)将语义知识嵌入到低维向量:引入关系超平面,将语义知识映射到低维向量,令同一实体在不同关系超平面上有不同的表示;
(4)计算电影间的语义相似度:计算两部电影间的语义相似度;
(5)评分预测:挑选出与当前电影语义相似度比较高的k部电影,并预测用户对于这些电影的评分;
第二部分:基于用户的协同过滤算法的主要步骤,其中包括:
(1)计算用户之间相似度:计算当前用户与其他用户之间的相似度;
(2)k近邻:基于上一步计算的用户之间的相似度,挑选出相似度最高的k个用户作为当前用户的近邻;
(3)评分预测:预测当前用户对近邻评价过的项目的评分;
步骤4:评分融合:将基于知识图谱的推荐算法中的预测评分与基于用户的协同过滤推荐算法中的预测评分相融合,得出最终的预测评分;
步骤5、最终推荐结果生成:基于上一步的预测评分,挑出其中评分最高的n个项目作为最终的推荐结果并将其反馈给用户;
在算法执行前,需要先初始化Spark框架,以引入分布式计算,提高算法的执行效率。
2.如权利要求1所述一种面向推荐系统的改进协同过滤算法,其特征在于,采用一种三元组的存储结构来存储稀疏矩阵,包括用户相似度矩阵以及用户-项目之间的评分矩阵,可以有效缓解传统的二维稀疏矩阵带来的存储空间浪费的问题,提高了推荐算法的空间效率,并且使用hash算法存储三元组,提高了对于三元组中的某个元素的访问速度以及存取效率。
3.如权利要求1所述的一种面向推荐系统的改进协同过滤算法,其特征在于,采用分布式计算,提高了协同过滤推荐算法的执行效率,解决了因数据集过大而导致的算法执行时间过长的问题,利用Spark的基于内存的并行计算,极大地缩短了算法的执行时间。
4.如权利要求1所述的一种面向推荐系统的改进协同过滤算法,其特征在于,步骤3的第二部分的第(1)步中所述的当前用户与其他用户之间的相似度计算公式,该公式采用皮尔逊相关系数计算方法,具体如下:
其中:Iuv表示用户u和用户v共同评价过的项目集合,rui表示用户u对于项目i的评分,rvi表示用户v对项目i的评分,代表用户u的评分的平均值,同理代表用户v对应的评分的平均值,sim(u,v)即用户u与用户v之间的相似度。
5.如权利要求1所述的一种面向推荐系统的改进协同过滤算法,其特征在于,步骤3的第二部分第(3)步中所述的预测当前用户对近邻评价过的项目的评分,评分预测的具体公式如下:
其中:Ni(u)表示用户u的邻居集合,且该集合中的所有邻居都对项目i进行过评分,代表用户u的评分的平均值,同理代表用户v对应的评分的平均值,sim(u,v)即用户u与用户v之间的相似度,则是用户u对于项目i的预测评分。
6.如权利要求1所述的一种面向推荐系统的改进协同过滤算法,其特征在于,步骤4中所述的评分融合,得出最终的预测评分,评分融合的公式如下:
其中:则是基于协同过滤的推荐算法下用户u对于项目i的预测评分,则是基于知识图谱的推荐算法下用户u对于项目i的预测评分,a为一个0到1之间的常数,则是线性融合两者之后的最终预测评分。
7.如权利要求2所述的一种面向推荐系统的改进协同过滤算法,其特征在于,采用一种三元组的存储结构来存储稀疏矩阵,包括用户相似度矩阵以及用户-项目之间的评分矩阵,三元组的结构具体如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111525846.3/1.html,转载请声明来源钻瓜专利网。