[发明专利]一种基于知识表示学习的协同矩阵分解方法有效
申请号: | 201810499629.3 | 申请日: | 2018-05-23 |
公开(公告)号: | CN108804565B | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 刘琼昕;覃明帅;马敬;高春晓 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 北京正阳理工知识产权代理事务所(普通合伙) 11639 | 代理人: | 王民盛 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 表示 学习 协同 矩阵 分解 方法 | ||
本发明涉及一种基于知识表示学习的协同矩阵分解方法,属于推荐系统以及表示学习技术领域。针对协同过滤算法中用户反馈数据的稀疏性问题,在物品的知识图谱上进行随机游走采样,学习其向量表示,并在此基础上联合地分解反馈矩阵和物品关联度矩阵,具体基于根据物品的共现情况计算物品的关联度矩阵,然后基于矩阵分解模型采用协同矩阵分解方法联合地分解用户对物品的反馈矩阵和物品的关联度矩阵;最后,两种矩阵共享物品向量,利用物品的语义信息弥补反馈数据的缺失。实验结果表明,该方法显著地提升了矩阵分解模型的推荐效果,在一定程度上解决了协同过滤的冷启动问题。
技术领域
本发明涉及一种基于知识表示学习的协同矩阵分解方法,属于推荐系统领域。
背景技术
在推荐系统中,基于协同过滤(collaborative filtering)的算法是应用最广泛的一类方法。协同过滤算法简单且高效,只需要用户对物品的反馈信息即可推测用户可能感兴趣的物品。反馈信息包括显式反馈(如用户对物品的评分)和隐式反馈(如用户是否点击过物品)。协同过滤算法存在冷启动问题,它仅考虑了用户对物品的反馈信息,如果反馈数据太稀疏,推荐的效果通常不理想。另外,新加入的物品没有任何反馈信息,协同过滤算法无法对其进行推荐。
为解决冷启动问题,研究人员在协同过滤的基础上结合用户或物品的附加信息提出了一些混合推荐算法。Singh等人提出了一种协同矩阵分解(collective matrixfactorization,CMF)框架,首先将用户、物品或者其他实体之间存在的关系转化为关系矩阵,然后联合分解反馈矩阵和多个关系矩阵。CoFactor利用用户的消费记录生成一个物品共现矩阵,和CMF一样对其进行联合分解,但是该方法本质上还是只用到了用户反馈信息,没有利用物品的客观信息。
本申请提出了一种基于知识表示学习的协同矩阵分解方法,利用物品知识图谱的结构信息生成一个物品关联度矩阵,联合地分解用户反馈矩阵和物品关联度矩阵。实验表明,该方法相较于普通的矩阵分解方法,在各种评价指标上都表现得更好,对于反馈较少的用户和物品,效果提升更加显著。
发明内容
本发明的目的在于针对单一矩阵分解模型冷启动问题,即存在新物品加入时无评价导致无法推荐,提出了一种基于知识表示学习的协同矩阵分解方法。
本发明的核心思想是:在物品的知识图谱上进行随机游走采样,根据物品的共现情况计算物品的关联度矩阵,然后基于矩阵分解模型采用协同矩阵分解方法联合地分解用户对物品的反馈矩阵和物品的关联度矩阵。
一种基于知识表示学习的协同矩阵分解方法,包括如下步骤:
步骤一、根据物品的知识图谱计算物品的关联度矩阵,具体包含如下子步骤:
步骤1.1、将知识图谱视为一个无向图,对无向图中的实体节点进行随机游走采样;
其中,一个无向图,G,记为:G=(V,E);其中,V为无向图G中实体节点的集合,E为无向图G中边的集合,对于无向图G中的每一个实体节点u∈V,以u为起始节点进行一次随机游走得到一个长度为l的节点序列;
用ci表示节点序列中的第i个节点,其中c0=u,假设当前已从取值为t的节点ci-2游走到取值为v的节点ci-1,下一个节点ci取值为x的概率P通过式(1)和式(2)计算:
其中,s表示随机游走的状态;s有0和1两种状态,且s的初始值为0;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810499629.3/2.html,转载请声明来源钻瓜专利网。