[发明专利]同时融入好友特征和相似用户特征的协同过滤方法在审
申请号: | 201611237106.9 | 申请日: | 2016-12-28 |
公开(公告)号: | CN106886559A | 公开(公告)日: | 2017-06-23 |
发明(设计)人: | 胡天磊;王铖微;孙辰进;戴文华 | 申请(专利权)人: | 浙江浙大网新集团有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/00 |
代理公司: | 杭州华鼎知识产权代理事务所(普通合伙)33217 | 代理人: | 项军 |
地址: | 310051 浙江省杭州市滨江区长*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 同时 融入 好友 特征 相似 用户 协同 过滤 方法 | ||
技术领域
本发明涉及协同过滤方法及系统,尤其涉及一种同时融入好友特征和相似用户特征的协同过滤算法。
背景技术
近年来,随着互联网产品中信息过载问题的愈发严重,许多产品中都迫切需要提供个性化推荐的功能。然而,传统的推荐技术只考虑了两种实体即“用户”和“物品”,而忽略了好友之间的社交关系对推荐结果的影响。为此,融入社交关系的推荐系统逐渐受到关注,当前已经有许多的科研和工程实践工作证明,社交关系的引入能够有效提高推荐系统的准确性和和个性化程度。
目前,融入社交关系的推荐方法采用的算法,主要分成两大类:(1)基于内存的个性化社交推荐算法:把社交关系融入到传统的基于内存的推荐算法之中,比如在基于用户的最近邻推荐算法或者基于物品的最近邻推荐算法加入社交关系。(2)基于模型的个性化社交算法:把社交关系融入到传统的基于模型的推荐算法之中,比如在概率矩阵分解模型中加入社交关系。
上述两类融入社交关系的推荐方法,只能分别融入社交关系或者用户相似度信息,无法同时对社交关系和用户相似度信息建模,而在真实的互联网产品应用场景之中,用户的兴趣偏好一方面会受到好友的影响,即社交关系的影响。其兴趣另一方面又趋向于相同兴趣偏好的用户,即受到高相似度用户的影响。所以本发明专利提出一种同时融入好友特征和相似用户特征的协同过滤方法和系统,同时把好友特征和相似用户特征融入到用户特征之中,改进协同过滤方法的准确度。
发明内容
本发明的目的在于解决现有技术所存在的问题,找到一种同时融入好友特征和相似用户特征的协同过滤方法,提高协同过滤方法的准确度。
为了实现所述目的,本发明同时融入好友特征和相似用户特征的协同过滤方法,包括以下步骤:
步骤一:获取用户-物品评分矩阵,通过皮尔逊相关系数计算用户之间的相似度,建立用户相似度矩阵;
步骤二:获取用户-用户关系矩阵,对原始用户-用户关系矩阵进行归一化处理,得到归一化后的用户-用户关系矩阵;
步骤三:根据用户相似度矩阵和归一化后的用户-用户关系矩阵将相似用户特征和好友用户特征融入概率矩阵分解模型的用户特征,根据融入相似用户特征和好友用户特征的概率矩阵分解模型获取用户对物品的预测评分,根据预测评分为用户推荐物品。
进一步的,步骤一中,用户之间相似度的计算公式为:
其中,Siw为用户i与物品w的相似度,I为用户i和用户w的公共评分集合,Rij为用户i对物品j的评分,为用户i的评分均值,Rwj为用户w对物品j的评分,为用户w的评分均值。
进一步的,步骤二中,对原始用户-用户关系矩阵进行归一化的过程为:通过归一化,使得Fi表示用户i的好友集合,Tiv为原始用户-用户关系矩阵中第i行第v列的元素表示用户i对用户v的关系。
进一步的,步骤一中,设置相似度阈值,根据用户相似度矩阵选择与用户相似度高于相似度阈值的用户集合作为高相似度用户集合。
进一步的,步骤一中,设置高相似度用户数目的阈值Y,根据用户相似度矩阵选择与用户相似度最高的Y个用户作为高相似度用户集合。
进一步的,Y值为用户的好友数量。
进一步的,融入相似用户特征和好友用户特征的概率矩阵分解模型中:
用户隐因子矩阵U的条件概率为:
物品隐因子矩阵V的条件概率为:
评分预测公式为:
其中,U为用户隐因子矩阵,V为用户隐因子矩阵,S为用户相似度矩阵,T归一化后的用户-用户关系矩阵,Ui为用户i的特征向量,Uυ为用户υ的特征向量,Uw为用户w的特征向量,Vj为物品j的特征向量,Fi为用户i的好友集合,Ni为用户i的高相似度用户集合,Tiv为用户i与物品w的归一化后的关系值,Siw为用户i和用户w之间的相似度,为用户i对物品j的评分预测,为用户i的特征向量与物品j的特征向量的内积。
进一步的,根据融入相似用户特征和好友用户特征的概率矩阵分解模型获取用户对物品的预测评分的步骤包括:
根据预测评分公式、用户隐因子矩阵的条件概率和物品隐因子矩阵的条件概率提出需要最大化的隐因子矩阵的后验概率:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江浙大网新集团有限公司,未经浙江浙大网新集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611237106.9/2.html,转载请声明来源钻瓜专利网。