[发明专利]一种融合用户弱痕迹行为偏好的互相关协同过滤方法有效
申请号: | 202010932739.1 | 申请日: | 2020-09-08 |
公开(公告)号: | CN112069419B | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 何中杰;陈永森;陆玲霞;朱晨瑞 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/9535 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 杨舟涛 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 用户 痕迹 行为 偏好 互相 协同 过滤 方法 | ||
1.一种融合用户弱痕迹行为偏好的互相关协同过滤方法,其特征在于:该方法具体包括以下步骤:
步骤1、构建用户的评分矩阵和弱痕迹行为矩阵:
假设用户和物品的数量分别为n和m,而评分值的分数区间为[0,5],建立用户弱痕迹行为矩阵B和评分矩阵Ro,矩阵的大小为n*m:
bi,j=(x|x∈{0,1}) (1)
ri,j=(x|x∈[0,5]) (2)
由是否发生点击、物品被浏览时间确认用户i对物品j是否产生弱痕迹行为,结果用bi,j表示,bi,j=0表示未产生行为,bi,j=1表示产生了弱痕迹行为,将用户产生点击行为或物品被浏览时间Te判断为产生了弱痕迹行为;ri,j表示用户i对物品j的真实评分;
步骤2、对评分矩阵进行数据归一化和再处理:
(1)对评分矩阵进行归一化处理:
其中,r′i,j表示归一化之后的评分值,表示原始评分值;和分别表示评分矩阵Ro中的最大值和最小值,归一化之后的r′i,j∈[0,1];
(2)计算每一个用户的评分均值:
其中表示用户i的评分均值,Nr表示Ro中值不为0的元素数量,且Nr≤m;
(3)基于评分均值和评分矩阵Ro对评分值进行再处理,形成评分增强矩阵R,矩阵的大小为n*m:
将用户的评分均值赋给产生过弱痕迹行为但未产生评分的商品,用以表示用户的弱痕迹行为偏好度;
步骤3、结合评分增强矩阵计算物品的热门惩罚系数:
其中hj表示物品j的热门惩罚系数,|·|表示取绝对值,n表示所有用户的数量;
通过热门惩罚系数,降低因热门因素被大众所点击和浏览,而造成的非偏好行为对用户偏好相似度计算的影响;
步骤4、建立用户-用户偏好相似度计算模型:
(1)基于互相关系数计算方法,计算用户的互相关系数:
其中,和表示加入热门惩罚值之后的用户x和y对集合Bxy中物品的评分均值,Bxy表示评分增强矩阵R中用户x和y共同评分值不为0的物品集合,K表示Bxy中的元素数量,hj表示物品j的热门惩罚系数;表示基于互相关系数用户x和y之间的互相关系数r′x,j表示用户x对物品j的评分值,r′y,j表示用户y对物品j的评分值;
(2)基于评分增强矩阵R,加入热门惩罚系数对互相关系数计算方法进行改进:
其中,和通过式(7)计算得到,wxy表示加入热门惩罚系数后用户x和y的互相关系数,r′x,j表示用户x对物品j的评分值,Bxy表示评分增强矩阵R中用户x和y共同评分值不为0的物品集合,hj表示用户的热门惩罚系数,K表示集合Bxy中元素的个数;
(3)建立用户偏好相似度矩阵W:
对于每一个用户x和用户y,若Bxy≠Φ,计算他们的互相关系数wxy:
并根据计算得到的wxy建立维度为n×n的用户-用户偏好相似度矩阵W;
步骤5、结合步骤2中计算得到的评分增强矩阵R和步骤4中计算得到的用户偏好相似度矩阵W建立用户的相似偏好推荐列表:
(1)计算用户对新物品偏好的预测评分:
其中,p(x,j)表示用户x对物品j偏好的预测评分,S(x)表示用户偏好相似度矩阵W中基于用户x偏好相似度不为0的用户集合;U(j)表示对物品j产生过浏览行为的用户集合;I表示所有物品的集合,Ix表示用户x访问过的物品集合,表示用户x未曾访问过的物品集合,Iy表示用户y访问过的物品集合;
(2)结合公式(11)和公式(12),计算用户x对满足条件的物品j偏好的预测评分p(x,j),并由高到低排序建立用户x的相似偏好物品推荐列表。
2.如权利要求1所述一种融合用户弱痕迹行为偏好的互相关协同过滤方法,其特征在于:步骤1中,e≥10秒。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010932739.1/1.html,转载请声明来源钻瓜专利网。