[发明专利]一种基于用户好奇心的贝叶斯个性化排序推荐方法在审
申请号: | 201911405967.7 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111159556A | 公开(公告)日: | 2020-05-15 |
发明(设计)人: | 蔡毅;丁琪琪 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 裴磊磊 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 好奇心 贝叶斯 个性化 排序 推荐 方法 | ||
1.一种基于用户好奇心的贝叶斯个性化排序推荐方法,其特征在于,包括步骤:
使用有好友关系的数据集,遍历数据集中每一个用户的历史数据,对于数据集中的每一个用户u,根据用户u有过正向反馈的物品构建该用户的正向物品集合Pu;
所述对于数据集中的每一个用户,构建令用户感到好奇的物品集合Cu的步骤中,包括:
构建会令用户产生新颖性感觉的物品集合C1;
构建会令用户产生不确定性感觉的物品集合C2;
构建会令用户产生冲突性感觉的物品集合C3;
构建会令用户产生复杂性感觉的物品集合C4;
对于构建集合C1,使用现有的MF算法,得到用户u的朋友对所有评过分的物品i的预测分数,比较预测分数与用户u的朋友对物品i打的实际分数的差值,如果差值达到一定阈值,则把物品i归为会令用户u产生新颖性感觉的物品集合C1;所述物品i不包括用户对其有过正向反馈的物品;
对于构建集合C2,统计用户u的所有朋友对物品i的评分个数,所述物品i不包括用户对其有过正向反馈的物品,使用来表示用户u的朋友对物品i打分为k分的朋友个数,通过以下公式得到用户u的朋友对物品i的打分落在k分数段的概率p(u,i,k)为:
根据香浓熵公式计算出用户u对朋友们对物品i打分给用户u产生的不确定性感觉entropy(u,i)的大小,公式为:
根据Dempster-Shafer理论来支撑计算得到的entropy(u,i)表达‘不确定’的能力,使用DS(u,i)来进行表示:
其中,r表示打分分数段的最高分数值;
则用户u对物品i产生的总不确定性感觉Uncertainty(u,i)可以通过下面的公式来进行计算:
得到用户i对所有物品的不确定感觉,选择前TopN个物品组成会令用户u产生不确定性感觉的物品集合C2;
对于构建集合C3,统计用户u的所有朋友对物品i产生正向反馈和产生负向反馈的比例P1和P2,两者相乘的值为用户u对物品i产生的冲突性强度,选择前TopN个物品归为会令用户u产生冲突性感觉的物品集合C3;所述物品i不包括用户对其有过正向反馈的物品;
对于构建集合C4,用户u对物品i产生的复杂性感觉可以根据该物品和用户以往有过正反馈的物品的相似度差别是否大来进行衡量,物品i和用户历史记录中的物品越不相似,则给用户带来的复杂性感觉越大;所述物品i不包括用户对其有过正向反馈的物品;
构建令用户u感到好奇的物品集合Cu;
构建用户u的负向物品集合Nu;
提出优化排序准则,获取用户矩阵P和物品矩阵Q;所述优化排序准则如下所示:
Xui≥Xuj,Xuc≥Xuj
其中,ui表示从用户u的正向物品集合Pu里面随机选择的物品i,uj表示从用户u的负向物品集合Nu里面随机选择的物品j,uc表示从用户u的好奇心物品集合Cu里面随机选择的物c;Xui≥Xuj优化准则假设对于用户u来说,用户u更加喜欢自己有过正向反馈的物品i而不是用户有过负向反馈的物品j;Xuc≥Xuj优化准则假设对于用户u来说,用户u更加喜欢能让自己产生好奇心的物品c而不是会产生负向反馈的物品j;
使用下面的公式来表示上面两个假设:
其中δ(·)和∈(·)是二进制的常量,表示为:
所以上述的公式可以被重写为:
这里使用sigmoid函数来代替约等于Pr(·),因此目标函数可以变为最大化下面这个目标函数:
其中,Qi,Qj,Qc分别表示的是物品矩阵Q的第i,j,c行,bi,bj,bc分别表示的是b向量的第i,j,c位置的元素;N为用户的数量,M为物品的数量,d是隐因子的大小,另外couc表示用户u的朋友选择c物品而用户u本身没有选择c物品的朋友个数;
对于每一个用户,随机从Pu、Cu、Nu中选择物品组成物品对(positive,negative)和(curiosity,negative)进行训练,在每一次的训练迭代中不断地更新用户矩阵P和物品矩阵Q;具体的基于用户好奇心的贝叶斯个性化排序推荐算法公式推导如下,令
其中,Xui表示的是用户u对物品i的预测评分,Xuj表示的是用户u对物品j的预测评分,Xuc表示的是用户u对物品c的预测评分,Xuij表示的是预测用户u对物品i和物品j喜欢的评分差值,Xucj表示的是预测用户u对物品c和物品j喜欢的评分差值;d表示P和Q矩阵中的隐因子的大小,Puf表示的是P矩阵第u行第f列的一个元素值,Qif表示的是Q矩阵第i行第f列的一个元素值,Qjf表示的是Q矩阵第j行第f列的一个元素值,Qcf表示的是Q矩阵第c行第f列的一个元素值;
根据SGD公式,可以得到:
所以可以得到:
因此有:
当θ=Puf时,
当θ=Qif时,
当θ=Qjf时,
当θ=Qcf时,
当θ=bi时,
当θ=bj时,
当θ=bc时,
根据以上公式对用户矩阵P和物品矩阵Q进行梯度更新;
对用户u所有没有过反馈的物品进行预测评分,选取分数最高的TopN个物品进行推荐。
2.根据权利要求1所述的方法,其特征在于,所述对用户u所有没有过反馈的物品进行预测评分,选取分数最高的TopN个物品进行推荐的步骤中,预测评分公式为:
其中Xuj表示用户u对物品j的最后预测评分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911405967.7/1.html,转载请声明来源钻瓜专利网。