[发明专利]基于半离散矩阵分解的物品推荐方法有效
| 申请号: | 202010344347.3 | 申请日: | 2020-04-27 |
| 公开(公告)号: | CN111552852B | 公开(公告)日: | 2021-09-28 |
| 发明(设计)人: | 邬俊;罗芳媛;张雨佳 | 申请(专利权)人: | 北京交通大学 |
| 主分类号: | G06F16/906 | 分类号: | G06F16/906;G06F16/9536;G06Q30/06 |
| 代理公司: | 北京市商泰律师事务所 11255 | 代理人: | 黄晓军 |
| 地址: | 100044 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 离散 矩阵 分解 物品 推荐 方法 | ||
1.一种基于半离散矩阵分解的物品推荐方法,其特征在于,包括:
构建用户-物品评分矩阵R,用于记录用户对物品的评分行为;
根据用户-物品评分矩阵R训练矩阵分解模型,获得用户的实值特征矩阵P和物品的实值特征矩阵Q;
根据用户的实值特征矩阵P对用户执行聚类分析,获得用户的锚点特征矩阵E,根据物品的实值特征矩阵Q对物品执行聚类分析,获得物品的锚点特征矩阵F;
根据R、P、Q、E、F训练半离散矩阵分解模型,获得用户的二值编码矩阵B和物品的二值编码矩阵D;
根据用户的二值编码矩阵B和物品的二值编码矩阵D还原评分矩阵
根据R将中已观测评分位置的预估值置0,根据评分矩阵将预测分值最高的前设定数量个物品推荐给相应用户;
所述的构建“用户-物品”评分矩阵R,用于记录用户对物品的评分行为,包括:
构建“用户-物品”评分矩阵R∈[0,1]m×n,用于记录用户对物品的评分行为,其中m、n分别表示用户、物品的数量,并对“用户-物品”评分矩阵R中的评分数据进行归一化处理,所述物品包括产品或者服务;
所述的根据“用户-物品”评分矩阵R训练矩阵分解模型,获得用户的实值特征矩阵P和物品的实值特征矩阵Q,包括:
根据“用户-物品”评分矩阵R训练矩阵分解模型,获得用户的实值特征矩阵和物品的实值特征矩阵P的第u列表示用户u的特征向量,Q的第i列表示物品i的特征向量,其中f为特征空间维数;
所述的根据用户的实值特征矩阵P对用户执行聚类分析,获得用户的锚点特征矩阵E,根据物品的实值特征矩阵Q对物品执行聚类分析,获得物品的锚点特征矩阵F,包括:
根据用户的实值特征矩阵P对用户执行聚类分析,获得用户的锚点特征矩阵根据物品的实值特征矩阵Q对物品执行聚类分析,获得物品的锚点特征矩阵E的第u列表示用户u所在群组的簇中心,F的第i列表示物品i所在群组的簇中心,所述簇中心为锚点特征;
所述的根据R、P、Q、E、F训练半离散矩阵分解模型,获得用户的二值编码矩阵B和物品的二值编码矩阵D,包括:
所述半离散矩阵分解模型的目标函数定义如下:
其中表示损失项,和分别为“点级”和“组级”平滑项,用于异构空间下的特征表示对齐,用于保持原向量空间中“用户-用户”、“物品-物品”之间几何结构;
损失项定义如下:
s.t.B∈{±1}f×m,D∈{±1}f×n
其中Ω是由已观测评分对应的(u,i)索引组成的集合;
“点级”平滑项定义为:用于控制同一个用户、物品的二值编码与其对应的实值特征之间的差异,据此实现异构空间下的表示对齐;
“组级”平滑项定义为:用于控制用户、物品的二值编码与其对应的锚点特征之间的差异,据此保持原向量空间中数据点间的拓扑结构,即原空间中处于同一群组的用户或物品应该具有相似的二值编码;
正则项定义为:用于控制编码平衡,以期最大化编码的信息熵;
合并整理各项后,半离散矩阵分解模型的最终目标函数表示如下:
其中,α1,α2,β1,β2,γ>0为超参数,1m,1n表示m,n维全1向量;
所述半离散矩阵分解模型的训练过程包括如下步骤:
S41:模型初始化;将P和Q进行二值量化,作为半离散矩阵分解模型的目标变量的初始值:B=sgn(P)和D=sgn(Q);
S42:进入迭代训练过程,固定D,更新B;当固定D时,半离散矩阵分解模型的目标函数等价于如下优化问题:
其中Ωu表示已观测评分对应的(u,i)索引对中u所构成的集合;
采用离散坐标下降算法对bu进行逐位更新;设其中buk表示bu的第k位,表示除buk以外其余二值编码所组成的向量;类似的,具体buk的更新规则如下:
当a≠0时,K(a,b)=a,否则K(a,b)=b;如果不对buk进行更新;
S43:固定B,更新D;当固定B时,半离散矩阵分解模型的目标函数等价于如下优化问题:
其中Ωi表示已观测评分对应的(u,i)索引对中i所构成的集合;采用离散坐标下降算法对di进行逐位更新;具体dik的更新规则如下:
同样,如果更新dik,否则,不对dik进行更新;
S44:重复S42到S43,直到满足迭代停止条件,模型收敛,输出所述半离散矩阵分解模型的参数B和D。
2.根据权利要求1所述的方法,其特征在于,所述的迭代停止条件包括:目标函数值小于预设定阈值,或B和D的每一位都不再发生变化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学,未经北京交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010344347.3/1.html,转载请声明来源钻瓜专利网。





