[发明专利]一种基于耦合网络嵌入及知识图谱的协同过滤推荐方法在审
申请号: | 202010979827.7 | 申请日: | 2020-09-17 |
公开(公告)号: | CN112084428A | 公开(公告)日: | 2020-12-15 |
发明(设计)人: | 张全贵;任思楠;李鑫 | 申请(专利权)人: | 辽宁工程技术大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/36;G06N3/04;G06N3/08;G06Q50/00 |
代理公司: | 北京华夏正合知识产权代理事务所(普通合伙) 11017 | 代理人: | 韩登营;韩惠琴 |
地址: | 123000 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 耦合 网络 嵌入 知识 图谱 协同 过滤 推荐 方法 | ||
1.一种基于耦合网络嵌入及知识图谱的协同过滤推荐方法,其特征在于,包括以下步骤:
S1、数据采集及处理;
S2、划分数据集:将处理好的数据集随机选取80%的历史交互作为训练集,用于训练模型;其余作为测试集,用于评估模型的泛化能力;从训练集中随机选取10%的交互作为验证集,用于调整超参数;对每一个可以观察到的用户项目交互,将其视为正例,然后执行负采样策略为用户没有交互过的项目配对负例;
S3、构建融合模型:通过构建协作知识图以端到端的形式显式地对知识图中的高阶连接进行建模;构建用户的社交网络图,考虑社交网络对推荐的影响,并使用注意力机制来区分邻居和社交关系的重要性;通过在注意力权重与特征融合向量进行外积得到的特征矩阵上使用标准的多层感知器来学习用户项目特性之间更深层次的耦合关系;
S4、模型的训练及项目推荐:将步骤S2中得到的训练集和测试集分别用于训练和评估步骤S3中构建的融合模型,根据最终的预测评分判断是否将项目推荐给用户。
2.如权利要求1所述的基于耦合网络嵌入及知识图谱的协同过滤推荐方法,其特征在于,所述步骤S1的数据采集及处理的具体步骤如下:
S101、将下载的MovieLens 1M数据集进行数据预处理;
S102、将用户项目历史交互信息转化为二部图形式;
S103、使用10-core设置,即保留至少有10次交互的用户和项目。
3.如权利要求1所述的基于耦合网络嵌入及知识图谱的协同过滤推荐方法,其特征在于,所述步骤S3中构建融合模型的具体步骤如下:
S301、构建输入层:输入层包括三个输入内容,协作知识图、基于项目的信息和基于用户的社交网络图;
S302、构建融合协作知识图和用户的社交网络图的推荐模型:构建协作知识图以端到端的形式显式地对知识图中的高阶连接进行建模;构建用户的社交网络图,考虑社交网络对推荐的影响,并使用注意力机制来区分邻居和社交关系的重要性;通过在注意力权重与特征融合向量进行外积得到的特征矩阵上使用标准的多层感知器来学习用户项目特性之间更深层次的交互;
S303、构建输出层:预测用户对项目的评分,判断是否将该项目推荐给用户。
4.如权利要求3所述的基于耦合网络嵌入及知识图谱的协同过滤推荐方法,其特征在于,所述步骤S302中构建融合协作知识图和用户的社交网络图的推荐模型的具体步骤如下:
S302-1、构建协作知识图:将用户项目历史交互信息转化为二部图形式,将项目的属性信息纳入图的结构,将知识图和用户项目二部图的混合结构称为协作知识图,作为输入,通过一层embedding全连接层映射为稠密向量,得到用户和项目的隐式向量,表示用户和项目的潜在特征,送入嵌入传播层进行高阶传播,来细化节点的嵌入,得到用户和项目的显式特征向量;
S302-2、构建基于用户的社交网络图;将项目信息和用户的社交网络图进行整合,通过一层embedding全连接层映射为稠密向量,表示用户的基于社交隐式向量,送入嵌入传播层进行高阶传播,得到基于社交的用户特征向量,将用户特征向量与基于社交的用户特征向量进行concatenation得到用户的特征融合向量(u);
S302-3、融合用户项目特征向量:将用户特征向量u与项目特征向量v进行concatenation得到用户项目特征融合向量(uv),并使用注意力机制来区分邻居和社交关系的重要性;
S302-4、MLP学习用户项目耦合关系:在注意力权重与特征融合向量进行外积得到的特征矩阵上使用标准的多层感知器来学习用户项目特性之间更深层次的耦合关系,最后通过sigmoid概率激活函数将用户对物品的评分转化为二分类问题,对用户进行Top-K推荐。
5.如权利要求1所述的基于耦合网络嵌入及知识图谱的协同过滤推荐方法,其特征在于,所述步骤S4中模型的训练及项目推荐的具体步骤如下:
S401、构建损失函数:使用推荐系统中常用的pairwise BPRloss损失函数,能对正样本和负样本加上不同的权重,使正样本能特别体现用户的口味,负样本能少量体现用户的口味;
S402、构建优化函数:采用小批次的Adam来优化模型并更新模型参数;
S403、项目推荐:将用户信息和项目信息送入融合模型,通过sigmoid概率激活函数将用户对物品的评分转化为二分类问题,对用户进行Top-K推荐。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁工程技术大学,未经辽宁工程技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010979827.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:提升苯酚产品质量的方法
- 下一篇:一种涂料配色用质量计量装置