[发明专利]一种融合多模态数据基于注意力感知的个性化服装推荐方法及系统有效
申请号: | 202111348060.9 | 申请日: | 2021-11-15 |
公开(公告)号: | CN113850656B | 公开(公告)日: | 2022-08-23 |
发明(设计)人: | 田保军;康萌;房建东 | 申请(专利权)人: | 内蒙古工业大学 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06F40/289;G06N3/04;G06N3/08 |
代理公司: | 郑州大通专利商标代理有限公司 41111 | 代理人: | 张立强 |
地址: | 010051 内蒙古*** | 国省代码: | 内蒙古;15 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 多模态 数据 基于 注意力 感知 个性化 服装 推荐 方法 系统 | ||
1.一种融合多模态数据基于注意力感知的个性化服装推荐方法,其特征在于,包括:
步骤1:利用隐语义模型LFM从用户评分数据中提取用户的隐因子向量矩阵;所述步骤1包括:
以用户为矩阵的行,服装项目为矩阵的列构建用户-服装项目的评分矩阵:
其中ru,i为用户u对服装项目i的评分;pu,k表示用户u的k维隐因子向量;qi,k表示服装项目i的k维隐因子向量;F表示向量的维度;pu表示用户的隐因子向量矩阵;
步骤2:使用BiGRU和注意力机制挖掘用户评论的特征信息,包括使用用户的隐因子向量矩阵指导用户评论生成单词级的注意力向量;所述步骤2包括:
将用户的历史评论集S={S1,S2,…,Sn,…,SN}中的每条评论表示为单词的组合t1,t2,…,t|S|;
使用预训练的BERT进行向量的嵌入表示,使用BiGRU处理每条评论的词向量序列;
将每个单词在前向和后向两个方向上的隐藏状态拼接得到上下文词向量,从而得到单词序列ht;
使用评分中得到的用户隐因子向量指导评论生成单词级的注意力向量;
将用户隐因子向量矩阵pu和单词序列ht作为输入,进行注意力处理,计算公式为:
其中,表示用户u对单词t的注意力程度;W1,W2,W3是要学习的权重;ak表示执行归一化操作得到的第k个单词的注意力权重;a为单词级的注意力向量,是评论S的总结;
步骤3:在单词级的注意力向量上应用BiGRU拼接前向和后向两个方向上的隐藏状态,得到情境化的用户评论特征向量,然后基于情境化的用户评论特征向量得到用户评论偏好特征向量;所述步骤3包括:
采用注意力处理情境化的用户评论特征向量,生成用户评论偏好特征向量Su,注意力计算的公式为:
βn=W5tanh(W4cn+b1)+b2
其中βn表示使用单层神经网络得到的第n条评论的注意力程度;cn为情境化的用户评论特征向量;W4,W5为权重矩阵;b1,b2为偏置向量;gn表示归一化操作后得到的第n条评论的权重;
步骤4:将用户最后一次购买的服装图像划分为m个区域并提取每个区域的服装图像特征向量,使用情境化的用户评论向量对服装图像特征进行注意力指导,得到用户评论指导生成的服装图像特征向量;所述步骤4包括:
将用户最后一次购买的服装图像划分为m个区域;
使用VGG网络对每个区域进行特征提取,得到原始的服装图像特征向量;
再将从用户评论中得到的情境化的用户评论特征向量使用平均池化汇总为单个向量cs;
对原始的服装图像特征向量进行注意力处理,过滤噪音,得到用户评论指导生成的服装图像特征向量,注意力计算公式为:
δI=tanh(W6vI⊙W7cS)
其中δI表示cs对vI的注意力程度,vI={vi|vi∈Rd,i=1,…,m},vI∈Rd×m,为原始的服装图像特征向量;cs∈Rd;W6,W7为权重矩阵;⊙表示向量的连接;pI∈Rm,表示m个区域的向量,对应于每个区域的注意力概率,pi表示pI中对应第i个区域的向量;VL为用户评论指导生成的服装图像特征向量;
步骤5:将得到的用户评论偏好特征向量和用户评论指导生成的服装图像特征向量进行拼接生成用户偏好特征向量,作为编码器部分输出;
步骤6:将用户偏好特征向量输入到解码器部分,计算候选服装项目集的概率分布,选择概率最大的服装项目作为下一项推荐。
2.一种融合多模态数据基于注意力感知的个性化服装推荐系统,其特征在于,包括:
隐因子向量提取模块,用于利用隐语义模型LFM从用户评分数据中提取用户的隐因子向量矩阵;具体用于:
以用户为矩阵的行,服装项目为矩阵的列构建用户-服装项目的评分矩阵:
其中ru,i为用户u对服装项目i的评分;pu,k表示用户u的k维隐因子向量;qi,k表示服装项目i的k维隐因子向量;F表示向量的维度;pu表示用户的隐因子向量矩阵;
用户评论特征提取模块,用于使用BiGRU和注意力机制挖掘用户评论的特征信息,包括使用用户的隐因子向量矩阵指导用户评论生成单词级的注意力向量;具体用于:
将用户的历史评论集S={S1,S2,…,Sn,…,SN}中的每条评论表示为单词的组合t1,t2,…,t|S|;
使用预训练的BERT进行向量的嵌入表示,使用BiGRU处理每条评论的词向量序列;
将每个单词在前向和后向两个方向上的隐藏状态拼接得到上下文词向量,从而得到单词序列ht;
使用评分中得到的用户隐因子向量指导评论生成单词级的注意力向量;
将用户隐因子向量矩阵pu和单词序列ht作为输入,进行注意力处理,计算公式为:
其中,表示用户u对单词t的注意力程度;W1,W2,W3是要学习的权重;ak表示执行归一化操作得到的第k个单词的注意力权重;a为单词级的注意力向量,是评论S的总结;
用户评论偏好特征向量得出模块,用于在单词级的注意力向量上应用BiGRU拼接前向和后向两个方向上的隐藏状态,得到情境化的用户评论特征向量,然后基于情境化的用户评论特征向量得到用户评论偏好特征向量;具体用于:
采用注意力处理情境化的用户评论特征向量,生成用户评论偏好特征向量Su,注意力计算的公式为:
βn=W5tanh(W4cn+b1)+b2
其中βn表示使用单层神经网络得到的第n条评论的注意力程度;cn为情境化的用户评论特征向量;W4,W5为权重矩阵;b1,b2为偏置向量;gn表示归一化操作后得到的第n条评论的权重;
用户评论指导模块,用于将用户最后一次购买的服装图像划分为m个区域并提取每个区域的服装图像特征向量,使用情境化的用户评论向量对服装图像特征进行注意力指导,得到用户评论指导生成的服装图像特征向量;具体用于:
将用户最后一次购买的服装图像划分为m个区域;
使用VGG网络对每个区域进行特征提取,得到原始的服装图像特征向量;
再将从用户评论中得到的情境化的用户评论特征向量使用平均池化汇总为单个向量cs;
对原始的服装图像特征向量进行注意力处理,过滤噪音,得到用户评论指导生成的服装图像特征向量,注意力计算公式为:
δI=tanh(W6vI⊙W7cS)
其中δI表示cs对vI的注意力程度,vI={vi|vi∈Rd,i=1,…,m},vI∈Rd×m,为原始的服装图像特征向量;cs∈Rd;W6,W7为权重矩阵;⊙表示向量的连接;pI∈Rm,表示m个区域的向量,对应于每个区域的注意力概率,pi表示pI中对应第i个区域的向量;VL为用户评论指导生成的服装图像特征向量;
用户偏好特征向量得出模块,用于将得到的用户评论偏好特征向量和用户评论指导生成的服装图像特征向量进行拼接生成用户偏好特征向量,作为编码器部分输出;
推荐模块,用于将用户偏好特征向量输入到解码器部分,计算候选服装项目集的概率分布,选择概率最大的服装项目作为下一项推荐。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于内蒙古工业大学,未经内蒙古工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111348060.9/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置