[发明专利]基于深度学习处理多源异构数据的推荐方法有效
| 申请号: | 201910547320.1 | 申请日: | 2019-06-24 |
| 公开(公告)号: | CN110263257B | 公开(公告)日: | 2021-08-17 |
| 发明(设计)人: | 冀振燕;宋晓军;赵颖斯;皮怀雨;李俊东 | 申请(专利权)人: | 北京交通大学 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06Q30/06;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京市诚辉律师事务所 11430 | 代理人: | 杨帅峰 |
| 地址: | 100044 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 深度 学习 处理 多源异构 数据 推荐 方法 | ||
近年来深度学习被广泛应用在了图像和音频识别、文本分类和表示学习等领域,基于深度学习的推荐系统也成为学者们的研究热点。深度学习模型在图像、文本等特定数据的表示学习中都取得了极好的效果,避免了复杂的特征工程,可以得到异构数据的非线性多层次的抽象特征表示,克服了多种数据的异质性。目前,融合评分、评论和社交网络的深度学习推荐模型尚未提出。本专利基于深度学习算法,给出了一个具有较强拓展性的推荐流程,分析了不同数据适合使用的相关算法及原理,根据不同数据的损失函数推出了结合评论、评分和社交信息的最终损失函数,提高了推荐结果的准确度。
技术领域
近年来深度学习被广泛应用在了图像和音频识别、文本分类和表示学习等领域,基于深度学习的推荐系统也成为学者们的研究热点。深度学习模型在图像、文本等特定数据的表示学习中都取得了极好的效果,避免了复杂的特征工程,可以得到异构数据的非线性多层次的抽象特征表示,克服了多种数据的异质性。目前,融合评分、评论和社交网络的深度学习推荐模型尚未提出。本专利基于深度学习算法,给出了一个具有较强拓展性的推荐模型。
背景技术
目前的深度学习模型尚不能结合评分、评论和社交网络信息进行推荐。因为多源异构数据的特征表示尚存在困难,社交信息和其他用户和物品交互信息无法直接融合。若能采用深度学习方法学习不同异构数据的表示并将它们统一到一个深度学习模型中,将解决之前研究在算法融合上的需要选择不同算法的缺点,且使用深度学习学习特征表示,将显著提高推荐结果的准确度。为了充分利用这三种数据的优点,本专利融合评分、评论的特征并将社交信息加入到训练的过程中,提出了基于深度学习的多源异构数据推荐模型。
对于评论数据,传统的话题模型不能准确表示文本的特征,本专利通过PV-DBOW模型来学习评论文档的特征表示,PV-DBOW假定文档中的单词之间的独立性,并使用该文档来预测每个观察到的单词。PV-DBOW通过一个稠密向量来代表每个文档,这个向量被训练来预测文档中的单词。对于评分数据,传统的矩阵分解方法面临数据稀疏和准确率较低的困难,本专利使用神经网络训练评分,能够更好地体现用户和物品的特征。对于社交网络数据,本专利对在基于BPR的对学习方法上增加了用户的社交关系信息,使得该方法的采样更加合理,提高了推荐结果的准确度。
发明内容
基于深度学习提出能够处理多源异构数据的推荐模型(或称推荐方法),模型具有准确度高、可扩展性强等优点。模型选择了基于深度学习的文本段落表示学习方法,设计了基于评分学习用户和物品特征的神经网络,并通过社交网络约束基于对的学习。由于现有的基于深度学习的文本表示学习的方法已经较为成熟,所以可以直接使用现有的网络,将其训练结果和其他特征融合一起进行训练,从而得到更加精确的融合特征表示。评分数据和文本数据不同的是,可以直接学习得到用户和物品的特征,所以不需要学习评分的向量表示,也不用学习实体特征。
基于深度学习的多源异构数据推荐模型包含三种数据:评论、评分和社交网络,每种数据都有自身的特点,从不同角度体现了用户或物品的特征。通过深度模型学习多种数据的向量表示,然后通过串联的方法得到用户或物品的融合特征。评论特征体现了用户对物品的态度,也可以用来表示物品的属性,模型通过PV-DBOW算法学习评论段落的特征表示,再加权叠加得到用户或物品的向量表示。评分特征是用户对物品的整体评价,体现了用户对物品的满意级别,使用BPR可以对用户和物品的非线性特征进行学习。社交网络体现了用户间的好友关系,间接影响了用户和物品之间的交互,利用社交网络关系可以加强对用户购买行为的约束,从而进一步提高推荐结果准确度。
上述方法包含了如下步骤:
(1)文本特征提取:使用PV-DBOW模型学习文本段落的特征向量表示。模型采用的是分布式的词袋模型(Distributed Bag-of-Words),该模型使用一个段落向量来预测段落中随机采样得到的词语。
(2)评分特征提取:使用两层全连接的神经网络来学习用户对物品的评分。与文本特征学习模型不同的是,本方法可以直接得到用户和物品的特征向量表示,而不是直接提取评分的特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学,未经北京交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910547320.1/2.html,转载请声明来源钻瓜专利网。





