[发明专利]基于图卷积神经网络交互的推荐方法及系统有效
申请号: | 202110761639.1 | 申请日: | 2021-07-06 |
公开(公告)号: | CN113255844B | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 李传珍;张洋;蔡娟娟;肖晗;王晖 | 申请(专利权)人: | 中国传媒大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;H04N21/25;H04N21/466;G06F16/9535 |
代理公司: | 北京鸿元知识产权代理有限公司 11327 | 代理人: | 董永辉;曹素云 |
地址: | 100024 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 图卷 神经网络 交互 推荐 方法 系统 | ||
本发明公开一种基于图卷积神经网络交互的推荐方法及系统,方法包括:构建点击率预估模型,点击率预估模型包括图卷积神经网络和输出层,图卷积神经网络包含多个图卷积层,将各特征域上的特征作为节点,通过各节点间相互连接的连接边构成无向图输入到图卷积神经网络中,图卷积神经网络输出各特征交互向量,将各特征交互向量拼接起来输入到输出层,输出点击率预估值,反复优化,直至获得最优点击率预估模型;利用最优点击率预估模型输出点击率预估值,并根据点击率预估结果对候选集排序,输出推荐列表。本发明通过引入图卷积神经网络,解决点击率预估领域的高阶特征交互问题,并以图的方式展示特征交叉的方式,提高推荐结果的可解释性。
技术领域
本发明涉及推荐技术领域,具体地说,涉及一种基于图卷积神经网络交互的推荐方法及系统。
背景技术
随着互联网的发展,信息大爆炸时代的到来,人们完成了从信息匮乏到信息过载的过渡。个性化推荐系统的出现缓解了信息过载的压力,帮助用户从海量的数据中获得真正对自身有帮助的信息。点击率预估模型,最开始只应用于计算广告领域,如今在推荐领域也得到了广泛应用,特别是在推荐系统的排序部分,通过点击率预估模型,计算召回数据的点击率,根据点击率大小对数据进行排序之后,将排序后的结果推荐给用户。
近年来CTR(点击率)预估成为工业界和学术界研究的热点,早期的CTR预估任务多采用LR(逻辑回归)线性模型,LR模型在大规模系统中表现出实现简单和高性能的特性,使之成为工业界最广泛的CTR预估模型。但是LR模型的缺点也很明显,一是由于输入特征是高维稀疏向量,大部分的特征都为0,这样就会导致模型参数学习不准确,影响预测的准确性;二是LR 需要进行人工特征组合,这就需要开发者有非常丰富的领域经验,这样的模型迁移起来比较困难且模型学习能力有限,不能捕获高阶特征(非线性信息)。除此之外,Facebook的研究人员还提出了另一种筛选特征和特征组合的方式,称为GBDT+LR方案,其基本思想是GBDT(梯度提升树)来帮助筛选有区分度的特征和特征组合,并将其作为LR模型的输入,从而增强LR的非线性学习能力。
针对LR模型存在的问题,Oentaryo等人提出了基于FM(因子分解机)的CTR预估模型,该模型不仅考虑了单个特征携带的信息,而且考虑了二阶组合特征(Featuresinteractions)携带的信息,在FM中每个特征用一个D维隐含向量表示,将One-hot编码后的高维稀疏向量转化成一个低维稠密连续向量,二阶特征组合用两个隐含向量的点积表示,FM的出现解决了LR模型因为数据稀疏而导致的参数学习不充分的缺点。FM也存在缺陷,FM的缺陷在于每个特征都只学习一个唯一的隐含向量,在与其他不同特征进行组合时,同一个特征产生的影响力都是相同的;而事实上,当与不同特征域的特征组合时,可能表现出不同的隐含特征分布。Yitao等人在FM模型的基础上引入了特征域(Field)的概念,提出了FFM(Field-aware Factorization Machine,面向特征域的因子分解机)模型。其基本思想是将特征分割为若干领域,每个特征将针对不同的特征域学习不同的隐含向量。FM、FFM都是在LR基础上增加对二阶特征组合的权重自动学习的模型。
综上,LR、FM、FFM被称为基于浅层模型的CTR预估方案,其优点是模型简单、预测性能较好、可解释性强;缺点主要在于很难自动提取高阶组合特征携带的信息。随着深度学习的发展,其探索特征间高阶隐含信息的能力也被应用到CTR预估问题中。早期具有影响力的基于深度学习的CTR预估模型是Zhang等人在2016年提出的基于因子分解机的神经网络模型,其特点是通过FM模型预先训练得到每个特征的稠密嵌入向量(Dense Vector),拼接以后直接输入到DNN(深度神经网络),从而获得高阶特征交互。之后提出的DeepFM、DCN、WideDeep、PNN、NFM、AFM也都是基于相同的思想,将类FM的模型通过串行结构或者并行结构的方式与DNN结合,进行高阶特征和低阶特征的分别建模,提高点击率预估的准确性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国传媒大学,未经中国传媒大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110761639.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:贯通地线的监测方法和系统
- 下一篇:一种电子数据的鉴定方法及装置