[发明专利]一种基于拓扑感知文本表征的网络嵌入学习方法有效

专利信息
申请号: 202110287783.6 申请日: 2021-03-17
公开(公告)号: CN113111224B 公开(公告)日: 2023-08-18
发明(设计)人: 苏勤亮;陈佳星 申请(专利权)人: 中山大学
主分类号: G06F16/901 分类号: G06F16/901;G06F16/906;G06F16/34;G06N3/042
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 刘俊
地址: 510275 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 拓扑 感知 文本 表征 网络 嵌入 学习方法
【说明书】:

发明提供一种基于拓扑感知文本表征的网络嵌入学习方法,该方法利用结点的局部拓扑结构信息,自适应地生成拓扑感知滤波器,并用于文本表征的学习,从而得到拓扑感知的文本表征,更有效地将拓扑结构信息融入到文本表征的挖掘中;此外,本方法可以与现有的基于上下文感知的网络嵌入模型相结合,适用面更广,并且在链接预测、结点分类任务上取得了性能提升,体现了本方法学习到的网络结点表征的有效性。

技术领域

本发明涉及网络嵌入方法领域,更具体地,涉及一种基于拓扑感知文本表征的网络嵌入学习方法。

背景技术

在现实世界中,具有网络结构的数据十分常见,例如,基于微博、微信等平台的社交网络、论文引用网络等。这些网络中往往蕴含着海量的信息,合理有效地挖掘这些信息对一些下游任务的应用非常有益,例如电商系统中的商品推荐、相关论文推荐等。在信息量爆炸式增长的当今时代,这些网络通常都包含大量的结点和边、规模十分庞大,直接对网络进行处理需要大量的时间和存储空间、计算效率很低。因此,研究如何高效地挖掘网络中的有用信息具有重要意义。

在众多网络研究方法中,网络嵌入是一种应用广泛并且取得了较好效果的方法,网络嵌入也叫网络表征学习、图嵌入。网络嵌入的目标是为网络中的每个结点学习一个低维表征,使得这个低维表征尽可能地保留了该结点的重要信息。学习到结点表征后,我们只需要对这些低维表征进行处理就能利用网络中丰富的信息,而不需要对原始的网络进行处理,这样可以极大地提高计算效率。

传统的网络嵌入主要被看成一个降维的过程,主要的降维方法有主成分分析、多维缩放。后来,其他方法如局部线性嵌入被提出,用于保持非线性流型的全局结构。这些方法在小的网络上都能取得不错的效果,但是由于算法的复杂度较高,它们并不适用于大型的网络。

目前,已经有许多网络嵌入的算法被提出来,这些算法主要利用到的信息有三大类:网络结构信息、结点属性信息和结点标签信息。网络结构信息是指根据网络的拓扑结构处理获得的信息,例如网络结点直接的邻接关系;结点属性信息是指网络中结点本身具有的一些特性和内容,例如社交网络中每个用户的性别、年龄、好友数量等,论文引用网络中每篇论文的关键词、论文文本等;结点标签信息是指按照某种标准将网络中所有结点分为几大类,每个结点所在的类别信息。

发明内容

本发明提供一种基于拓扑感知文本表征的网络嵌入学习方法,该方法使得网络结点的表征包含更丰富的信息。

为了达到上述技术效果,本发明的技术方案如下:

一种基于拓扑感知文本表征的网络嵌入学习方法,包括以下步骤:

S1:使用图神经网络提取文本网络中结点的局部拓扑结构信息,获取所有结点的拓扑结构表征;

S2:将S1得到的结点的拓扑结构表征输入到滤波器生成模块,生成拓扑感知的滤波器,并将得到的拓扑感知滤波器和文本输入到卷积神经网络模块中,生成拓扑感知的文本表征;

S3:通过已有的网络嵌入模型获取上下文感知的文本表征,与S2中得到的拓扑感知的文本表征结合起来,得到网络结点最终的文本表征;将拓扑结构表征和文本表征结合起来,得到最终的网络结点表征。

进一步地,所述步骤S1的具体过程是:

首先为网络中的每个结点随机初始化一个拓扑结构表征,结点的初始结构表征用表示,根据输入的网络的邻接矩阵,从结点的所有邻居结点中随机采样出多跳邻居,每一跳的邻居数量是固定的,对结点采样跳的邻居后,获得关于结点的局部拓扑图;

采样得到结点的局部拓扑图后,再利用图神经网络一层一层地由外往内学习结点的结构表征,如公式(1)(2):

其中,是图神经网络的参数;表示第个结点在层的邻居;用于将所有邻居结点的向量表征聚集起来,构成一个矩阵;是激活函数;;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110287783.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top