[发明专利]一种基于拓扑感知文本表征的网络嵌入学习方法有效
申请号: | 202110287783.6 | 申请日: | 2021-03-17 |
公开(公告)号: | CN113111224B | 公开(公告)日: | 2023-08-18 |
发明(设计)人: | 苏勤亮;陈佳星 | 申请(专利权)人: | 中山大学 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/906;G06F16/34;G06N3/042 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 刘俊 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 拓扑 感知 文本 表征 网络 嵌入 学习方法 | ||
本发明提供一种基于拓扑感知文本表征的网络嵌入学习方法,该方法利用结点的局部拓扑结构信息,自适应地生成拓扑感知滤波器,并用于文本表征的学习,从而得到拓扑感知的文本表征,更有效地将拓扑结构信息融入到文本表征的挖掘中;此外,本方法可以与现有的基于上下文感知的网络嵌入模型相结合,适用面更广,并且在链接预测、结点分类任务上取得了性能提升,体现了本方法学习到的网络结点表征的有效性。
技术领域
本发明涉及网络嵌入方法领域,更具体地,涉及一种基于拓扑感知文本表征的网络嵌入学习方法。
背景技术
在现实世界中,具有网络结构的数据十分常见,例如,基于微博、微信等平台的社交网络、论文引用网络等。这些网络中往往蕴含着海量的信息,合理有效地挖掘这些信息对一些下游任务的应用非常有益,例如电商系统中的商品推荐、相关论文推荐等。在信息量爆炸式增长的当今时代,这些网络通常都包含大量的结点和边、规模十分庞大,直接对网络进行处理需要大量的时间和存储空间、计算效率很低。因此,研究如何高效地挖掘网络中的有用信息具有重要意义。
在众多网络研究方法中,网络嵌入是一种应用广泛并且取得了较好效果的方法,网络嵌入也叫网络表征学习、图嵌入。网络嵌入的目标是为网络中的每个结点学习一个低维表征,使得这个低维表征尽可能地保留了该结点的重要信息。学习到结点表征后,我们只需要对这些低维表征进行处理就能利用网络中丰富的信息,而不需要对原始的网络进行处理,这样可以极大地提高计算效率。
传统的网络嵌入主要被看成一个降维的过程,主要的降维方法有主成分分析、多维缩放。后来,其他方法如局部线性嵌入被提出,用于保持非线性流型的全局结构。这些方法在小的网络上都能取得不错的效果,但是由于算法的复杂度较高,它们并不适用于大型的网络。
目前,已经有许多网络嵌入的算法被提出来,这些算法主要利用到的信息有三大类:网络结构信息、结点属性信息和结点标签信息。网络结构信息是指根据网络的拓扑结构处理获得的信息,例如网络结点直接的邻接关系;结点属性信息是指网络中结点本身具有的一些特性和内容,例如社交网络中每个用户的性别、年龄、好友数量等,论文引用网络中每篇论文的关键词、论文文本等;结点标签信息是指按照某种标准将网络中所有结点分为几大类,每个结点所在的类别信息。
发明内容
本发明提供一种基于拓扑感知文本表征的网络嵌入学习方法,该方法使得网络结点的表征包含更丰富的信息。
为了达到上述技术效果,本发明的技术方案如下:
一种基于拓扑感知文本表征的网络嵌入学习方法,包括以下步骤:
S1:使用图神经网络提取文本网络中结点的局部拓扑结构信息,获取所有结点的拓扑结构表征;
S2:将S1得到的结点的拓扑结构表征输入到滤波器生成模块,生成拓扑感知的滤波器,并将得到的拓扑感知滤波器和文本输入到卷积神经网络模块中,生成拓扑感知的文本表征;
S3:通过已有的网络嵌入模型获取上下文感知的文本表征,与S2中得到的拓扑感知的文本表征结合起来,得到网络结点最终的文本表征;将拓扑结构表征和文本表征结合起来,得到最终的网络结点表征。
进一步地,所述步骤S1的具体过程是:
首先为网络中的每个结点随机初始化一个拓扑结构表征,结点的初始结构表征用表示,根据输入的网络的邻接矩阵,从结点的所有邻居结点中随机采样出多跳邻居,每一跳的邻居数量是固定的,对结点采样跳的邻居后,获得关于结点的局部拓扑图;
采样得到结点的局部拓扑图后,再利用图神经网络一层一层地由外往内学习结点的结构表征,如公式(1)(2):
其中,是图神经网络的参数;表示第个结点在层的邻居;用于将所有邻居结点的向量表征聚集起来,构成一个矩阵;是激活函数;;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110287783.6/2.html,转载请声明来源钻瓜专利网。