[发明专利]科技论文引用关系表示学习方法、系统及存储介质有效
申请号: | 202210745739.X | 申请日: | 2022-06-29 |
公开(公告)号: | CN114817578B | 公开(公告)日: | 2022-09-09 |
发明(设计)人: | 薛哲;杜军平;宋杰;梁美玉;邵蓥侠;寇菲菲 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F16/38 | 分类号: | G06F16/38;G06N3/04;G06N3/08 |
代理公司: | 北京金咨知识产权代理有限公司 11612 | 代理人: | 岳燕敏 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 科技 论文 引用 关系 表示 学习方法 系统 存储 介质 | ||
本发明提供一种科技论文引用关系表示学习方法、系统及存储介质,所述方法包括:获取科技论文的关系图,所述关系图中的各节点表示各科技论文,所述关系图中的各边表示科技论文之间的引用关系;基于所述关系图确定第一科技论文特征矩阵及科技论文邻接矩阵;构建图自动编码器;将所述第一科技论文特征矩阵及科技论文邻接矩阵输入至图自动编码器,得到各科技论文的第一嵌入表示。该方法可使科技论文引用关系得到更准确的表示。
技术领域
本发明涉及领计算机技术领域,尤其涉及一种科技论文引用关系表示学习方法、系统及存储介质。
背景技术
图嵌入是一种用于将节点、边以及特征转换为向量空间(较低维度)的方法,同时最大限度地保留图结构和信息等属性。
最新研究表明,有多种方法可以学习图嵌入表示,每种方法都有不同的粒度级别。Deepwalk属于使用游走的图嵌入技术之一,这是图论中的一个概念,只要它们连接到公共边,就可以通过从一个节点移动到另一个节点来实现图的遍历。Node2vec是最早尝试从图形结构化数据中学习的深度学习方法之一;作为node2vec变体的修改,graph2vec本质上是学习嵌入图的子图;这些预先确定的子图有一组由用户指定的边数。同样,潜在子图嵌入被传递给神经网络进行分类。
与以前的嵌入技术不同,SDNE不使用随机游走技术。相反,它尝试从两个不同的指标中学习:一阶接近度(如果两个节点共享一条边,则认为它们相似);二阶接近度(如果两个节点共享许多邻居,则认为它们相似)。LINE明确定义了两个函数;一个用于一阶接近,另一个用于二阶接近。二阶接近的表现明显优于一阶,这意味着更高阶可能会使准确性的提高趋于平稳。HARP通过更好的权重初始化改进解决方案并避免局部最优,并使用图粗化将相关节点聚合为“超级节点”,本质上是一个图预处理步骤,可简化图以加快训练速度。
互信息 (MI) 衡量两个随机变量之间的相互依赖关系,DGI是最早将互信息约束应用于图结构数据的方法,它最大化全局图摘要与其每个节点之间的互信息,以学习信息丰富的节点表示。但是目前DGI有两个限制;首先,DGI忽略了节点嵌入和节点属性之间的相互依赖关系;其次,DGI没有充分挖掘节点之间的各种关系。因而,现有的方法无法对关系图进行较好的表示学习,更无法得到科技论文引用关系的更准确的嵌入表示。因此,如何使科技论文引用关系得到更准确的表示是亟待解决的技术问题。
发明内容
有鉴于此,本发明提供了一种科技论文引用关系表示学习方法、系统及存储介质,以解决现有技术中存在的一个或多个问题。
根据本发明的一个方面,本发明公开了一种科技论文引用关系表示学习方法,所述方法包括:
获取科技论文的关系图,所述关系图中的各节点表示各科技论文,所述关系图中的各边表示科技论文之间的引用关系;
基于所述关系图确定第一科技论文特征矩阵及科技论文邻接矩阵;
构建互信息约束的图自动编码器;
将所述第一科技论文特征矩阵及科技论文邻接矩阵输入至图自动编码器,得到节点的第一嵌入表示;
将所述第一科技论文特征矩阵进行转置运算得到第二科技论文特征矩阵;
将所述第二科技论文特征矩阵及科技论文邻接矩阵输入至图自动编码器,得到节点的第二嵌入表示;
基于所述第一嵌入表示及所述第二嵌入表示确定所述图自动编码器的互信息约束损失。
在本发明的一些实施例中,所述方法还包括:所述图自动编码器包括多层卷积层。
在本发明的一些实施例中,互信息约束损失函数为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210745739.X/2.html,转载请声明来源钻瓜专利网。