[发明专利]基于对称图卷积神经网络的文献分类方法和装置有效

专利信息
申请号: 202110388284.6 申请日: 2021-04-10
公开(公告)号: CN112966114B 公开(公告)日: 2023-08-15
发明(设计)人: 张滨;张珣;杨岚雁;岳明齐;付晶莹;刘锟 申请(专利权)人: 北京工商大学;中国科学院地理科学与资源研究所
主分类号: G06F16/35 分类号: G06F16/35;G06F18/2415;G06F18/214;G06F18/22;G06N3/0464;G06N3/047;G06N3/048;G06N3/084
代理公司: 北京中和立达知识产权代理有限公司 11756 代理人: 杨磊
地址: 100048*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 对称 图卷 神经网络 文献 分类 方法 装置
【说明书】:

发明是关于一种基于对称图卷积神经网络的文献分类方法和装置,方法包括:获取文献引用数据集作为图结构数据,读取文献数据集生成对应的特征矩阵和邻接矩阵,构建相似度矩阵;分别以相似度矩阵和邻接矩阵作为聚合矩阵,对文献数据的特征矩阵进行图卷积操作,得到基于相似度矩阵的第一预测值和基于邻接矩阵的第二预测值;分别计算文献数据中标记节点的监督损失和基于第一预测值和第二预测值的所有文献节点的无监督损失,并将监督损失和无监督损失进行合并,确定最终损失;利用最终损失训练和预设训练集进行训练,得到目标图卷积神经网络,对文献数据集中的目标数据进行半监督分类。通过该技术方案,可以充分嵌入图形知识,提高文献分类的准确性。

技术领域

本发明涉及数据处理技术领域,尤其涉及一种基于对称图卷积神经网络的文献分类方法和装置。

背景技术

图数据广泛存在于现实生活中,例如文献引用关系、社交网络等等。因其可以自然地刻画数据之间的相互关系,所以对于图数据的研究具有重要的现实意义和价值。传统的图数据分析方法大多基于图数据的统计信息或者手动设计的特征,在大部分情况下表现不佳且过程耗时耗力。近年来,深度学习由于其强大的特征表征能力和不依赖过多的先验知识被广泛应用到许多研究领域,一定程度上减少了对数据统计信息和手动设计特征的依赖。因而利用深度神经网络处理图数据成为了图研究的热点,并由此产生图神经网络的概念。

图神经网络被应用于各类图数据建模,包括链接预测、图分类和半监督节点分类。其中,基于图神经网络的半监督节点分类已经取得了巨大的成功。图神经网络在半监督节点分类中的成功主要取决于假设连接的节点倾向于具有相同的标签。在此假设下,图神经网络利用来自相邻节点的信息来改善目标节点的表示学习。例如,图卷积网络(GCN)通过聚合相邻节点的特征信息来迭代更新每个节点的特征表示。GCN模型在卷积中结合了图结构和节点特征,其中未标记节点的特征与附近标记节点的特征混合在一起。由于GCN模型在训练中利用了未标记节点的功能,因此只需要较少的标记节点即可获得较好的预测结果。尽管,图卷积网络在半监督节点分类任务中,已经取得了不错的预测效果。但是,图卷积网络是单通道的网络模型,在更新节点特征信息时仅使用邻接矩阵作为聚合矩阵,只能从单一角度提取特征信息,不能充分嵌入图形知识。

发明内容

为克服相关技术中存在的问题,本发明提供一种基于对称图卷积神经网络的文献分类方法和装置,从而实现双通道图网络,从文献数据的不同视角进行卷积操作,以充分嵌入图形知识,提高文献分类的准确性。

根据本发明实施例的第一方面,提供一种基于对称图卷积神经网络的文献分类方法,所述方法包括:

获取文献引用数据集,利用节点表示文献,利用边表示引用连接,利用节点特征表示文献摘要的关键词,将所述文献引用数据集输入为图结构数据,生成对应的特征矩阵和邻接矩阵,并根据所述特征矩阵和邻接矩阵构建相似度矩阵;

分别以所述相似度矩阵和所述邻接矩阵作为聚合矩阵,对所述文献引用数据的特征矩阵进行图卷积操作,以得到基于所述相似度矩阵的第一预测值和基于所述邻接矩阵的第二预测值;

分别计算所述文献引用数据中标记节点的监督损失和基于所述第一预测值和所述第二预测值的无监督损失,并将所述监督损失和无监督损失进行合并,以确定最终损失,其中,所述监督损失用于表征标记文献节点的基于所述邻接矩阵的第二预测值与真实值之间的误差,所述无监督损失用于所有文献节点的所述第二预测值与第一预测值之间的误差;

利用所述最终损失训练和预设训练集进行训练,得到目标图卷积神经网络;

使用所述目标图卷积神经网络对文献数据集中的目标文献数据进行半监督分类。

在一个实施例中,优选地,获取文献引用数据集,利用节点表示文献,利用边表示引用连接,利用节点特征表示文献摘要的关键词,将所述文献引用数据集输入为图结构数据,生成对应的特征矩阵和邻接矩阵,并根据所述特征矩阵和邻接矩阵构建相似度矩阵,包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工商大学;中国科学院地理科学与资源研究所,未经北京工商大学;中国科学院地理科学与资源研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110388284.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top