[发明专利]一种基于互信息压缩的紧致图结构学习方法在审
申请号: | 202111588758.8 | 申请日: | 2021-12-23 |
公开(公告)号: | CN114282668A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 石川;王啸;刘念 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 北京挺立专利事务所(普通合伙) 11265 | 代理人: | 叶盛;高福勇 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 互信 压缩 紧致图 结构 学习方法 | ||
本发明公开了一种基于互信息压缩的紧致图结构学习方法,包括以下步骤:S1、以两个基础视图作为模型输入;S2、利用视图评估器分别调整两个基础视图,得到两个评估后的视图;S3、将两个评估后的视图进行自适应聚合,得到最终视图;S4、利用互信息估计器最小化两个评估后的视图和最终视图中两两视图之间的互信息,利用三折优化确保最终视图最小且充分。本发明从理论上提出了“最小充分结构”的概念,并通过理论证明,给出得到最小充分结构的方法,同时保持所学图结构在下游任务上的准确性和鲁棒性。
技术领域
本发明涉及图像处理技术领域,尤其涉及一种基于互信息压缩的紧致图结构学习方法。
背景技术
从自然语言、图像视频到网络分析,图能够建模多个领域的实际系统。当前,图神经网络(Graph Neural Networks,简GNNs)因其特有的消息传递机制,即持续从邻居中聚合信息,在建模图数据方面已经取得了极大的成功。图神经网络已经在许多应用中展现出了优越的性能,包括节点分类、链路预测等等。
图神经网络大致可分为两类:基于谱域的图神经网络和基于空域的图神经网络。基于谱域的图神经网络由图信号处理作为理论支撑,在谱域上定义图卷积操作。例如利用傅里叶基分解图信号、将图拉普拉斯矩阵用切比雪夫多项式扩展来提升效率。另一面,基于空域的图神经网络大大简化了上述的卷积过程,只聚焦于邻域。例如,GCN简单地将一跳邻居进行平均;GraphSAGE利用不同的池化操作,随机聚合一部分邻居节点;GAT为不同的邻居赋予不同的权重。一般而言,图神经网络的表现性能与给定的图的质量密切相关。
然而,由于信息源的复杂性,给定图的质量往往不可靠。一方面,在一些问题上,数据间没有图结构,例如自然语言处理或者计算机视觉。此时,通常是通过引入先验知识来构建出图结构,这通常会引入人为误差;另一方面,即使数据间存在互相交互,虚假的边通常也不可避免存在于图中。例如,在分析未知蛋白质的分子结构时,很可能在分子间建模出错误的边。此外,图常常会遭受攻击,以致原图结构被严重破坏。因此,真实的图结构往往存在上述问题,使得它们不能最优地解决下游任务。
最近,图结构学习(Graph Structure Learning,简称GSL)吸引了广泛的关注,其旨在同时学习最优的图结构和GNN参数。当前的图结构学习可以大致分为两类,即基于单视图和基于多视图的图结构学习。前者通常从单一视图出发(例如,原始的邻接矩阵)去评估最优结构,并给学得的图结构施加一定的约束,从而让其满足一些性质。例如,Pro-GNN为图结构施加低秩、稀疏和特征平滑等约束;考虑到只从一个视图中评估难免会有偏差,后者旨在从原始图结构中抽取多个基础视图,再基于这些基础视图来综合地评估最终视图。例如,IDGL主要利用两种基本视图:归一化的邻接矩阵以及利用节点嵌入计算的相似性矩阵。基于多视图的方法能够利用多方面的知识来得出最终的评估结构。
尽管现有工作已经对多视图图结构学习进行了初步探索,但如何从原则上定义“最优”结构仍然缺乏理论指导。本质上,最优图结构应该仅仅包含关于下游任务最精简的信息,不多也不少,使其能对标签进行最精确的预测。最优图结构应该包含关于标签最少且最充分的信息,使其既能在下游任务上表现良好,又能在对抗攻击中表现一定的鲁棒性。目前的图结构学习框架主要关注于效果的提升,而忽略了结构的紧致性。因此,由这些方法得到的图结构不可避免会包含冗余噪声,进而会被微小扰动干扰。
发明内容
本发明针对上述技术问题,提供一种基于互信息压缩的紧致图结构学习方法,进一步对多视图的图结构学习进行进一步分析,并回答如何从多个视图中有原则地估计最优图结构,我们定义这样的结构为“最小充分结构”,使其在效果和鲁棒性之间达到了平衡。
为了实现上述目的,本发明提供如下技术方案:
一种基于互信息压缩的紧致图结构学习方法,包括以下步骤:
S1、以两个基础视图作为模型输入;
S2、利用视图评估器分别调整两个基础视图,得到两个评估后的视图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111588758.8/2.html,转载请声明来源钻瓜专利网。