[发明专利]一种基于多视图对比学习的多层网络节点表示学习方法在审

专利信息
申请号: 202211355797.8 申请日: 2022-11-01
公开(公告)号: CN115906920A 公开(公告)日: 2023-04-04
发明(设计)人: 张明杰;汪鼎文;吴弘润;李元香;项正龙 申请(专利权)人: 武汉大学
主分类号: G06N3/042 分类号: G06N3/042;G06N3/0464;G06N3/088
代理公司: 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 代理人: 王琪
地址: 430072 湖*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 视图 对比 学习 多层 网络 节点 表示 学习方法
【权利要求书】:

1.一种基于多视图对比学习的多层网络节点表示学习方法,其特征在于,包括以下步骤:

步骤1,数据预处理,将收集到的异构图数据集基于多个对称的元路径进行转换,将异构图转变为基于元路径的多层图网络;

步骤2,基于多层图网络的邻接矩阵和属性矩阵生成初始图网络的扩散视图矩阵和负样本;

步骤3,构建分层图神经网络,使用常用的图卷积网络对多层图网络和扩散图进行卷积处理,得到各层独立的节点表示结果;

步骤4,构建层间融合图神经网络,层间融合图神经网络旨在通过考虑层间交互信息来学习多层图网络中节点的全局整体表示,得到当前层的最终节点表示;

步骤5,对步骤3和步骤4组成的整体模型进行训练;

步骤6,训练完成后,将多层图网络邻接矩阵以及属性矩阵输入训练好的网络模型中得到每层的最终节点表示,最终节点表示结果可以用于下游的节点分类或者聚类任务。

2.如权利要求1所述的一种基于多视图对比学习的多层网络节点表示学习方法,其特征在于:步骤2中使用扩散算法Personalized PageRank(PPR)生成扩散图矩阵,实现方式如下;

对于当前层的邻接矩阵和对角线度数矩阵PPR扩散的公式为:α是位于0-1之间的可设置的超参数,其中n表示多层图网络中节点的个数,对角度数矩阵D(l)的对角线元素dii表示与节点i相连的其它节点个数,即节点i的度数,非对角线元素dij的值为0,其中i,j表示节点,i≠j。

3.如权利要求2所述的一种基于多视图对比学习的多层网络节点表示学习方法,其特征在于:步骤2中生成负样本的实现方式如下;

令邻接矩阵不变,然后随机交换节点属性,通过这种方法,相当于交换了节点间的边,将通过该方法构造出来的新的属性矩阵视为当前多层图网络的反例,即负样本。

4.如权利要求3所述的一种基于多视图对比学习的多层网络节点表示学习方法,其特征在于:步骤3的具体实现方式如下;

图卷积网络GCN的定义为和其中表示图的对称归一化邻接矩阵,In是n维单位矩阵,是的对角度数矩阵;是通过步骤2得到的扩散图矩阵,是图的初始节点属性矩阵,W是待训练的网络模型参数,σ(·)表示激活函数;通过分层图神经网络的处理后,对于多层图网络的每一层,可以得到该层的初始图以及扩散图的正反例节点表示Hs(l),其中,d表示节点表示的维数,Hs(l)表示初始图第l层的正例节点表示,表示扩散图第l层的正例节点表示,表示节点的反例表示,反例的节点表示只需要将X更换为即可,初始图即为多层图网络。

5.如权利要求4所述的一种基于多视图对比学习的多层网络节点表示学习方法,其特征在于:步骤4的具体实现方式如下;

步骤4.1,使用GCN图卷积网络学习步骤1中得到的多层图网络中每一层的正例表示以及反例表示然后通过注意力机制将各层结果进行加权求和得到节点的整体表示,注意力机制考虑各层对整体的影响程度,影响大的会赋予更大的权重,从而更好地获取节点的全局表示,具体公式如下:

其中k表示多层图网络的层数,m表示注意力机制中的注意力头个数,即考虑不同的注意力参数求和得到最终表示,表示第l层在整体表示中所占权重,q(l)是待训练参数,表示的第i行数据,即节点i通过GCN网络得到的低维表示;

该步骤得到的结果为表示初始图以及扩散图的全局正例节点表示,分别表示初始图以及扩散图的全局反例表示;

步骤4.2,为了使多层图网络的最终节点表示结果既包含特定层信息,又包含层间融合信息,将步骤3和步骤4.1中得到的信息聚合起来表示多层网络中每一层的整体嵌入;具体来说,在步骤3得到的各层节点表示上加上一定比例的通过步骤4.1得到的节点全局表示作为当前层的最终节点表示:

η是设定好的层间融合节点表示权重的参数,H(l)和表示第l层的最终节点正例表示,和表示第l层的最终反例表示。

6.如权利要求5所述的一种基于多视图对比学习的多层网络节点表示学习方法,其特征在于:步骤5的具体实现方式如下;

步骤5.1,对比学习流程,在得到了多层图网络各层的最终节点表示后,利用一个函数可以得到网络初始图以及扩散图的图级表示和

表示H(l),的第i行数据,即第i个节点的表示;

对于网络的每一层,为了学习多视图中丰富的节点和图级表示,通过计算节点的表示H(l),和图级表示之间的分值来判别节点是属于正例还是反例,并通过对比一个视图的节点表示和另一个视图的图表示,从而最大化两个视图之间的互信息;

步骤5.2,将整体模型的损失定义为标准二元交叉熵损失,具体的每层损失定义如下;

上述的N和M是相等的,N为正例数量,M为反例数量,都表示节点个数,其中,D表示一个比较辨别器,它是一个双线性层Wd是待训练参数;

得到了每层的损失后,将各层损失相加即可得到总体模型的损失,用于模型参数的反馈修正,模型损失定义为:

‖Θ‖2是网络参数的L2正则化,以预防网络模型的过拟合问题。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211355797.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top