[发明专利]一种图神经网络的预训练方法及装置在审
申请号: | 202210315789.4 | 申请日: | 2022-03-28 |
公开(公告)号: | CN114819139A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 赵鑫;侯宇蓬;胡斌斌;张志强;周俊 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司;中国人民大学 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 神经网络 训练 方法 装置 | ||
本说明书实施例提供一种图神经网络的预训练方法及装置,获取业务关系图的图集合,各业务关系图中的节点表示业务对象,连接边表示业务关联关系;图集合包括第一图和目标图,第一图和目标图基于同一样本业务关系图分别进行预设增强处理而得到;针对第一图,分别将图集合中各其他图作为第二图,利用图神经网络进行图间匹配表征,图间匹配表征包括,基于第一图自身,结合来自第二图的节点信息,确定该第一图的第一图表征,用于表示第一图相对于第二图的业务结构关联;基于第二图自身,结合来自第一图的节点信息,确定该第二图的第二图表征;至少基于将目标图作为第二图时得到的第一图表征和第二图表征,确定第一损失;根据第一损失,训练图神经网络。
技术领域
本说明书涉及图神经网络技术领域,尤其涉及一种图神经网络的预训练方法及装置。
背景技术
图神经网络是广为使用的机器学习模型。相对于传统的神经网络,图神经网络不仅能够捕捉节点的特征,而且能够刻画节点之间的关联关系特征,因此,在多项机器学习任务中取得了优异的效果。
尽管目前图神经网络取得了巨大的成功,但如同大多数有监督或半监督机器学习模型一样,图神经网络为了学习到强大的表达能力,其需要大量的标签数据、定义并优化学习目标。而大量的标签数据,尤其是基于图结构的标签数据通常很难获取,而且不同数据的标注需要对应的专业领域知识。那么,如何在无标注的图结构上进行自监督学习来预训练图神经网络成为亟待解决的问题。
发明内容
本说明书一个或多个实施例提供了一种图神经网络的预训练方法及装置,以在无标注的图结构中基于图间匹配实现对图神经网络的预训练。
根据第一方面,提供一种图神经网络的预训练方法,包括:
获取业务关系图的图集合,其中各业务关系图中的节点表示业务对象,连接边表示业务关联关系;所述图集合包括第一图和目标图,所述第一图和目标图基于同一样本业务关系图分别进行预设增强处理而得到;
针对所述第一图,分别将所述图集合中各其他图作为第二图,利用图神经网络进行图间匹配表征,所述图间匹配表征包括,基于第一图自身,结合来自第二图的节点信息,确定该第一图的第一图表征,用于表示第一图相对于第二图的业务结构关联;基于第二图自身,结合来自第一图的节点信息,确定该第二图的第二图表征;
至少基于将所述目标图作为第二图时得到的第一图表征和第二图表征,确定第一损失;
根据所述第一损失,训练所述图神经网络。
在一种可实施方式中,所述业务对象为用户或账户,所述业务关联关系为交易。
在一种可实施方式中,所述预设增强处理包括如下处理中的一项或多项:
针对样本业务关系图中节点和/或连接边的扰动处理;
针对样本业务关系图的子图采样处理;
针对样本业务关系图的图扩散处理;以及
针对样本业务关系图的自适应处理。
在一种可实施方式中,确定该第一图的第一图表征,包括:
基于第一图中的节点信息,结合来自第二图中各第二节点的节点信息,确定第一图中各第一节点的第一节点表征;
对各第一节点表征进行聚合,得到所述第一图的第一图表征。
在一种可实施方式中,确定第一图中各第一节点的第一节点表征,包括:针对各第一节点执行多级向量聚合,其中,每级向量聚合包括:
基于该第一节点在该第一图中的各个邻居节点的上一级聚合向量进行第一聚合,得到图内聚合向量,其中各节点的初级聚合向量根据其节点属性特征确定;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司;中国人民大学,未经支付宝(杭州)信息技术有限公司;中国人民大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210315789.4/2.html,转载请声明来源钻瓜专利网。