[发明专利]基于节点级嵌入特征三维关系重建的图数据相似度方法在审
| 申请号: | 202210059012.6 | 申请日: | 2022-01-18 |
| 公开(公告)号: | CN114511708A | 公开(公告)日: | 2022-05-17 |
| 发明(设计)人: | 刘博;武嘉慧;王志晗;张冀东 | 申请(专利权)人: | 北京工业大学 |
| 主分类号: | G06V10/44 | 分类号: | G06V10/44;G06V10/764;G06V10/82;G06V10/74;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
| 地址: | 100124 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 节点 嵌入 特征 三维 关系 重建 数据 相似 方法 | ||
本发明公开了基于节点级嵌入特征三维关系重建的图数据相似度方法,属于深度学习领域,首先通过孪生图卷积层和相似节点交互模块生成节点级嵌入特征三维关系,然后将节点级嵌入特征三维关系经过三维卷积提取特征,将三维特征经过Flatten层展开为一维,获得最终节点级关系向量。这一关系向量输入到由全连接层构成的结果输出模块得到预测输出。这一预测输出与实际的标签值进行比较,通过损失函数和反向传播算法对整体模型参数进行更新以达到学习的目的。完成训练的DeepSIM‑3D模型能高效可靠地计算输入的两个图结构数据的相似度。
技术领域
本发明属于深度学习领域,主要用于图结构数据相似度计算。设计了一种成对节点比较方法,主要用于基于节点级嵌入特征三维关系重建的图结构数据相似度计算。
背景技术
图广泛存在于真实世界的多种场景中,即节点和边的集合。比如社交网络中人与人之间的联系,生物中蛋白质相互作用以及通信网络中的IP地址之间的通信等等。除此之外,我们最常见的一张图片、一个句子也可以抽象地看做是一个图模型的结构,图结构可以说是无处不在。
图相似性搜索是最重要的基于图的应用程序之一,例如查找与化合物最相似的化合物,但比较两个图的相似度是一个非常复杂的问题。将神经网络应用到图结构数据上,是一类计算图之间相似度的办法,减少计算复杂度,同时保持良好的性能。图结构数据是非欧几里得数据,难以通过传统的距离度量直接表示,在图上直接进行机器学习具有一定的局限性,通常使用图嵌入来进行图的表示。图嵌入是一种将图数据(通常为高维稠密的矩阵)映射为低微稠密向量的过程。图嵌入技术大致可以分为两种:节点嵌入和图嵌入。当需要对节点进行分类,节点相似度预测,节点分布可视化时一般采用节点的嵌入;当需要在图级别上进行预测,需要将整个图表示为一个向量进行嵌入表示。将图表示为向量后,可以方便的用传统距离度量方式计算相似度,如马氏距离。
节点嵌入的目标是优化嵌入空间和节点到该空间的映射逻辑,使网络中“相似”的节点在嵌入空间中彼此“接近”。早期的节点嵌入算法利用基于随机行走方法来得到节点在多维空间上的向量表示并以此定义节点之间的“相似性”。随着深度学习的出现,基于神经网络的算法,包括图卷积网络(Graph Convolution Network),也被应用到节点嵌入的计算中。
本发明最重要的创新点是提出了一种新的基于节点级嵌入特征的图结构数据相似度模型。本模型使用图卷积网络(GCN)结合孪生结构(Siamese Architecture)进行特征提取,即:生成成对的图结构数据嵌入。孪生图卷积神经网络通过在双分支结构的两个图卷积神经网络模块之间共享权值的方式,实现孪生结构。基于深度学习的图相似度计算本质上是衡量两个图在特征空间上的差异,孪生图卷积神经网络可以将成对的图嵌入到向量空间中,更有利于利用常见的度量方式(如:欧氏距离、余弦相似度和马氏距离等)进行比对。
将经过图卷积层得到的节点级嵌入输入到全连接层中,得到固定维度的节点级向量,并对每层向量进行组内相加,得到节点级特征交互向量,并通过向量整合获得三维特征,再经过卷积层、Flatten层获得一维节点级关系向量,最终输入到全连接层中以实现相似度计算并输出预测得分。
本发明综合以上思想,对图结构数据相似度进行计算,调研中发现,基于节点级嵌入特征三维关系重建的图结构数据相似度计算方法的本发明所提模型具有创新性和原创性。
发明内容
受前人工作启发,本发明所提出的模型设计两个输入用以接收成对的图数据,输入模块之后连接三个共享权值的图卷积层实现孪生图卷积特征提取模块。将孪生图卷积模块的输出结果输入到全连接层得到固定维度的节点级向量。每对孪生图卷积层的两个输出向量对应相加得到三个节点级交互向量,之后将三个向量相乘得到三维特征。经过三维卷积层提取特征,并用Flatten层将三维的输入压平,得到一维的节点级关系向量。关系向量表征节点对之间的差异,将其输入全连接层输出预测值,与实际值进行比较并通过反向传播算法对模型整体参数进行训练,训练完成后的模型可以对图结构数据进行可靠、快速的计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210059012.6/2.html,转载请声明来源钻瓜专利网。





