[发明专利]基于注意力机制挖掘目标实体的方法及装置在审
申请号: | 202210261366.9 | 申请日: | 2022-03-16 |
公开(公告)号: | CN114626379A | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 李晓宇;董俊川;金力;张泽群;刘庆;马豪伟 | 申请(专利权)人: | 中国科学院空天信息创新研究院 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/216;G06F16/33;G06F16/35;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 樊晓 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 注意力 机制 挖掘 目标 实体 方法 装置 | ||
本公开提供了一种基于注意力机制挖掘目标实体的方法及装置。该方法包括:基于网络数据和专业数据,确定多个实体的属性特征向量;基于属性特征向量和多个实体的定义数据,确定多个实体之间的关联关系;利用关系权重学习模型确定多个实体之间的关联关系的注意力权重,关系权重学习模型包括图注意力神经网络;以及根据多个实体之间的关联关系的注意力权重,利用加权的网页排名算法确定多个实体中的目标实体,目标实体为多个实体中体现关联关系的结构和功能信息最多的实体。本公开还提供了一种基于注意力机制挖掘目标实体的设备、存储介质和程序产品。
技术领域
本公开涉及知识图谱领域,特别涉及一种基于注意力机制挖掘目标实体的方法及装置、电子设备、计算机可读存储介质以及计算机程序产品。
背景技术
关联关系在生活中无处不在,比如人与人、人与组织、组织与组织之间等都存在各种关系。人们生活中面对的很多数据都是图结构,如电力、交通、社交网络,以及知识图谱等,在这些关联关系中,往往会存在薄弱节点,对整个关联关系的维护造成重大的影响。薄弱节点是指相比图网络中其它节点,能对关系拓扑结构和功能价值更具有影响力的节点,如电力网络中关键的薄弱节点瘫痪将导致大面积停电事故,病毒传播网络中薄弱节点将引发大规模病毒扩散。同样的,根据专业领域知识图谱可以了解各实体自身的知识信息,显式地掌握实体与实体之间关联关系,但是对于整个领域图谱来说,确定所有节点中的薄弱点对于维系整个知识体系的结构与功能都非常重要。
目前的方法大多只考察关联关系本身的拓扑结构,例如著名的网页排名算法(PageRank算法),认为一个节点被很多重要的节点指向,那么该节点的重要性也高;图卷积神经网络(Graph Convolution Network,GCN)根据关联关系的拓扑结构和节点的特征,提取到新的高维隐式特征,对节点分类或关系预测,但是GCN是基于定义在无向图的拉普拉斯矩阵的谱分解,而常见的知识图谱中都是有向边。
现有技术中,加权的网页排名算法采取的关系权重依赖统计规则或专家经验,无法得到可靠的关系权重外,另外,节点与节点之间的关系有时不那么可靠,邻接节点的相对重要性也会存在差异;现有技术中获取节点与节点之间关系权重的方法没有利用节点自身丰富的属性特征,目标节点的重要性不能直接体现在拓扑结构中,针对特定结构训练的模型不能直接应用于具有不同结构的图。因此,现有技术中缺乏挖掘关联关系中重要节点的有效方法。
发明内容
鉴于上述问题,本公开提供了一种基于注意力机制挖掘目标实体的方法及装置、电子设备、计算机可读存储介质以及计算机程序产品,用于快速、准确地确定关联关系中的重要节点。
根据本公开的第一个方面,提供了一种基于注意力机制挖掘目标实体的方法,包括:基于网络数据和专业数据,确定多个实体的属性特征向量;基于属性特征向量和多个实体的定义数据,确定多个实体之间的关联关系;利用关系权重学习模型确定多个实体之间的关联关系的注意力权重,关系权重学习模型包括图注意力神经网络;以及根据多个实体之间的关联关系的注意力权重,利用加权的网页排名算法确定多个实体中的目标实体,目标实体为多个实体中体现关联关系的结构和功能信息最多的实体。
根据本公开的实施例,其中,利用关系权重学习模型确定多个实体之间的关联关系的注意力权重包括:基于关联关系,确定多个实体之间的关联关系的邻接矩阵,邻接矩阵包括根据第一实体与第二实体之间的关联关系得到的矩阵,第一实体为关系权重学习模型当前处理的实体,第二实体包括与第一实体相连的所有实体;基于第一实体的邻接矩阵、第一实体的属性特征向量和第二实体的属性特征向量,确定初始实体特征;对初始实体特征做线性变换,得到第一线形变换向量和第二线性变换向量,第一线形变换向量包括第一实体的线性变换向量,第二线性变换包括第二实体的线性变换向量;基于第一线形变换向量和第二线性变换向量,确定第一实体和第二实体之间的关联关系的注意力权重;以及基于第一实体和第二实体之间的关联关系的注意力权重,确定多个实体之间的关联关系的注意力权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院空天信息创新研究院,未经中国科学院空天信息创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210261366.9/2.html,转载请声明来源钻瓜专利网。