[发明专利]基于注意力机制挖掘目标实体的方法及装置在审
申请号: | 202210261366.9 | 申请日: | 2022-03-16 |
公开(公告)号: | CN114626379A | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 李晓宇;董俊川;金力;张泽群;刘庆;马豪伟 | 申请(专利权)人: | 中国科学院空天信息创新研究院 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/216;G06F16/33;G06F16/35;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 樊晓 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 注意力 机制 挖掘 目标 实体 方法 装置 | ||
1.一种基于注意力机制挖掘目标实体的方法,包括:
基于网络数据和专业数据,确定多个实体的属性特征向量;
基于所述属性特征向量和所述多个实体的定义数据,确定所述多个实体之间的关联关系;
利用关系权重学习模型确定所述多个实体之间的关联关系的注意力权重,所述关系权重学习模型包括图注意力神经网络;以及
根据所述多个实体之间的关联关系的注意力权重,利用加权的网页排名算法确定所述多个实体中的目标实体,所述目标实体为所述多个实体中体现全部关联关系的结构和功能信息最多的实体。
2.根据权利要求1所述的方法,其中,所述利用关系权重学习模型确定所述多个实体之间的关联关系的注意力权重包括:
基于所述关联关系,确定所述多个实体之间的关联关系的邻接矩阵,所述邻接矩阵包括根据第一实体与第二实体之间的关联关系得到的矩阵,所述第一实体为所述关系权重学习模型当前处理的实体,所述第二实体包括与所述第一实体相连的所有实体;
基于所述邻接矩阵、所述第一实体的属性特征向量和所述第二实体的属性特征向量,确定初始实体特征;
对所述初始实体特征做线性变换,得到第一线形变换向量和第二线性变换向量,所述第一线形变换向量包括所述第一实体的线性变换向量,所述第二线性变换包括所述第二实体的线性变换向量;
基于所述第一线形变换向量和所述第二线性变换向量,确定所述第一实体和所述第二实体之间的关联关系的注意力权重;以及
基于所述第一实体和所述第二实体之间的关联关系的注意力权重,确定所述多个实体之间的关联关系的注意力权重。
3.根据权利要求2所述的方法,其中,基于所述第一线形变换向量和所述第二线性变换向量,确定所述第一实体和所述第二实体之间的关联关系的注意力权重包括:
基于所述第一线形变换向量和所述第二线性变换向量,确定所述第一实体和所述第二实体之间的关联关系的初始注意力权重;
基于所述初始注意力权重,确定注意力系数;
根据所述注意力系数和所述第二线性变化向量,确定特征聚合的实体特征;以及
基于所述特征聚合的实体特征、所述第一线形变换向量和所述第二线性变换向量,确定所述第一实体和所述第二实体之间的关联关系的注意力权重。
4.根据权利要求3所述的方法,其中,确定所述第一实体和所述第二实体之间的关联关系的初始注意力权重包括:
将所述第一线性变换向量和所述第二线性变换向量中的预设线性变量拼接,得到高维特征向量;以及
基于所述高维特征向量和注意力参数,确定初始注意力权重。
5.根据权利要求1所述的方法,其中,所述根据所述多个实体之间的关联关系的注意力权重,利用加权的网页排名算法确定所述多个实体中的目标实体包括:
根据所述多个实体之间的关联关系的预设顺序,对所述注意力权重进行向量变换,得到入链矩阵和出链矩阵;
根据所述入链矩阵和所述出链矩阵,利用加权的网页排名算法计算所述多个实体的实体得分,得到预设顺序的所述多个实体;以及
根据所述预设顺序的所述多个实体,确定所述多个实体中的目标实体。
6.根据权利要求1所述的方法,其中,所述实体的定义数据包括实体的概念、类别、关联,所述基于所述属性特征向量和所述多个实体的定义数据,确定所述多个实体之间的关联关系包括:
基于所述属性特征向量和所述多个实体的概念,确定所述多个实体的语义等级;
根据所述语义等级和所述多个实体的类别,确定预设形式的关联关系;以及
根据所述预设形式的关联关系,确定所述多个实体之间的关联关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院空天信息创新研究院,未经中国科学院空天信息创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210261366.9/1.html,转载请声明来源钻瓜专利网。