[发明专利]一种基于图卷积神经网络的产业图谱融合方法有效
| 申请号: | 201911394386.8 | 申请日: | 2019-12-30 |
| 公开(公告)号: | CN111159426B | 公开(公告)日: | 2023-04-18 |
| 发明(设计)人: | 熊盛武;陈小英;陈伟;王盛;谢泽丰 | 申请(专利权)人: | 武汉理工大学 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06N3/0464;G06N3/0499;G06N3/08 |
| 代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 魏波 |
| 地址: | 430070 湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 图卷 神经网络 产业 图谱 融合 方法 | ||
1.一种基于图卷积神经网络的产业图谱融合方法,其特征在于,包括以下步骤:
步骤1:基于构建的若干产业子图谱,将产业子图谱内实体、关系以及属性向量化;
步骤2:通过构建与当前实体直接相连的邻接实体集合,得到实体的局部子图,将实体局部子图中的三元组分为属性三元组h,r,a和关系三元组h,r,t;其中,h表示三元组中头实体的嵌入向量,r表示三元组中关系的嵌入向量,a表示属性三元组中属性值向量,t表示三元组中尾实体的嵌入向量;
步骤3:在实体局部子图中使用实体的属性字符嵌入将实体的结构嵌入转换到同一向量空间当中,得到同一向量空间不同知识图谱中实体的嵌入表示;
步骤4:将知识图谱中实体对齐的问题转换为实体局部子图的图匹配问题,进一步利用图注意力方法,首先获得实体局部子图中实体的局部匹配向量;
步骤5:利用图卷积神经网络GCN,在整个图中传播局部匹配信息,为每个实体局部子图生成一个图级的全局匹配向量;
步骤6:将图级的全局匹配向量作为一个双层前馈神经网络输入,并在输出层运用softmax函数获得最后实体对齐的概率。
2.根据权利要求1所述的基于图卷积神经网络的产业图谱融合方法,其特征在于:步骤1中,利用TransE模型将子图谱中的所有三元组的实体、关系以及属性映射到一个低维的向量空间。
3.根据权利要求2所述的基于图卷积神经网络的产业图谱融合方法,其特征在于:步骤1中,产业子图谱内实体、关系以及属性嵌入向量表示通过TransE模型得到,从而得到三元组的嵌入向量表示;
TransE模型基于实体和关系的分布式向量表示,将每个三元组实例h,r,t中的关系r看做从实体h到实体t的翻译,使(h+r)尽可能与t相等,即h+r≈t;这种嵌入模型的目的是保存实体的结构信息,称之为结构嵌入;
为了学习结构嵌入,TransE模型最小化,基于边缘的目标函数
其中Tr为图谱中的三元组,T′r为负样本,γ为超参数,函数f()为判定是三元组合理性的得分函数,tr表示一个合理的三元组,t′r表示一个不合理的三元组。
4.根据权利要求l所述的基于图卷积神经网络的产业图谱融合方法,其特征在于:步骤2中,首先收集当前实体直接相连的邻接实体,得到一组实体集合{e1,...,en},根据三元组尾实体的类型,分为属性三元组h,r,a和关系三元组h,r,t);然后利用TransE得到局部子图中实体的结构嵌入和属性嵌入,目标函数分别为:
其中Tr为图谱中的三元组,T′r为负样本,γ为超参数,函数f()为判定是三元组合理性的得分函数,tr表示一个合理的三元组,t′r表示一个不合理的三元组。
5.根据权利要求4所述的基于图卷积神经网络的产业图谱融合方法,其特征在于:步骤3中,通过TransE模型得到的实体的属性嵌入hce,通过最小化目标函数J=∑h∈G1∪G2[1-cos(hse,hce)],将结构嵌入hse转换到相同的向量空间中,使得同一向量空间实体结构嵌入和属性嵌入能够从两个知识图谱中捕获实体之间的相似性;其中,G1表示一个产业子图谱,G2表示另一个产业子图谱,hce表示实体的属性嵌入,hse表示实体的结构嵌入;最终得到局部实体子图中在同一向量空间中实体的嵌入集合{e1,...,en},n为局部实体子图中实体个数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学,未经武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911394386.8/1.html,转载请声明来源钻瓜专利网。





