[发明专利]一种基于多种实体上下文的实体对齐方法有效

专利信息
申请号: 202110346496.8 申请日: 2021-03-31
公开(公告)号: CN112988917B 公开(公告)日: 2022-11-18
发明(设计)人: 吴天星;李林;漆桂林 申请(专利权)人: 东南大学
主分类号: G06F16/28 分类号: G06F16/28;G06F16/36;G06F40/216;G06F40/30;G06N3/04;G06N3/08
代理公司: 南京众联专利代理有限公司 32206 代理人: 张天哲
地址: 210096 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 多种 实体 上下文 对齐 方法
【说明书】:

专利公开了一种基于多种实体上下文的实体对齐方法,主要处理因为实体结构异构性、实体属性异构性以及实体文本描述异构性引起的实体对齐困难问题。对于实体结构异构性问题,本专利使用TransE和RDF2Vec方法分别处理一跳和多跳结构信息,获取实体结构编码。对于实体属性异构性,本专利使用图卷积网络技术和图注意力机制,对每个实体按其属性的重要性提取其属性、属性值的信息,并映射到低维稠密的向量空间中。对于实体文本描述异构性,本专利使用预训练语言模型BERT获取文本语义信息,基于种子对齐实体信息进行模型的训练和学习,将实体的文本信息映射到低维稠密的向量空间。最后,本专利使用拼接技术和多视角技术对多种实体上下文进行联合对齐学习。

技术领域

本专利属于实体对齐领域,涉及一种基于多种实体上下文的实体对齐方法。

背景技术

近年来,知识图谱作为一种结构化的知识形式已经引起了学术界和工业界的极大关注。知识图谱(Knowledge Graph)的概念由Google于2012年正式提出,其目的是将大规模知识整合在一起,分析用户查询背后的语义信息,返回更准确和结构化的信息,更大可能地满足用户的查询需求。尽管谷歌公司最初提出知识图谱是为了增强搜索结果,改善用户体验,但目前知识图谱已经逐渐演变为一种通用的技术,很多机构都开始构建自己的知识图谱,例如微软公司的ConceptNet,卡内基梅隆大学的NELL,东南大学的Zhishi.me等等,这些知识图谱被广泛应用于许多基于知识的应用中。由于知识图谱可以由任何机构和个人自由构建,其背后的数据宽泛且质量参差不齐,导致了它们之间的多样性和异构性。例如,对于相交的领域(甚至相同的领域),在现实世界中经常有多个不同的实体指代同一事物。实体对齐的目标就是将不同的知识图融合为一个统一,一致且简洁的知识图谱,并为使用不同知识图谱的应用程序之间的交互建立互操作性。

本专利提出的基于多种实体上下文的实体对齐方法,主要用于处理因为实体结构异构性、实体属性异构性以及实体文本描述异构性等引起的实体对齐困难问题。对于实体结构异构性问题,本专利使用TransE和RDF2Vec方法分别学习实体的一跳和多跳结构信息,将实体从多维稀疏的实体空间映射到低维稠密的向量空间。对于实体属性异构性,本专利使用图卷积网络技术和图注意力机制,对每个实体按其属性的重要性提取其所有属性、属性值的信息,并映射到低维稠密的向量空间中。对于实体文本描述异构性,本专利使用当前最流行的BERT学习文本的语法结构信息和语义信息,基于种子对齐实体信息进行模型的训练和学习,将实体的文本信息映射到低维稠密的向量空间。最后,本专利使用拼接技术和多视角技术对多种实体上下文进行联合对齐学习。

相比较已有的实体对齐方法,本方法考虑了实体的多种上下文,并提出了两种联合对齐学习模型,只需要少量的人工标注对齐实体,即可自动化的完成知识图谱实体对齐。

专利内容

技术问题:本专利提供了一种基于多种实体上下文的实体对齐方法,只需要人工标注少量的种子对齐实体,即可自动化的完成知识图谱实体对齐。

技术方案:本专利公开了一种基于多种实体上下文的实体对齐方法,主要用于处理因为实体结构异构性、实体属性异构性以及实体文本描述异构性等引起的实体对齐困难问题。对于实体结构异构性问题,本专利使用TransE和RDF2Vec方法分别学习实体的一跳和多跳结构信息,将实体从多维稀疏的实体空间映射到低维稠密的向量空间。对于实体属性异构性,本专利使用图卷积网络技术和注意力机制,对每个实体按其属性的重要性提取出综合其所有属性、属性值的信息,并映射到低维稠密的向量空间中。对于实体文本描述异构性,本专利使用当前最流行的BERT学习文本的语法结构信息和语义信息,基于种子对齐实体信息进行模型的训练和学习,将实体的文本信息映射到低维稠密的向量空间。最后,本专利使用拼接技术和多视角技术对多种实体上下文的向量使用联合对齐学习。

本专利提出的基于多种实体上下文的实体对齐方法,包括以下步骤:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110346496.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top