[发明专利]一种基于多种实体上下文的实体对齐方法有效
申请号: | 202110346496.8 | 申请日: | 2021-03-31 |
公开(公告)号: | CN112988917B | 公开(公告)日: | 2022-11-18 |
发明(设计)人: | 吴天星;李林;漆桂林 | 申请(专利权)人: | 东南大学 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/36;G06F40/216;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 张天哲 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多种 实体 上下文 对齐 方法 | ||
本专利公开了一种基于多种实体上下文的实体对齐方法,主要处理因为实体结构异构性、实体属性异构性以及实体文本描述异构性引起的实体对齐困难问题。对于实体结构异构性问题,本专利使用TransE和RDF2Vec方法分别处理一跳和多跳结构信息,获取实体结构编码。对于实体属性异构性,本专利使用图卷积网络技术和图注意力机制,对每个实体按其属性的重要性提取其属性、属性值的信息,并映射到低维稠密的向量空间中。对于实体文本描述异构性,本专利使用预训练语言模型BERT获取文本语义信息,基于种子对齐实体信息进行模型的训练和学习,将实体的文本信息映射到低维稠密的向量空间。最后,本专利使用拼接技术和多视角技术对多种实体上下文进行联合对齐学习。
技术领域
本专利属于实体对齐领域,涉及一种基于多种实体上下文的实体对齐方法。
背景技术
近年来,知识图谱作为一种结构化的知识形式已经引起了学术界和工业界的极大关注。知识图谱(Knowledge Graph)的概念由Google于2012年正式提出,其目的是将大规模知识整合在一起,分析用户查询背后的语义信息,返回更准确和结构化的信息,更大可能地满足用户的查询需求。尽管谷歌公司最初提出知识图谱是为了增强搜索结果,改善用户体验,但目前知识图谱已经逐渐演变为一种通用的技术,很多机构都开始构建自己的知识图谱,例如微软公司的ConceptNet,卡内基梅隆大学的NELL,东南大学的Zhishi.me等等,这些知识图谱被广泛应用于许多基于知识的应用中。由于知识图谱可以由任何机构和个人自由构建,其背后的数据宽泛且质量参差不齐,导致了它们之间的多样性和异构性。例如,对于相交的领域(甚至相同的领域),在现实世界中经常有多个不同的实体指代同一事物。实体对齐的目标就是将不同的知识图融合为一个统一,一致且简洁的知识图谱,并为使用不同知识图谱的应用程序之间的交互建立互操作性。
本专利提出的基于多种实体上下文的实体对齐方法,主要用于处理因为实体结构异构性、实体属性异构性以及实体文本描述异构性等引起的实体对齐困难问题。对于实体结构异构性问题,本专利使用TransE和RDF2Vec方法分别学习实体的一跳和多跳结构信息,将实体从多维稀疏的实体空间映射到低维稠密的向量空间。对于实体属性异构性,本专利使用图卷积网络技术和图注意力机制,对每个实体按其属性的重要性提取其所有属性、属性值的信息,并映射到低维稠密的向量空间中。对于实体文本描述异构性,本专利使用当前最流行的BERT学习文本的语法结构信息和语义信息,基于种子对齐实体信息进行模型的训练和学习,将实体的文本信息映射到低维稠密的向量空间。最后,本专利使用拼接技术和多视角技术对多种实体上下文进行联合对齐学习。
相比较已有的实体对齐方法,本方法考虑了实体的多种上下文,并提出了两种联合对齐学习模型,只需要少量的人工标注对齐实体,即可自动化的完成知识图谱实体对齐。
专利内容
技术问题:本专利提供了一种基于多种实体上下文的实体对齐方法,只需要人工标注少量的种子对齐实体,即可自动化的完成知识图谱实体对齐。
技术方案:本专利公开了一种基于多种实体上下文的实体对齐方法,主要用于处理因为实体结构异构性、实体属性异构性以及实体文本描述异构性等引起的实体对齐困难问题。对于实体结构异构性问题,本专利使用TransE和RDF2Vec方法分别学习实体的一跳和多跳结构信息,将实体从多维稀疏的实体空间映射到低维稠密的向量空间。对于实体属性异构性,本专利使用图卷积网络技术和注意力机制,对每个实体按其属性的重要性提取出综合其所有属性、属性值的信息,并映射到低维稠密的向量空间中。对于实体文本描述异构性,本专利使用当前最流行的BERT学习文本的语法结构信息和语义信息,基于种子对齐实体信息进行模型的训练和学习,将实体的文本信息映射到低维稠密的向量空间。最后,本专利使用拼接技术和多视角技术对多种实体上下文的向量使用联合对齐学习。
本专利提出的基于多种实体上下文的实体对齐方法,包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110346496.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种天麻营养保健酸奶及其制备方法
- 下一篇:一种人力驱动的升降画框