[发明专利]一种以群智感知任务为中心的知识图谱构建方法在审
申请号: | 202011053028.3 | 申请日: | 2020-09-29 |
公开(公告)号: | CN112463976A | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 金嘉晖;高士杰;熊润群;张竞慧 | 申请(专利权)人: | 东南大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/295;G06N3/04;G06N3/08 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 薛雨妍 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 感知 任务 中心 知识 图谱 构建 方法 | ||
本发明公开了一种以群智感知任务为中心的演化知识图谱构建技术。本发明本发明提出了一种新型的以群智感知任务为中心的图谱结构,通过将该以该图谱结构的信息构建子图并入基准知识图谱,可以形成知识图谱演化;从感知人员获取群智感知任务并上传感知结果开始,本发明利用双向LSTM‑CRF方式进行命名实体识别,并利用预设定的格式进行关系抽取;随后,通过迭代式的实体链接方法,在每次迭代过程中进行表示学习,将最匹配的实体进行标记,不断迭代提取直到收敛;最后对信息进行可信度分析,结合用户历史提交的结果评估其感知结果的可信度。
技术领域
本发明涉及知识图谱及其应用领域,主要涉及以群智感知任务为中心的演化知识图谱的构建技术。
背景技术
随着大数据、人工智能等技术的快速发展,业界对高质量的标注信息提出了更大的需求。事实上,我们的生活的每时每刻都在产生数据,并被各类设备感知并记录。但是这些数据存在一个不可忽视的问题,就是数据庞大且质量低下。大量的数据被记录,但是从中却无法挖掘有效的信息。比如,很多人使用微博等应用,每天会在不同地点产生很多不同的消息,消息中事实上包含了一定的信息,但是这些信息却难以利用。而通过群智感知任务,让专门的一些人针对专门的任务和专门的对象进行感知,即信息收集,可以提高信息的质量。如何更好的处理建模和保存感知的结果是当下亟需解决的问题。
为了更好地保存和处理群智感知任务反馈的结果,保证数据的高质量,学术界提出了知识图谱等相关的概念。通常情况下,人类感知者产生的数据,往往是不规整的数据,计算机难以处理和理解并利用这种类型的数据。利用知识图谱,可以将复杂的人类知识表征为简单的三元组模式,即“实体-关系-实体”或“实体-关系-属性”,按照这种方式构建一张规模庞大的知识图谱,计算机便可以在此基础上进行推理和判断等后续处理。将知识图谱引入各个应用方向,可以显著提高模型的背景知识和理解能力。将感知结果也以知识图谱的方式进行保存,可以帮助需要使用感知数据的应用高效的利用这些信息。在传统的知识图谱中,只是将基准知识图谱作为背景知识辅助利用,并未将感知结果作为新的知识加入图谱,导致耗费了人力物力的新知识无法用于帮助后来的任务。而如何将新知识可以有效的建模加入图谱,并在不影响原有结构的情况下,可以体现每次感知的特殊性和新知识的特点,需要设计特殊的图谱结构,构成演化知识图谱。
而如何从感知用户提交的非规格化数据中提取规格化的信息,需要进行一系列的复杂操作,包括命名实体识别、关系抽取、实体链接以及真相发现等过程。在传统的感知任务中,感知结果往往以感知用户的反馈为标准,将用户提交的信息直接作为结果报告给任务发布者,给后续的任务利用带来了困难。而传统的实体链接方法,一般是通过考虑单个实体上下文的词频等信息进行匹配,却忽略了全体实体间的内在关系,导致链接偏差。如何将感知用户反馈的非规格化信息进行有效的提取匹配甚至进行可信度验证,是对新知识质量进行把关的关键。
发明内容
为解决上述问题,本发明公开了一种以群智感知任务为中心的知识图谱构建方法,主要提出了群智感知任务图谱构建的结构,以及处理感知数据的一系列技术,着重当下知识图谱信息难以融入群智感知任务的难题。通过设计结构良好的允许图谱动态演化的以群智感知任务为中心的知识图谱,可以将每次感知任务反馈的数据和感知人员信息很好的整合进入图谱。此外,针对感知结果,处理过程还包括提取规整数据的命名实体识别和关系抽取方法、迭代式的实体链接方法和感知结果可信度的评估方法。
技术方案:为实现本发明的目的,本发明所采用的技术方案是:以群智感知任务为中心的演化知识图谱构造方法,该方法包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011053028.3/2.html,转载请声明来源钻瓜专利网。