[发明专利]一种基于众包的知识图谱构建方法及系统有效
申请号: | 201911399693.5 | 申请日: | 2019-12-30 |
公开(公告)号: | CN111159427B | 公开(公告)日: | 2021-10-01 |
发明(设计)人: | 涂志莹;刘星焜;王忠杰;徐晓飞 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 哈尔滨龙科专利代理有限公司 23206 | 代理人: | 高媛 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 构建 方法 系统 | ||
本发明公开了一种基于众包的知识图谱构建方法及系统,所述方法包括如下步骤:步骤S1、创建图空间;步骤S2、创建用户模式并进行模式匹配和融合;步骤S3、上传资源;步骤S4、图谱构建。所述系统包括图空间模块、用户模式模块、资源模块、图谱构建模块、图数据库容器集群管理模块。本发明采用基于众包的知识获取方法,用户可以根据自己的需求提供资源,添加到知识图谱中,解决知识图谱的资源获取问题。本发明提出一种基于OWL的模式,对异构资源进行描述,从元模型上控制其异构性,使得通过该方法构建的知识图谱可以更容易地进行融合。本发明实现知识应用的操作接口,所述操作接口提供对知识图谱的搜索能力和推理能力。
技术领域
本发明属于计算机技术领域,涉及一种知识图谱构建方法及系统,具体涉及一种基于众包的知识图谱构建方法及系统。
背景技术
知识图谱是将知识结构化形成的知识系统,其中包含了基本事实、通用规则和其他有关信息,常用于人工智能领域的知识抽取、存储与推理等任务。随着智能技术的不断发展,作为人工智能支柱的知识图谱以其强大的知识表示和推理能力受到了学术界和产业界的广泛关注。近年来,知识图谱在语义搜索、问答、知识管理等领域得到了广泛的应用,为了改进信息服务质量,国内外互联网公司纷纷推出知识图谱产品,如谷歌知识图谱、微软BingSatori、百度知心及搜狗知立方等。各个语音助理背后,知识图谱也扮演着重要角色。在大数据的背景下,现有的知识图谱技术有以下能力:一是覆盖能力,能够覆盖多领域的大规模数据;二是包容能力,能够包含大量异构的数据,包容知识的不同表达形式,从而保证应用和用户个性化需求得到满足;三是表示能力,能够对知识的语义信息进行表示。
而在当前知识图谱构建领域,多数研究方法通过抽取实体与实体之间的关系来构建知识图谱,主要包括实体识别方法、关系抽取方法、实体消歧方法与知识补全方法,其中需要大量的人工标注数据,是非常繁琐的数据归一化工作,且没有统一的、标准化的方法能够一次性解决。
发明内容
为了解决现有技术中存在的上述问题,本发明提供了一种基于众包的知识图谱构建方法及系统。对于资源的获取问题,本发明提出一种基于众包方式的知识获取方法,用户可以根据自己的需求收集资源或者提供资源,添加到知识图谱中;对于众包方式获取资源的异构问题,本发明提出一种基于网络本体语言(Web Ontology Language,OWL)的模式,对异构资源进行描述,从元模型上控制其异构性,使得通过该方法构建的知识图谱可以更容易的进行融合。
本发明的目的是通过以下技术方案实现的:
一种基于众包的知识图谱构建方法,包括如下步骤:
步骤S1、创建图空间:
所述图空间为面向用户应用的命名空间,包含一个图数据库容器、一个RDF数据库和一个或多个Trans模型;
步骤S2、创建用户模式并进行模式匹配和融合:
创建用户模式,描述实体类、属性和关系;将用户模式存入步骤S1中创建的图空间所对应的RDF数据库;将用户模式和系统默认模式进行匹配和融合,生成模式匹配表,存入数据库;
步骤S3、上传资源:
用户根据用户模式描述的数据格式上传资源,利用步骤S2所述用户模式和模式匹配表对资源进行正确性校验,并对资源进行统一描述,将资源加入到资源入库队列中;
步骤S4、图谱构建:
从步骤S3所述资源入库队列中取出资源,与知识图谱中的资源进行对齐与融合,新资源加入到知识图谱中,利用Trans系列算法对知识图谱进行训练,得到知识表示学习模型。
一种实现上述方法的知识图谱构建系统,包括图空间模块、模式模块、资源模块、图谱构建模块、图数据库容器集群管理模块,其中:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911399693.5/2.html,转载请声明来源钻瓜专利网。