[发明专利]知识图谱的构建方法、工具、装置和服务器在审
| 申请号: | 202110551912.8 | 申请日: | 2021-05-20 |
| 公开(公告)号: | CN113157947A | 公开(公告)日: | 2021-07-23 |
| 发明(设计)人: | 张梦迪;贾玉红;徐聿帆;陆怡 | 申请(专利权)人: | 中国工商银行股份有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/9535;G06F16/182;G06Q40/02 |
| 代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 任默闻;王涛 |
| 地址: | 100140 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 知识 图谱 构建 方法 工具 装置 服务器 | ||
本说明书提供了一种知识图谱的构建方法、工具、装置和服务器。基于该知识图谱的构建方法,可以先确定出待处理的目标源数据的数据结构类型;再根据预设的构建规则和目标源数据的数据结构类型,构建得到与该目标源数据相匹配的目标知识提取单元;进一步,可以调用上述目标知识提取单元来具体处理目标源数据,得到包含有多个三元数据组的符合要求的实体关系文件;再根据上述实体关系文件,构建得到与所述目标源数据关联的目标知识图谱。从而可以有效地简化用户侧操作,降低知识图谱的构建难度,使得用户可以高效、准确地构建得到满足多样化业务需求的、效果较好的知识图谱。
技术领域
本说明书属于人工智能技术领域,尤其涉及知识图谱的构建方法、工具、装置和服务器。
背景技术
知识图谱是人工智能技术中的一个重要分支,对于机器的学习和认知有着重要作用。
但是,现有的知识图谱的构建方法,对具有构建知识图谱需求的用户而言技术门槛较高、构建难度较大。并且,基于现有的知识图谱的构建方法,在具体构建知识图谱时,往往还会存在操作复杂、繁琐,构建效率低,无法满足用户多样化的业务需求等问题。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本说明书提供了一种知识图谱的构建方法、工具、装置和服务器,以简化用户侧操作,降低知识图谱的构建难度,使得用户可以高效、准确地构建得到满足多样化业务需求的、效果较好的知识图谱。
本说明书实施例提供了一种知识图谱的构建方法,包括:
获取目标源数据;
确定目标源数据的数据结构类型;
根据预设的构建规则和所述目标源数据的数据结构类型,构建与所述目标源数据匹配的目标知识提取单元;
调用所述目标知识提取单元处理所述目标源数据,以得到符合要求的实体关系文件;其中,所述实体关系文件包含有多个三元数据组;所述三元数据组至少包括通过一个数据关系相连的两个数据对象;
根据所述实体关系文件,构建与所述目标源数据关联的目标知识图谱。
在一些实施例中,所述目标源数据的数据结构类型包括以下至少之一:结构化数据、非结构化数据、半结构化数据。
在一些实施例中,根据预设的构建规则和所述目标源数据的数据结构类型,构建与所述目标源数据匹配的目标知识提取单元,包括:
根据预设的构建规则,从多个预设的数据源算子中筛选出与目标源数据对应的目标源算子;其中,所述目标源算子用于将所述目标源数据接入目标知识提取单元;
根据所述目标源数据的数据结构类型,确定出相匹配的目标数据处理结构;其中,所述目标数据处理结构用于处理目标源数据以得到多个三元数据组;
确定并配置目标标识终止算子;其中,所述目标标识终止算子用于从目标数据处理结构输出的多个三元数据组中提取出符合要求的三元数据组以得到对应的实体关系文件;
组合所述目标源算子、目标数据处理结构和目标标识终止算子,得到与所述目标数据源匹配的目标知识提取单元。
在一些实施例中,根据所述目标源数据的数据结构类型,确定出相匹配的目标数据处理结构,包括:
在确定目标源数据的数据结构类型为结构化数据的情况下,从多个预设的数据处理算子中筛选出初始处理算子;
对所述初始处理算子进行相应配置,得到目标处理算子;并将所述目标处理算子确定为相匹配的目标数据处理结构。
在一些实施例中,所述预设的数据处理算子包括以下至少之一:SQL算子、HIVE算子、SPARK算子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110551912.8/2.html,转载请声明来源钻瓜专利网。





