[发明专利]知识数据存储方法、装置、计算机设备和存储介质有效
申请号: | 201910025164.2 | 申请日: | 2019-01-11 |
公开(公告)号: | CN109885692B | 公开(公告)日: | 2023-06-16 |
发明(设计)人: | 孙佳兴;胡逸凡;陈泽晖;黄鸿顺 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 谢文强 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 数据 存储 方法 装置 计算机 设备 介质 | ||
本申请涉及知识图谱技术领域,尤其涉及一种知识数据存储方法、装置、计算机设备和存储介质,包括:抽取知识数据来源的知识数据;抽取所述知识数据中的实体信息,将所述实体信息进行向量化转化,生成实体数据向量,抽取所述知识数据中的关系信息,将所述关系信息进行向量化转换,生成关系数据向量;获取所述实体数据向量的实体ID标识和所述关系数据向量的关系ID标识,聚类形成知识数据子集;计算任意两个所述知识数据子集的信息相似度,设立知识图谱的节点;获取所述知识图谱的节点的特征信息,根据特征信息与数据库存储位置的对应关系,将知识数据存储到数据库中。本申请有效解决了知识数据存储时间长和查询速度慢的问题。
技术领域
本申请涉及知识图谱技术领域,尤其涉及一种知识数据存储方法、装置、计算机设备和存储介质。
背景技术
知识图谱又称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。
在将知识图谱中的知识数据存储到数据库中时,存在着由于知识图谱关联的数据量大,导致存储时间长。并且在对知识图谱中的知识数据进行查询时,无法快速查询到所需的知识数据。
发明内容
有鉴于此,有必要针对现有知识数据存储时间长查询速度慢的问题,提供一种知识数据存储方法、装置、计算机设备和存储介质。
一种知识数据存储方法,包括如下步骤:
发送知识数据抽取指令至待抽取知识数据的知识数据来源,接收所述知识数据来源的反馈信息,根据所述反馈信息中所包含的知识数据形式抽取所述知识数据来源的知识数据;
抽取所述知识数据中的实体信息,将所述实体信息进行向量化转化,生成实体数据向量,抽取所述知识数据中的关系信息,将所述关系信息进行向量化转换,生成关系数据向量;
获取所述实体数据向量的实体ID标识和所述关系数据向量的关系ID标识,将具有同一实体ID标识的知识数据进行聚类后形成知识数据集,聚类所述知识数据集中具有同一关系ID标识的知识数据后形成知识数据子集;
计算任意两个所述知识数据子集的信息相似度,在信息相似度大于预设的相似度阈值的所述知识数据子集之间设立知识图谱的节点;
获取所述知识图谱的节点的特征信息,根据所述特征信息与数据库存储位置的对应关系,将所述知识数据存储到数据库中。
在其中一个可能的实施例中,所述发送知识数据抽取指令至待抽取知识数据的知识数据来源,接收所述知识数据来源的反馈信息,根据所述反馈信息中所包含的知识数据形式抽取所述知识数据来源的知识数据,包括:
获取所述待抽取知识数据的知识数据来源的网络地址,将所述网络地址与预设的网络地址列表中的内容进行比对,若所述网络地址在所述网络地址列表中则发送知识数据抽取指令,否则不发送;
接收所述知识数据来源的反馈信息,从所述反馈信息中抽取出数据来源形式的形式关键词,根据所述形式关键词确定所述知识数据来源的形式;
获取所述知识数据来源的形式对应的抽取方法,根据所述抽取方法抽取所述知识数据来源的知识数据。
在其中一个可能的实施例中,所述抽取所述知识数据中的实体信息,将所述实体信息进行向量化转化,生成实体数据向量,抽取所述知识数据中的关系信息,将所述关系信息进行向量化转换,生成关系数据向量,包括:
根据已有知识图谱中的实体数据的数量获取所述实体信息对应的向量维度,根据已有知识图谱中的关系数据的数量获取所述关系信息对应的向量维度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910025164.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置