[发明专利]一种知识图谱创建方法有效
| 申请号: | 202010468680.5 | 申请日: | 2020-05-28 |
| 公开(公告)号: | CN111708894B | 公开(公告)日: | 2023-06-20 |
| 发明(设计)人: | 王军平 | 申请(专利权)人: | 北京赛博云睿智能科技有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36 |
| 代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 陈国军 |
| 地址: | 100089 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 知识 图谱 创建 方法 | ||
本发明提供了一种知识图谱创建方法。基于运行于集群上的分布式文件系统,确定数据集成的数据模型,并通过所述数据模型获取所述集群的数据图表;根据预设的分布式图处理框架将所述数据图表拆分为子图进行迭代计算,并确定数据集;在所述数据集中配置数据访问函数和接口,构成知识开放和共享的知识图谱。本发明的有益效果在于:本发明能够支持结构化和非结构化海量数据存储、集成和访问;支持常见异构数据类型。
技术领域
本发明涉及知识图谱技术领域,特别涉及一种知识图谱创建方法。
背景技术
目前,现有技术中,知识图谱广泛应用于可视化知识领域映射中。在知识图谱的创建方法中,多数知识图谱的创建是基于场景的知识图谱创建,例如:医院场景、学校场景、商场场景等场景的知识图谱,这类知识图谱范围较小。而较为广泛和全面领域的知识图谱创建过程中存在数据存储不足,数据多数为同构数据,对于异构数据的知识图谱创建方面和可扩展性反面较差,还不具有自动备份和自动回复方面的功能。
发明内容
本发明提供一种知识图谱创建方法,用以解决现有技术中知识图谱的不足。
一种知识图谱创建方法,其特征在于,包括:
基于运行于集群上的分布式文件系统,确定数据集成的数据模型,并通过所述数据模型获取所述集群的数据图表;
根据预设的分布式图处理框架将所述数据图表拆分为子图进行迭代计算,并确定数据集;
在所述数据集中配置数据访问函数和接口,构成知识开放和共享的知识图谱。
作为本发明的一种实施例,所述集群包括主节点、共享存储系统和数据节点;其中,
所述主节点包括激活主节点、备用节点和主备切换控制器;其中,
所述主备切换控制器用于控制所述激活主节点和备用节点得到切换;
所述共享存储系统用于存储所述主节点在运行过程中产生的分布式文件系统的元数据;
所述共享存储系统还用于控制所述激活主节点和备用节点的数据同步;
所述数据节点用于向所述激活主节点和备用节点上报数据块的位置信息。
作为本发明的一种实施例,所述基于运行于集群上的分布式文件系统,确定数据集成的数据模型,并通过所述数据模型获取储存数据的数据图表,包括:
将所述分布式文件系统上的数据以分块的形式划分多个数据块;其中,
所述分布式文件系统包括命名空间,所述命名空间包括源数据和储存所述数据块的数据块池;
所述数据块为独立的存储单元;
所述集群的主节点和备节点基于数据块和预设数据节点的多维有序映射和时间戳索引构成数据动态集成的数据模型;
所述数据模型将储存数据以数据图表的形式进行存储;其中,
所述数据图表有行和列组成,所述列包括若干列族;所述列族用于统计磁盘和内存的访问、控制和使用;。
作为本发明的一种实施例,所述将所述分布式文件系统上的数据以分块的形式划分多个数据块,包括以下步骤:
步骤1:获取所述预设数据节点的存储量S和预设数据节点个数M,
其中,所述wi表示第i个预设数据节点的储存量;所述i=1,2,3,……i;所述β为预设数据节点的空间常数;
步骤2:根据所述预设数据节点的储存量S确定所述预设数据节点的权重值p:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京赛博云睿智能科技有限公司,未经北京赛博云睿智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010468680.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种站立辅助系统
- 下一篇:电推进旋翼飞行器动力系统及其控制方法





