[发明专利]一种知识图谱创建方法有效

专利信息
申请号: 202010468680.5 申请日: 2020-05-28
公开(公告)号: CN111708894B 公开(公告)日: 2023-06-20
发明(设计)人: 王军平 申请(专利权)人: 北京赛博云睿智能科技有限公司
主分类号: G06F16/36 分类号: G06F16/36
代理公司: 北京冠和权律师事务所 11399 代理人: 陈国军
地址: 100089 北京市海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 知识 图谱 创建 方法
【权利要求书】:

1.一种知识图谱创建方法,其特征在于,包括:

基于运行于集群上的分布式文件系统,确定数据集成的数据模型,并通过所述数据模型获取所述集群的数据图表;

根据预设的分布式图处理框架将所述数据图表拆分为子图进行迭代计算,并确定数据集;

在所述数据集中配置数据访问函数和接口,构成知识开放和共享的知识图谱;

所述基于运行于集群上的分布式文件系统,确定数据集成的数据模型,并通过所述数据模型获取储存数据的数据图表,包括:

将所述分布式文件系统上的数据以分块的形式划分多个数据块;其中,

所述分布式文件系统包括命名空间,所述命名空间包括源数据和储存所述数据块的数据块池;

所述数据块为独立的存储单元;

所述集群的主节点和备节点基于所述数据块和预设数据节点的多维有序映射和时间戳索引构成数据动态集成的数据模型;

所述数据模型将储存数据以数据图表的形式进行存储;其中,

所述数据图表有行和列组成,列包括若干列族;

所述列族用于统计磁盘和内存的访问、控制和使用;

所述将所述分布式文件系统上的数据以分块的形式划分多个数据块,包括以下步骤:

步骤1:获取所述预设数据节点的存储量S和预设数据节点个数M,

其中,所述wi表示第i个预设数据节点的储存量;所述i=1,2,3,……i;所述β为预设数据节点的空间常数;

步骤2:根据所述预设数据节点的储存量S确定所述预设数据节点的权重值p:

其中,所述pi表示第i个预设数据节点的权重值;所述yi表示第i个预设数据节点的存储能力;

步骤3:根据所述预设数据节点的权重值p,计算所述数据块的划分阈值Ki

其中,所述表示分布式文件系统上预设数据节点的权重值,所述表示分布式文件系统;所述Ki表示第i个预设数据节点的划分所述数据块的阈值;所述第i个预设数据节点每处理Ki量的数据,生成一个数据块。

2.根据权利要求1所述的一种知识图谱创建方法,其特征在于,所述集群包括主节点、共享存储系统和数据节点;其中,

所述主节点包括激活主节点、备用节点和主备切换控制器;其中,

所述主备切换控制器用于控制所述激活主节点和备用节点得到切换;

所述共享存储系统用于存储所述主节点在运行过程中产生的分布式文件系统的元数据;

所述共享存储系统还用于控制所述激活主节点和备用节点的数据同步;

所述数据节点用于向所述激活主节点和备用节点上报数据的位置信息。

3.根据权利要求1所述的一种知识图谱创建方法,其特征在于,所述时间戳在所述数据动态集成写入时自动赋值,使得所述动态集成的数据具有唯一性。

4.根据权利要求1所述的一种知识图谱创建方法,其特征在于,所述分布式文件系统包括:主节点进程,数据节点进程,辅助进程;其中,

所述主节点近程用于管理所述命名空间,并记录所述储存数据分解为数据块的过程和所述数据块储存的数据节点;

所述数据节点近程用于根据需要存储和检索数据块,定期向主节点发送所存储的数据块的列表;

所述辅助进程用于与所述主节点进行通信,定期保存所述分布式文件系统元数据的快照。

5.根据权利要求1所述的一种知识图谱创建方法,其特征在于,所述根据预设的分布式图处理框架将所述数据图表拆分为子图进行迭代计算,并确定数据集,包括:

获取所述数据图表的有向多重图,并确定图形参数;其中,

所述图形参数包括顶点或边缘类型;

根据所述图形参数,通过分布式或并行的方式将所述数据图表拆分为子图,并确定所述子图的顶点;

根据所述子图的顶点,确定所述子图的相邻顶点和所述相邻顶点的属性;

对所述相邻顶点和所述相邻顶点的属性进行迭代计算,确定所述子图的物化数据集。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京赛博云睿智能科技有限公司,未经北京赛博云睿智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010468680.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top