[发明专利]访问分布式集群外部数据方法及装置在审

专利信息
申请号: 201910120843.8 申请日: 2019-02-18
公开(公告)号: CN109902065A 公开(公告)日: 2019-06-18
发明(设计)人: 刘欣然;张鸿;惠榛;吕雁飞;马秉楠;冷健全;王鸿翔;高峰;李恒 申请(专利权)人: 国家计算机网络与信息安全管理中心
主分类号: G06F16/14 分类号: G06F16/14;G06F16/182
代理公司: 工业和信息化部电子专利中心 11010 代理人: 李勤媛
地址: 100029*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 外部数据 文件服务 数据库集群系统 分布式集群 访问 服务进程 进程设置 设置文件 数据节点 预先创建 算子 主机 进程 外部
【说明书】:

发明公开了一种访问分布式集群外部数据方法及装置,所述方法包括:将文件服务进程设置在数据库集群系统以外的主机上,并设置文件服务进程的参数,启动所述文件服务进程;在数据库集群系统的数据节点需要访问外部数据时,启动ExternalTableScan算子,连接所述文件服务进程,基于预先创建的外部表进行外部数据访问。

技术领域

本发明涉及计算机领域,尤其涉及一种访问分布式集群外部数据方法及装置。

背景技术

分布式数据库KingbaseAnalyticsDB通过将数据和处理工作分配到多个服务器或主机的方式,存储和处理大量的数据。分布式集群基于多个单机数据库,它们协同工作,呈现给用户一个数据库的效果。图1描述了构成KingbaseAnalyticsDB数据库系统的组件,Master节点是KingbaseAnalyticsDB数据库系统的入口点。它是客户端连接和提交SQL语句的数据库实例节点。Master能够协调自己和系统中其它数据库实例节点的工作,这些数据库实例称为数据节点(Segment节点),用于存储和处理实际数据。KingbaseAnalyticsDB数据库Segment实例节点是独立的数据库,每个Segment节点都会存储一部分的数据并且执行大多数的查询处理。当一个用户连接到数据库,并且通过Master节点发起了一个查询,Segment节点会创建一些进程来处理这个查询工作。用户定义的表和相应的索引都分布在数据库系统中的各个可用的Segment节点上,每个Segment存储着一部分不同的数据。用户在KingbaseAnalyticsDB数据库系统中通过Master节点与这些Segment节点交互。

数据导入工具是数据库通用工具,先将外部的数据导入到数据库里,然后再使用SQL进行运算。

这种方案是访问外部数据的传统方法,在集群里也可以使用。但有其现实的缺点:

1.数据入库后,占用存储资源。外部数据入库后,对于用户对存储敏感的情况下,就不会是一个好的选择。如果数据量大,用户的实际存储会不够用。并且,分析结束后,还需要对这部分数据进行删除操作。无形中,就会影响了当前系统中运行的业务。

2.易用性较差。在用户分析过程中,需要先对数据进行导入,之后才能执行分析过程。无法在分析过程中直接使用外部数据,无需额外的步骤进行数据导入。

也就是说,分布式集群可对大量数据进行处理和存储。为了访问外部存储的数据,需要先把外部数据导入到数据库集群中,然后才可以进行下一步的SQL运算。增加了存储负载的同时,访问外部数据效率也更低。这就要求集群具有直接访问外部数据的能力。

发明内容

本发明实施例提供一种访问分布式集群外部数据方法及装置,用以解决现有技术中的问题。

本发明实施例提供一种访问分布式集群外部数据方法,包括:

将文件服务进程设置在数据库集群系统以外的主机上,并设置文件服务进程的参数,启动所述文件服务进程;

在数据库集群系统的数据节点需要访问外部数据时,启动ExternalTableScan算子,连接所述文件服务进程,基于预先创建的外部表进行外部数据访问。

优选地,基于预先创建的外部表进行外部数据访问具体包括:

通过file协议读取预先创建的file协议外部表,进行外部数据访问;或者,

通过kafdist协议读取预先创建的kafdist协议外部表,进行外部数据访问。

优选地,通过file协议读取预先创建的file协议外部表,进行外部数据访问具体包括:

根据file协议外部表定义获取外部文件列表,其中,外部文件列表中的外部数据未CSV格式,每个字段之间按照“|”分割;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心,未经国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910120843.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top