[发明专利]时序数据库集群及其故障处理、操作方法、及装置在审
申请号: | 202110943049.0 | 申请日: | 2021-08-17 |
公开(公告)号: | CN113778761A | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 杨冠飞 | 申请(专利权)人: | 北京金山云网络技术有限公司 |
主分类号: | G06F11/20 | 分类号: | G06F11/20 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 卢万腾;梁尚武 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 时序 数据库 集群 及其 故障 处理 操作方法 装置 | ||
本申请涉及一种时序数据库集群及其故障处理方法、操作方法、及装置,时序数据库集群包括:至少一个元数据节点、多个数据节点;多个数据节点互为副本;元数据节点用于存储元数据,元数据至少包括数据节点的主机名;方法包括:当检测到任一数据节点发生故障时,新建虚拟节点;将发生故障的数据节点的配置文件拷贝至虚拟节点,并将发生故障的数据节点的数据盘挂载至虚拟节点;在时序数据库集群的主机名映射文件中,将目标映射关系中的IP地址更新为虚拟节点的IP地址,使得虚拟节点替代发生故障的数据节点提供数据服务。由此可以实现当时序数据库集群中任一数据节点发生故障,进行故障转移,且无需修改元数据,使得时序数据库集群高可用。
技术领域
本申请涉及时序数据库领域,尤其涉及一种时序数据库集群及其故障处理方法、操作方法、及装置。
背景技术
时序数据指时间序列数据(Time Series Data,简称时序数据),是将同一指标的数据按时间顺序记录的数据列,普遍存在于IT基础设施、运维监控系统和物联网中。相应的,时序数据库是一种特定类型的数据库,主要用来存储时序数据。
在实践中,实现一个时序数据库集群方案是一项非常复杂的工作,至少需要实现高可用的目标,也即,当集群中的数据节点发生故障时,集群具备自愈能力。
发明内容
本申请提供了一种时序数据库集群及其故障处理方法、操作方法、及装置,以提高时序数据库集群的可靠性、稳定性。
第一方面,本申请提供了一种时序数据库集群的故障处理方法,所述时序数据库集群包括:至少一个元数据节点、多个数据节点;所述数据节点用于存储时序数据,且多个所述数据节点互为副本;所述元数据节点用于存储所述时序数据库集群的元数据,所述元数据至少包括每一个所述数据节点的主机名;所述方法包括:
当检测到任一所述数据节点发生故障时,新建虚拟节点;
将发生故障的所述数据节点的配置文件拷贝至所述虚拟节点,并将发生故障的所述数据节点的数据盘挂载至所述虚拟节点;
在所述时序数据库集群的主机名映射文件中,将目标映射关系中的IP地址更新为所述虚拟节点的IP地址,所述目标映射关系指发生故障的所述数据节点对应的映射关系;
重启所述时序数据库集群,以使所述虚拟节点替代发生故障的所述数据节点提供数据服务。
在一可能的实现方式中,所述时序数据库集群还包括探活组件,所述探活组件用于周期性地向各所述数据节点发送探活报文;
所述检测到任一所述数据节点发生故障,包括:
针对每一所述数据节点,若在当前的超时时间内,未接收到所述数据节点基于所述探活报文返回的应答报文,则确定所述数据节点故障,所述当前的超时时间指:以所述探活组件最近一次发送所述探活报文的时间为起始时刻,以设定时长为时长的时间段;或者,
针对每一所述数据节点,若在设定周期到达时,未接收到所述数据节点发送的心跳报文,则确定所述数据节点故障。
第二方面,本申请提供了一种时序数据库集群的操作方法,应用于第一方面任一项所述的时序数据库集群,所述方法包括:
当接收到数据操作请求时,从所述时序数据库集群中确定待操作的目标数据节点;
从所述元数据中获取所述目标数据节点的主机名;
从所述主机名映射文件中确定与获取到的所述主机名对应的目标IP地址;
基于所述目标IP地址,在所述目标数据节点上对待操作的目标时序数据执行与所述数据操作请求对应的数据操作。
在一可能的实现方式中,所述从所述时序数据库集群中确定待操作的目标数据节点,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山云网络技术有限公司,未经北京金山云网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110943049.0/2.html,转载请声明来源钻瓜专利网。