[发明专利]分布式系统服务异常的处理方法及装置在审
申请号: | 201810837175.6 | 申请日: | 2018-07-26 |
公开(公告)号: | CN110764940A | 公开(公告)日: | 2020-02-07 |
发明(设计)人: | 刘志杰 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07;G06F11/14 |
代理公司: | 11283 北京润平知识产权代理有限公司 | 代理人: | 陈潇潇;肖冰滨 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分布式系统 服务 重启 服务执行 异常状态 主动发现 状态恢复 自动纠正 集群 恢复 | ||
本发明实施例提供一种分布式系统服务异常的处理方法及装置,属于分布式系统领域。所述方法包括:获取所述分布式系统服务的状态;如果所述分布式系统服务的状态为异常状态,则对所述分布式系统服务执行重启操作;以及在对所述分布式系统服务执行所述重启操作之后,如果所述分布式系统服务没有恢复到正常状态,则对所述分布式系统服务所属的集群执行重启操作,以使所述分布式系统服务的状态恢复到正常状态。其能够实现主动发现分布式系统服务的异常状态并进行自动纠正,从而确保分布式系统服务的正常使用。
技术领域
本发明涉及分布式系统领域,具体地,涉及分布式系统服务异常的处理方法及装置。
背景技术
在使用分布式系统时,需要确保分布式系统正常运行。例如,在将分布式系统映射到本地时,需要确保能够在本地文件系统正常的进行读取、写入等操作,这就要保证分布式系统服务的正常运行。如果分布式系统服务异常,则会造成映射到本地的目录无法正常访问,同时也会影响部分操作系统命令的正常执行,如执行df命令长时间无响应、对映射到本地的目录执行ls命令长时间无响应等。
发明内容
本发明实施例的目的是提供一种分布式系统服务异常的处理方法及装置,用于解决或至少部分解决上述技术问题。
为了实现上述目的,本发明实施例提供一种分布式系统服务异常的处理方法,所述方法包括:获取所述分布式系统服务的状态;如果所述分布式系统服务的状态为异常状态,则对所述分布式系统服务执行重启操作;以及在对所述分布式系统服务执行所述重启操作之后,如果所述分布式系统服务没有恢复到正常状态,则对所述分布式系统服务所属的集群执行重启操作,以使所述分布式系统服务的状态恢复到正常状态。
可选地,在对所述分布式服务所属的集群执行重启操作之后,所述方法还包括:验证所述集群的集群服务是否处于正常状态;以及如果所述集群服务处于正常状态,则发送集群恢复正常通知;否则,发送集群故障通知。
可选地,所述对所述分布式系统服务执行重启操作包括:向所述分布式系统服务发送重启命令,以触发所述分布式系统服务执行重启操作;获取所述分布式系统服务的状态;如果所述分布式系统服务的状态没有恢复到所述正常状态,则判断对所述分布式系统服务执行重启的次数是否达到预定次数;以及如果对所述分布式系统服务执行重启的次数未达到所述预定次数,则返回继续执行所述向所述分布式系统服务发送重启命令的步骤,直至所述分布式系统服务执行重启的次数达到所述预定次数,或者,所述分布式系统服务的状态恢复到所述正常状态。
可选地,所述方法还包括:在每次向所述分布式系统服务发送所述重启命令之后,判断所述重启命令是否成功执行,以及如果所述重启命令未成功执行,则发送所述重启命令执行失败通知;和/或,从所述重启命令成功执行的时刻开始计时,以及当计时时间达到预定时间时,转入执行获取所述分布式系统服务的状态的步骤。
可选地,所述分布式系统为HDFS,在获取所述分布式系统服务的状态之前,所述方法还包括:建立所述HDFS的文件系统到本地文件系统的映射,以便在所述本地文件系统中查看所述HDFS的文件系统中的数据;和/或当所述分布式系统服务的状态为异常状态时,确定所述本地文件系统中的HDFS的文件系统中的数据不可访问。
相应地,本发明实施例还提供一种分布式系统服务异常的处理装置,所述装置包括:获取模块,用于获取所述分布式系统服务的状态;第一重启模块,用于如果所述分布式系统服务的状态为异常状态,则对所述分布式系统服务执行重启操作;以及第二重启模块,用于在对所述分布式系统服务执行重启操作之后,如果所述分布式系统服务没有恢复到正常状态,则对所述分布式系统服务所属的集群执行重启操作,以使所述分布式系统服务的状态恢复到正常状态。
可选地,所述装置还包括验证模块和发送模块,在对所述分布式服务所属的集群执行重启操作之后,所述验证模块用于验证所述集群的集群服务是否处于正常状态;以及所述发送模块用于如果所述集群服务处于正常状态,则发送集群恢复正常通知;否则,发送集群故障通知。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810837175.6/2.html,转载请声明来源钻瓜专利网。