[发明专利]一种故障自愈方法及系统有效
申请号: | 201410118947.2 | 申请日: | 2014-03-27 |
公开(公告)号: | CN104954157B | 公开(公告)日: | 2018-12-04 |
发明(设计)人: | 钱堃 | 申请(专利权)人: | 中国移动通信集团湖北有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 张振伟;王黎延 |
地址: | 430040 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 故障 自愈 方法 系统 | ||
本发明公开了一种故障自愈方法,包括:确定第一服务器未能正常运行时,获取所述第一服务器当前的业务数据信息及业务配置信息;查找当前能调用的第二服务器,并将所述业务数据信息及业务配置信息发送至所述第二服务器,使所述第二服务器利用所述业务配置信息进行业务配置,并根据所述业务数据信息执行所述第一服务器未能正常运行时的当前业务;其中,所述第一服务器为处于集群中的子集群中的任意一个服务器,所述第二服务器为与所述第一服务器处于同一子集群中的不同的服务器。本发明还公开了一种故障自愈系统。
技术领域
本发明涉及自动化技术,尤其涉及一种故障自愈方法及系统。
背景技术
目前的互联网业务平台中,针对业务通信系统运营情况的监控预警系统通常采用以下方式进行:
监控预警系统获取业务通信系统中的监控数据,比如延迟、请求率以及错误率等统计数据,然后工作人员查看所述统计数据,根据所述统计数据确定故障所在,并通知技术人员进行检修。另外,现有技术中,能够通过单个备用接入点隔离故障的方式将业务通信系统中存在故障的设备进行隔离,同时在所述备用接入点接入替换设备以保障业务通信系统正常运行,实现故障自愈。
现有方法中,监控预警系统的监控方未实现自动化,浪费人力资源,且不能实现业务通信系统的故障自愈,不能有效保障业务通信系统的正常运行;另外,当监控预警系统本身存在故障时,单个备用接入点隔离故障的方法便无法实现业务通信系统的自愈功能。
发明内容
为解决现有存在的技术问题,本发明实施例提供一种故障自愈方法及系统,能通过自动切换功能使互联网中的业务通信系统自动修复,维持业务通信系统的正常运行。
本发明的技术方案是这样实现的:本发明提供了一种故障自愈方法,包括:
确定第一服务器未能正常运行时,获取所述第一服务器当前的业务数据信息及业务配置信息;
查找当前能调用的第二服务器,并将所述业务数据信息及业务配置信息发送至所述第二服务器,使所述第二服务器利用所述业务配置信息进行业务配置,并根据所述业务数据信息执行所述第一服务器未能正常运行时的当前业务;
其中,所述第一服务器为处于集群中的子集群中的任意一个服务器,所述第二服务器为与所述第一服务器处于同一子集群中的不同的服务器。
进一步地,所述集群至少包括两个以上的子集群,且所述子集群包括至少两个以上的服务器。
进一步地,所述方法还包括:
为集群中的每个子集群分配标识,将子集群的标识分别作为子集群中的各服务器的外部标识;
为每个子集群中各服务器分配互不相同的内部标识;
对应地,所述查找当前能调用的第二服务器,包括:
确定未能正常运行的所述第一服务器的外部标识和内部标识,根据所述外部标识查找与所述外部标识相同的、并根据所述内部标识查找与所述第一服务器的内部标识不相同的、且当前能调用的第二服务器。
进一步地,所述确定第一服务器未能正常运行之后,所述方法还包括:
标记并记录所述第一服务器对应的内部标识,根据所述内部标识将与所述内部标识对应的服务器标记为预处理服务器。
进一步地,所述方法还包括:
根据内部标识累计每个子集群中预处理服务器的数量,并根据所述预处理服务器的数量确定每个子集群的预警状态。
本发明还提供了一种故障自愈系统,包括:
获取单元,用于确定第一服务器未能正常运行时,获取所述第一服务器当前的业务数据信息及业务配置信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团湖北有限公司,未经中国移动通信集团湖北有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410118947.2/2.html,转载请声明来源钻瓜专利网。