[发明专利]一种云化系统健康检测的方法和系统在审
申请号: | 202010862472.3 | 申请日: | 2020-08-25 |
公开(公告)号: | CN112131058A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 李耀昌 | 申请(专利权)人: | 北京思特奇信息技术股份有限公司 |
主分类号: | G06F11/22 | 分类号: | G06F11/22 |
代理公司: | 北京汇信合知识产权代理有限公司 11335 | 代理人: | 林聪源 |
地址: | 100086 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 系统 健康 检测 方法 | ||
本发明公开了一种云化系统健康检测的方法和系统,涉及计算机技术领域,所述云化系统包括至少两个子系统,所述子系统包括至少一个单元,所述方法包括:通过一个子系统的每个单元分别向另一个子系统的每个单元发送检测请求;根据所述请求检测所述请求的接收单元,获取检测结果;将所述结果返回给所述请求的发送单元;根据返回的结果判断云化系统的健康状态。通过返回结果缺失或延时的情况判断发送单元、接收单元或连接线路的健康状态,从而判断云化系统的总体健康状态;通过检测每条连接线路,检测云化系统的健康;便于快速定位、快速分析云化系统的故障点。
技术领域
本发明涉及计算机技术领域,具体涉及一种云化系统健康检测的方法和系统。
背景技术
云技术(Cloud technology)是基于云计算应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称,可以组成资源池,按需所用,灵活便利。云计算技术已变成生产和商业领域的重要支撑。现有的应用和服务器系统已逐渐替换为云化系统,云化系统的特点是不依赖单个单元的稳定性,通过互备管理机制保障整个云化系统。然而,云化系统的单个单元的稳定性较非云化系统的单个应用或服务器的稳定性差,单个单元的管理难度大且实时运营情况不易管控,整个云化系统在随机性调度中,不容易发现部分坏的单元。
目前,单元通常通过单元是否能正常连接来衡量单元的健康状态,然而在实际应用中,单元虽然能正常连接,却可能无法正常受理业务。
发明内容
针对现有技术存在的上述技术问题,本发明提供一种云化系统健康检测的方法和系统,以检测系统单元的健康,从而确定云化系统的健康状态。
本发明公开了一种云化系统健康检测的方法,所述云化系统包括至少两个子系统,所述子系统包括至少一个单元,所述方法包括:通过一个子系统的每个单元分别向另一个子系统的每个单元发送检测请求;根据所述请求检测所述请求的接收单元,获取检测结果;将所述结果返回给所述请求的发送单元;根据返回的结果判断云化系统的健康状态。
优选的,所述检测请求包括检测任务,根据所述请求检测接收单元的方法包括:
所述接收单元执行所述检测任务,并向所述发送单元返回执行结果;
根据所述发送单元是否接收到执行结果或接收执行结果的时间判断接收单元的健康状态。
优选的,所述检测任务包括以下任务之一或它们的组合:存储数据、读取数据、数据计算或执行操作。
优选的,所述执行操作包括获取所述接收单元的负载情况。
优选的,所述单元包括节点和/或实例。
优选的,所述发送单元根据接收单元的地址和端口发送检测请求。
优选的,本发明的方法还包括异常告警的方法:
获取没有接收到或超时接收到返回结果的异常接收单元;
根据所述异常接收单元及其返回结果的情况向管理员发送告警信息。
优选的,所述云化系统包括第一系统、第二系统和第三系统,所述第一系统与第二系统连接,所述第二系统和第三系统连接,所述云化系统健康检测方法包括:
所述第一系统的单元向第二系统的每个单元发送第一检测请求;
所述第二系统的接收单元响应所述第一检测请求,获取第一检测结果;
向第一系统的发送单元返回第一检测结果;
所述第二系统的单元向第三系统的每个单元发送第二检测请求;
所述第三系统的接收单元响应所述第二检测请求,获取第二检测结果;
向所述第二系统的发送单元返回第二检测结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京思特奇信息技术股份有限公司,未经北京思特奇信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010862472.3/2.html,转载请声明来源钻瓜专利网。