[发明专利]一种服务器故障确定方法、装置、设备及可读存储介质在审
申请号: | 202111637868.9 | 申请日: | 2021-12-29 |
公开(公告)号: | CN114490245A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 陆明;王友焱 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30;G06F30/20;G06F111/04 |
代理公司: | 北京乐知新创知识产权代理事务所(普通合伙) 11734 | 代理人: | 王曌寅 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 服务器 故障 确定 方法 装置 设备 可读 存储 介质 | ||
1.一种服务器故障确定方法,包括:
获取待巡检服务器的巡检周期及集群中各服务器的参数;
建立有约束条件的优化模型,约束条件包括所述待巡检服务器的负载的迁移约束条件和所述待巡检服务器的巡检约束条件,以使得集群负载波动最小,和/或所述待巡检服务器巡检整体耗时更短;
根据所述待巡检服务器的巡检周期、集群中各服务器的参数及所述优化模型确定所述待巡检服务器的巡检参数,所述巡检参数包括所述待巡检服务器的巡检顺序及所述待巡检服务器上的负载的迁移顺序和迁移所进入的服务器;
按照所述巡检参数对所述待巡检服务器进行故障检测。
2.根据权利要求1所述的服务器故障确定方法,获取待巡检服务器的巡检周期,包括:
获取待巡检服务器的巡检批次;
根据所述巡检批次在批次与巡检周期的映射表中查找到所述待巡检服务器的巡检周期。
3.根据权利要求2所述的服务器故障确定方法,所述巡检批次的划分步骤包括:
获取集群中各服务器的应用数据、设备数据及监控数据;
根据所述应用数据、设备数据及监控数据对所述服务器进行分批,得到多个巡检批次。
4.根据权利要求1所述的服务器故障确定方法,集群中各服务器的参数至少包括:应用数据、设备数据及监控数据;
所述根据所述待巡检服务器的巡检周期、集群中各服务器的参数及所述优化模型确定所述待巡检服务器的巡检参数,包括:
根据所述待巡检服务器的巡检周期、所述应用数据、所述设备数据、所述监控数据对所述优化模型进行求解,得到所述待巡检服务器的巡检参数。
5.根据权利要求2所述的服务器故障确定方法,还包括:
获取预设时长内待巡检服务器故障检测时产生的异常的种类、异常的发生频率;
根据所述异常的种类和异常的发生频率对所述待巡检服务器的巡检周期进行更新。
6.根据权利要求1所述的服务器故障确定方法,还包括:
标记所述巡检周期内无法完成巡检的目标服务器;
设置所述目标服务器为下一个巡检周期内优先巡检的服务器。
7.根据权利要求6所述的服务器故障确定方法,还包括:
记录待巡检服务器故障检测过程中的执行条件;
根据所述执行条件对所述待巡检服务器的巡检约束条件进行更新。
8.一种服务器故障确定装置,包括:
第一获取单元,用于获取待巡检服务器的巡检周期及集群中各服务器的参数;
建立单元,用于建立有约束条件的优化模型,约束条件包括所述待巡检服务器的负载的迁移约束条件和所述待巡检服务器的巡检约束条件,以使得集群负载波动最小,和/或所述待巡检服务器巡检整体耗时更短;
确定单元,用于根据所述待巡检服务器的巡检周期、集群中各服务器的参数及所述优化模型确定所述待巡检服务器的巡检参数,所述巡检参数包括所述待巡检服务器的巡检顺序及所述待巡检服务器上的负载的迁移顺序和迁移所进入的服务器;
检测单元,用于按照所述巡检参数对所述待巡检服务器进行故障检测。
9.一种电子设备,包括:
至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行如权利要求1-7任意一项所述的服务器故障确定方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使计算机执行如权利要求1-7任意一项所述的服务器故障确定方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111637868.9/1.html,转载请声明来源钻瓜专利网。