[发明专利]服务器挂起监测和自动重启方法以及应用其的服务器有效
申请号: | 202111091666.9 | 申请日: | 2021-09-17 |
公开(公告)号: | CN113867815B | 公开(公告)日: | 2023-08-11 |
发明(设计)人: | 孙伟涛;石小明;张贝利;吴奕刚 | 申请(专利权)人: | 杭州当虹科技股份有限公司 |
主分类号: | G06F9/4401 | 分类号: | G06F9/4401;G06F11/30 |
代理公司: | 浙江英普律师事务所 33238 | 代理人: | 刘芬豪 |
地址: | 310000 浙江省杭州市西*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 服务器 挂起 监测 自动 方法 以及 应用 | ||
1.一种服务器挂起监测和自动重启方法,其特征在于,包括以下步骤:
服务器启动后开启失联监测线程检测系统是否挂起,按顺序进行打开文件、关闭文件、更新全局状态变量为当前时间、休眠第一时间的循环操作;
设置心跳包发送线程,心跳包在发送间隔监测全局状态变量,查看全局状态变量和当前系统时间是否偏差超过给定的阈值;如果没有超过,则向集群管理器发送正常心跳包;如果超过,则在心跳包内附加系统挂起信息,同时通过智能平台管理接口重启服务器;
通过智能平台管理接口重启服务器进一步包括:服务器具有基板管理控制器BMC和linux操作系统,linux操作系统载驱动,生成一个/dev/ipmi0的服务器文件,使用该服务器文件和BMC通讯,通讯协议为IPMI相关协议;服务器启动时先打开/dev/ipmi0的服务器文件。
2.如权利要求1所述的服务器挂起监测和自动重启方法,其特征在于,集群控制器在收到心跳包后解析失联监测结果,如果确定系统已经挂起,则记录到系统日志中。
3.一种服务器,其特征在于,包括:
失联监测线程单元,用于在服务器启动后开启,检测系统是否挂起,按顺序进行打开文件、关闭文件、更新全局状态变量为当前时间、休眠第一时间的循环操作;
心跳包发送线程单元,用于向集群管理器发送心跳包,心跳包在发送间隔监测全局状态变量,查看全局状态变量和当前系统时间是否偏差超过给定的阈值;如果没有超过,则向集群管理器发送正常心跳包;如果超过,则在心跳包内附加系统挂起信息;
重启单元,用于在检测到服务器挂起后通过智能平台管理接口重启服务器;
通过智能平台管理接口重启服务器进一步包括:服务器具有基板管理控制器BMC和linux操作系统,linux操作系统载驱动,生成一个/dev/ipmi0的服务器文件,使用该服务器文件和BMC通讯,通讯协议为IPMI相关协议;服务器启动时先打开/dev/ipmi0的服务器文件。
4.如权利要求3所述的服务器,其特征在于,集群控制器在收到心跳包后解析失联监测结果,如果确定系统已经挂起,则记录到系统日志中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州当虹科技股份有限公司,未经杭州当虹科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111091666.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种排水管性能试验检测装置及使用方法
- 下一篇:显示面板及移动终端