[发明专利]一种基于IPMI的冗余计算机系统节点故障主被动检测方法有效
| 申请号: | 201310634139.7 | 申请日: | 2013-12-01 |
| 公开(公告)号: | CN103617104B | 公开(公告)日: | 2017-01-04 |
| 发明(设计)人: | 徐振朋;翟永宁;殷进勇;杨光年;李韦韦;吴茂传;苏培培;楼智翔;董奇;史小犇 | 申请(专利权)人: | 中国船舶重工集团公司第七一六研究所 |
| 主分类号: | G06F11/22 | 分类号: | G06F11/22;G06F11/07 |
| 代理公司: | 南京理工大学专利中心32203 | 代理人: | 马鲁晋 |
| 地址: | 222006 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 ipmi 冗余 计算机系统 节点 故障 被动 检测 方法 | ||
技术领域
本发明属于多台计算机冗余系统中的故障主被动检测方法,特别是一种基于IPMI的冗余计算机系统节点故障主被动检测方法。
背景技术
计算机技术的迅猛发展使得计算机系统被广泛应用于国民经济的各行各业,人类社会对计算机信息系统的依赖程度越来越高,各领域对计算机信息系统的可靠性和稳定性要求也变得越来越高。不仅航空、航天、舰船这样的高技术和军事领域要求高可靠的计算机,而且银行、证券、交通、石油、化工、钢铁等金融和工业部门也要求具有高可靠的计算机。
多台计算机冗余备份是一种有效解决系统可靠性的方案,该技术成本相对较低,具有安装维护简单、稳定可靠、监测直观等优点,在关键业务系统中获得了广泛的应用。多台计算机冗余容错系统中,一个模块为主用计算机,用以产生系统的输出,其余计算机作为备用。采用各种故障检测技术及故障定位技术来确定发生故障的计算机,若主用计算机发生故障,则启动重构机制,将一个正常的备用计算机转化为主用计算机,从而保障系统服务的正常。
故障检测是实现多台计算机冗余系统容错不可或缺的基础组件之一,面向关键服务器的计算机故障检测技术目前在故障检测延迟和故障检测准确性方面仍需要很大改进,难以满足关键服务系统的可靠性需求,尤其是航空、航天、舰船这样的高技术和军事领域。虽然越来越多的企业开始在其生产的设备中支持智能平台管理接口(Intelligent Platform Management Interface,IPMI)标准,以监控系统中和底层硬件相关的设备组件及有关参数(如电压、温度、风扇),但是目前尚未出现利用IPMI监控信息数据在多台计算机冗余系统中实现待测计算机故障主被动检测的技术方法。
发明目的
本发明的目的在于提供了一种为冗余计算机系统运行期间故障主被动检测的方法。
实现本发明目的的技术解决方案为:一种基于IPMI的冗余计算机系统节点故障主被动检测方法,包括以下步骤:
步骤1、在所有待测计算机上部署并启用IPMI功能模块,并通过标准RJ45接口或串行接口与故障检测模块相连接;所有待测计算机构成冗余备份系统;所述故障检测模块是采用FPGA实现的逻辑功能模块。
步骤2、通过IPMI协议周期性地收集上述冗余系统中主备计算机节点的运行状态信息序列p,所述状态信息包括CPU、风扇、内存和部件状态数据;
步骤3、对步骤2采集到的状态信息序列p进行分析,通过模式匹配方法分别对主备计算机节点的运行状态进行故障判定,即故障被动检测;具体为:
步骤3-1、对于系统预置样本库Q中的某个样本序列q和采集到的待测计算机状态序列p,q∈Q,对序列p和q进行平均线性分段,得到N个子序列,N为自然数;对于各子序列中相邻两点确定的线段,确定各线段对应的斜率值和斜率反正切值;
步骤3-2、拟合各子序列中斜率反正切值相近的连续线段,得到其拟合变换后的斜率反正切值序列Hp[1...trp,1...N]和Hq[1...trq,1...N],其中trp为序列p第r个子序列的线段数目;对于某一个子序列r,r∈[1,N],其对应线段拟合变换的具体步骤为:
(a)将n初始为1,即n=1;
(b)确定子序列r中第n条线段与第n+1条线段的斜率反正切值之差h=H[n,r]-H[n+l,r],以判定两条线段间的斜率反正切值的相似程度,其中H[n,r]表示子序列r中第n条线段的斜率反正切值,H[n,r]∈Hp[1...tx,1...N]或H[n,r]∈Hq[1...tx,1...N];
(c)对斜率反正切值之差h进行判断,若|h|>=ε,则n=n+1,转到步骤(b),直到完成遍历子序列r中所有的线段;若|h|<ε,利用一元线性回归函数,确定出序列r中第n条线段和第n+1条线段对应拟合线段的斜率值R,之后执行步骤(d);ε为判定阈值;
(d)更新拟合变换后的斜率反正切值序列,以arctan(R)取代子序列r中第n条线段的斜率反正切值H[n,r],即H[n,r]=arctan(R),并将子序列r中第n+1条线段对应横坐标跨度并入第n条线段的横坐标跨度;
(e)删除子序列r中第n+1条线段,转到步骤(b),直到完成遍历子序列r中所有的线段;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国船舶重工集团公司第七一六研究所,未经中国船舶重工集团公司第七一六研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310634139.7/2.html,转载请声明来源钻瓜专利网。





