[发明专利]一种多节点服务器系统的故障现场信息的收集方法及装置在审
申请号: | 201310252895.3 | 申请日: | 2013-06-24 |
公开(公告)号: | CN103368771A | 公开(公告)日: | 2013-10-23 |
发明(设计)人: | 雷舒莹;吴登奔;廖义祥 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24 |
代理公司: | 广州三环专利代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 节点 服务器 系统 故障 现场 信息 收集 方法 装置 | ||
技术领域
本发明涉及计算机技术领域,尤其涉及一种多节点服务器系统的故障现场信息的收集方法及装置。
背景技术
在多节点服务器系统中,当分区节点发生故障时,对其故障现场信息的收集能为故障分析提供非常重要的支持。由于多节点服务器系统比较复杂,以及分区节点之间的关联性较强,因此引发某个分区节点发生故障的原因会有多种可能(可能是由用户的不良操作引起,也可能是由周围异常的环境引起,还有可能是由其他分区节点引起等等)。为了能够方便维护人员准确定位故障发生的根本原因,提高故障处理的效率,在故障发生时不仅要收集节点的故障信息,还要收集故障现场信息(如用户操作日志、SEL日志、系统环境温度、风扇速率等等),并将这些信息提供给故障分析模块,或者直接提供给维护人员。
然而实践中发现,由于缺乏有效的故障现场信息的收集机制,因此,当分区节点发生故障的时候,如何有效的收集故障现场信息,是本领域技术人员亟需解决的技术难题。
发明内容
本发明实施例公开了一种多节点服务器系统的故障现场信息的收集方法及装置,提供了一种有效的故障现场信息的收集机制,能够有效的收集故障现场信息。
本发明实施例第一方面公开一种多节点服务器系统的故障现场信息的收集方法,包括:
接收分区节点上报的故障信息;
根据所述故障信息,获取与所述故障信息相匹配的故障类型;
根据所述故障类型,提取需要收集的故障现场信息类型;
根据所述需要收集的故障现场信息类型,收集相应的故障现场信息。
在本发明实施例第一方面的第一种可能的实现方式中,所述根据所述故障信息,获取与所述故障信息相匹配的故障类型包括:
根据所述故障信息,从故障类型模块存储的故障信息与故障类型的匹配关系中获取与所述故障信息相匹配的故障类型。
结合本发明实施例第一方面的第一种可能的实现方式,在本发明实施例第一方面的第二种可能的实现方式中,所述根据所述故障类型,提取需要收集的故障现场信息类型包括:
根据所述故障类型,从信息类型模块存储的公有信息类型库以及所述故障类型匹配的私有信息类型库中提取需要收集的故障现场信息类型。
结合本发明实施例第一方面或本发明实施例第一方面的第一种或第二种可能的实现方式,在本发明实施例第一方面的第三种可能的实现方式中,若所述分区节点为分区从节点,且所述需要收集的故障现场信息类型包括用户操作日志、SEL日志、系统环境温度、风扇速率、电源功率,则所述根据所述需要收集的故障现场信息类型,收集相应的故障现场信息包括:
发送信息收集请求给日志模块,以触发所述日志模块收集所述分区从节点的用户操作日志和SEL日志;
以及,发送信息收集请求给环境监测模块,以触发所述环境监测模块收集所述分区从节点的系统环境温度、风扇速率以及电源功率。
结合本发明实施例第一方面或本发明实施例第一方面的第一种或第二种可能的实现方式,在本发明实施例第一方面的第四种可能的实现方式中,若所述分区节点为分区主节点,且所述需要收集的故障现场信息类型包括用户操作日志、SEL日志、系统环境温度、风扇速率、电源功率,则所述根据所述需要收集的故障现场信息类型,收集相应的故障现场信息包括:
发送信息收集请求给日志模块,以触发所述日志模块收集所述分区主节点所属分区的所有分区节点的用户操作日志和SEL日志;
以及,发送信息收集请求给环境监测模块,以触发所述环境监测模块收集所述分区主节点所属分区的所有分区节点的系统环境温度、风扇速率以及电源功率。
本发明实施例第二方面公开一种多节点服务器系统的故障现场信息的收集装置,包括故障管理模块,所述故障管理模块包括:
故障处理模块,用于接收分区节点上报的故障信息,以及根据所述故障信息,获取与所述故障信息相匹配的故障类型;
信息收集模块,用于根据所述故障处理模块获取的所述故障类型,提取需要收集的故障现场信息类型,以及根据所述需要收集的故障现场信息类型,收集相应的故障现场信息。
在本发明实施例第二方面的第一种可能的实现方式中,所述收集装置还包括:
故障类型模块,用于存储的故障信息与故障类型的匹配关系;
其中,所述故障处理模块根据所述故障信息,获取与所述故障信息相匹配的故障类型包括:
所述故障处理模块用于根据所述故障信息,从所述故障类型模块存储的故障信息与故障类型的匹配关系中获取与所述故障信息相匹配的故障类型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310252895.3/2.html,转载请声明来源钻瓜专利网。