[发明专利]一种收集硬件错误信息的方法有效
申请号: | 201710359111.5 | 申请日: | 2017-05-19 |
公开(公告)号: | CN107168815B | 公开(公告)日: | 2020-09-18 |
发明(设计)人: | 罗鹏芳;王棚辉;乔英良 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07;G06F11/30 |
代理公司: | 济南诚智商标专利事务所有限公司 37105 | 代理人: | 王汝银 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 收集 硬件 错误信息 方法 | ||
1.一种收集硬件错误信息的方法,用于快速、准确的采集服务器内硬件错误信息,其特征在于,所述的方法包括以下步骤:
步骤1:划分节点并设置节点控制器扩展模块;
步骤1中,每一个节点至少包括一个CPU和一个节点控制器;
在步骤1中,扩展模块的设置标准为:扩展模块是设置在节点控制器内部的存储模块,具有与存储控制器数据交互功能,以及与带外系统数据交互功能;
节点控制器和扩展模块之间通过地址映射实现数据存储;
带外系统和扩展模块之间通过SMBUS协议实现数据读取;
步骤2:用户自定义寄存器列表及数据结构;
步骤2中,用户自定义寄存器列表及数据结构的具体过程为:
研发人员首先结合芯片手册,选择需要收集的错误状态寄存器并自定义数据结构;然后形成文档并开发出解析工具对获取的错误信息进行解析,嵌入在系统固件用于收集错误信息的模块;
步骤3:设置服务器中断功能;
步骤3的具体实现原理为:系统出错时,系统管理中断功能使服务器系统进入中断服务程序;
步骤4:重启服务器,使服务器进入待命状态;
步骤4的具体实现过程为:
1)重启服务器,硬件初始化并启动服务器中断功能;
2)将扩展模块的存储部分映射到带内系统地址空间的一段MMIO地址段,并把这段地址空间的SAD指向节点控制器;
3)系统随机指定主节点和从节点;
4)系统通过主节点连接IO,并断开从节点上的IO接口;
步骤5:服务器发生硬件错误,节点采集硬件信息;
步骤5中,节点采集硬件信息的具体过程为:
1)启动服务器中断功能,所有CPU停止处理当前任务,进入中断服务程序;
2)步骤2中自定义的寄存器及数据结构分别收集数据,并将数据拷贝到主节点的扩展模块内;
3)从带外系统访问主节点扩展模块并读取硬件错误信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710359111.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种解决系统死机的装置及方法
- 下一篇:一种数据镜像方法及存储系统