[发明专利]监控服务器系统中PCIe不可纠正错误的方法和装置在审
申请号: | 201910685722.8 | 申请日: | 2019-07-28 |
公开(公告)号: | CN110532120A | 公开(公告)日: | 2019-12-03 |
发明(设计)人: | 张建业 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07 |
代理公司: | 11262 北京安信方达知识产权代理有限公司 | 代理人: | 白天明;解婷婷<国际申请>=<国际公布> |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 纠正 监控服务器 文档 扫描循环周期 服务器系统 错误类型 发送邮件 起始时刻 属性信息 保存 遍历 提示 查找 监控 | ||
本发明公开了一种监控服务器系统中PCIe不可纠正错误的方法。在扫描循环周期的起始时刻,把对服务器系统的全部PCIe设备的状态进行遍历获得的每个PCIe设备的状态信息分别保存在对应的文档之中;查找每个PCIe设备对应的文档中保存的PCIe设备的状态是否存在PCIe不可纠正错误;如果查找到PCIe不可纠正错误,则发送邮件以提示查找到的PCIe不可纠正错误;其中,所述邮件中包括出现PCIe不可纠正错误的设备的属性信息及查找到的PCIe不可纠正错误的类型信息。上述方法能够监控到出现PCIe不可纠正错误的PCIe设备以及错误类型。还公开了对应的监控服务器系统中PCIe不可纠正错误的装置。
技术领域
本发明涉及服务器监控技术,尤指一种监控服务器系统中PCIe不可纠正错误的方法和装置。
背景技术
PCIe(Peripheral Component Interconnect express)是一种高速串行计算机扩展总线标准,旨在替代老版的PCI总线,现在大多数主板都配有多个PCIe插槽,外部设备可以插入PCIe插槽,通过PCIe总线与主机进行通信。在当前主流的服务器设计中,大部分外部设备都是通过PCIe插槽连接到服务器系统的设备(在本文中简称为“PCIe设备”),诸如网卡、RAID(Redundant Array ofIndependent Disks,独立冗余磁盘阵列)卡及HBA(Host BusAdapter,主机总线适配器)卡等,另外还有一些NVM Express(Non-Volatile Memoryexpress,非易失性内存主机控制器接口规范)及系统下的桥接设备等。在Linux系统下,当这些设备有不可纠正错误(Uncorrectable errors)的时候,系统管理员及时地发现不可纠正错误,对于服务器系统的稳定性及安全性,都是非常重要的,一旦有PCIe Uncorrectableerrors发生,这种类型的错误可能会导致PCIe链路(PCIe link)及PCIe设备变得不可靠,服务器系统中安装的操作系统也需要重置(reset)异常的链路和/或异常的PCIe设备。
在现有的服务器上电后,服务器之中的操作系统处于运行阶段,如果系统有PCIe不可纠正错误,系统的驱动可能会重置对应的link或设备,但是不会对管理员进行提醒,也不会告知管理员系统具体有哪类错误。这种错误一旦多次发生,可能会导致系统重启/死机或数据丢失等严重的问题。系统管理员无法知道具体的PCIe错误类型及得到通知并提前对异常的机器进行处理,严重的可能会导致数据丢失,服务器宕机或重启,可能会带来严重的经济损失及数据丢失。
发明内容
为了解决上述技术问题,本发明提供了一种监控服务器系统中PCIe不可纠正错误的方法和装置,其能够监控到出现PCIe不可纠正错误的PCIe设备以及错误类型。
为了达到本发明目的,本发明实施例提供了一种监控服务器系统中PCIe不可纠正错误的方法,该方法包括:
在扫描循环周期的起始时刻,把对服务器系统的全部PCIe设备的状态进行遍历获得的每个PCIe设备的状态信息分别保存在对应的文档之中;
查找每个PCIe设备对应的文档中保存的PCIe设备的状态是否存在PCIe不可纠正错误;
如果查找到PCIe不可纠正错误,则发送邮件以提示查找到的PCIe不可纠正错误;其中,邮件中包括出现PCIe不可纠正错误的设备的属性信息及查找到的PCIe不可纠正错误的类型信息。
在一个可选的实施例中,查找每个PCIe设备对应的文档中保存的PCIe设备的状态是否存在PCIe不可纠正错误的步骤包括:
查找在每个PCIe设备对应的文档之中代表PCIe设备状态的返回值,以根据返回值来确定是否存在PCIe不可纠正错误。
在一个可选的实施例中,如果查找到PCIe不可纠正错误,则发送邮件以提示查找到的PCIe不可纠正错误的步骤包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910685722.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:动力系统运行异常点检测方法
- 下一篇:业务模块定位方法及装置