[发明专利]一种PCIe设备I2C挂死问题处理方法及相关组件在审
| 申请号: | 202210764575.5 | 申请日: | 2022-06-30 |
| 公开(公告)号: | CN115129516A | 公开(公告)日: | 2022-09-30 |
| 发明(设计)人: | 肖时航 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
| 主分类号: | G06F11/14 | 分类号: | G06F11/14;G06F13/40;G06F13/366 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 任美玲 |
| 地址: | 215100 江苏省苏州*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 pcie 设备 i2c 问题 处理 方法 相关 组件 | ||
本发明公开了一种PCIe设备I2C挂死问题处理方法、系统、装置及存储介质,涉及服务器管理领域,应用于BMC,若在对各个PCIe设备进行轮询时检测到I2C挂死的PCIe设备,则先向I2C挂死的PCIe设备发送连续的clock信号,若并未解锁,先控制I2C Switch复位,通过复位后的I2C Switch跳过异常PCIe设备对各个PCIe设备进行轮询,避免对其他PCIe设备的轮询的影响,并控制异常PCIe设备复位和/或控制异常PCIe设备上下电重启,以使异常PCIe设备解锁。本申请中不仅可以避免异常PCIe设备影响对其他正常PCIe设备的轮询,还设置多种解锁方法,保证异常PCIe设备及时解锁。
技术领域
本发明涉及服务器管理领域,特别是涉及一种PCIe设备I2C挂死问题处理方法及相关组件。
背景技术
伴随云计算、大数据技术的快速发展,当前社会的信息化、智能化趋势日益加快,服务器作为信息化系统的核心设备,具备存储性能高、I/O(Input/Output,输入/输出)扩展能力强的特点。
众所周知,PCIe(peripheral component interconnect express,高速串行计算机扩展总线标准)设备是服务器系统架构中的重要组成部分,其中包括NVME(Non VolatileMemory Host Controller Interface Specification,非易失性内存主机控制器接口规范)硬盘、SAS(Serial Attached SCSI,串行连接SCSI接口)/Raid(Redundant Arrays ofIndependent Disks,磁盘阵列)卡、网卡、GPU(graphics processing unit,图形处理器)等,是服务器实现存储、计算、通信等功能的关键部件。这些PCIe设备的PCIe总线与CPU(central processing unit,中央处理器)连接,以和CPU之间进行数据的快速交互,I2C(Inter-Integrated Circuit,两线式串行总线)总线与BMC(Baseboard ManagementController,用于服务器主板的管理)连接实现带外管理。为了确保PCIe设备稳定可靠地运行,BMC需实时监控PCIe设备的状态,具体地,通过I2C总线轮询读取各PCIe设备的温度等工作参数。然而由于PCIe设备的类型及厂商较多且会不定期升级FW(Firmware,固件),导致在研发调试、产线生产及客户现场会经常出现PCIe设备I2C挂死的问题,而现有技术中的I2C挂死问题定位慢且会降低产品体验。
现有技术中的BMC在对各个PCIe设备轮询时检测到存在I2C挂死的PCIe设备后会向I2C挂死的PCIe设备发送连续的clock(时钟)信号以尝试解锁I2C挂死的PCIe设备,若解锁成功则能恢复与PCIe设备的正常通信,而若解锁失败则记录I2C挂死日志,且I2C挂死的PCIe设备的I2C总线会一直处于挂死状态直到解锁恢复或直接待整机重新上下电后才可能恢复正常通信。
此外,由于PCIe设备的类型和厂家较多,BMC仅通过发送连续clock的方式尝试解锁I2C挂死的PCIe设备的成功率较低,又由于服务器上的PCIe设备较多,BMC的一路I2C总线下会挂载多个PCIe设备,只要有一个PCIe设备挂死后就无法放完其他PCIe设备,也即BMC无法跳过I2C挂死的PCIe设备继续轮询其他PCIe设备,导致对未发生I2C挂死的PCIe设备的工作参数读取异常,无法准确地确定服务器是否正常工作也无法及时对服务器进行调整。
发明内容
本发明的目的是提供一种PCIe设备I2C挂死问题处理方法、系统、装置及存储介质,不仅可以避免异常PCIe设备影响对其他正常PCIe设备的轮询,还设置多种解锁方法,保证异常PCIe设备及时解锁。
为解决上述技术问题,本发明提供了一种PCIe设备I2C挂死问题处理方法,应用于BMC,所述BMC通过I2C总线与I2C Switch连接,所述I2C Switch通过各个I2C总线分别与各个所述PCIe设备连接,所述方法包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210764575.5/2.html,转载请声明来源钻瓜专利网。





