[发明专利]一种故障加速卡快速定位装置及故障加速卡快速定位方法在审
申请号: | 201911356438.2 | 申请日: | 2019-12-25 |
公开(公告)号: | CN111176942A | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 杨智军 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30;G06F11/32;G06F13/40 |
代理公司: | 济南诚智商标专利事务所有限公司 37105 | 代理人: | 黄晓燕 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 故障 加速卡 快速 定位 装置 方法 | ||
本发明涉及服务器技术领域,提供一种故障加速卡快速定位装置及故障加速卡快速定位方法,装置包括模拟卡;模拟卡包括一封装壳体和PCB板,封装壳体的结构与空缺GPU卡槽相适应,PCB板上设有I2C存储芯片和X16金手指,I2C存储芯片用于存储对应的GPU卡槽的预烧录信息,I2C存储芯片和X16金手指连接,X16金手指与GPU卡槽之间进行信号交互;当在空缺GPU卡槽插入模拟卡时,训练服务器GPU状态图显示空缺GPU卡槽已插入加速卡,从而实现预烧录信息与加速卡物理位置的统一,有效防止空白空缺GPU卡槽引起BMC识别乱序,快速有效的对故障加速卡进行定位,为运维管理员提供便利。
技术领域
本发明属于服务器技术领域,尤其涉及一种故障加速卡快速定位装置及故障加速卡快速定位方法。
背景技术
随着AI人工智能在各行业的应用越来越多,AI训练,推理的服务器的应用保持300%的发展,主要应用于视频,语音,图像识别的程序的训练。为能快速的训练开发,训练完善的人工智能SDK,行业内集中使用NVIDIA的多个加速卡进行集群训练。
目前,AI训练服务器中有8个加速卡。在训练过程中,出现故障时AI服务器BMC报错,但不能正确定位故障加速卡的物理位置,导致定位故障板块困难,降低服务效率。
发明内容
针对现有技术中的缺陷,本发明提供了一种故障加速卡快速定位装置,旨在解决现有技术不能正确定位故障加速卡的物理位置,导致定位故障板块困难,降低服务效率的问题。
本发明所提供的技术方案是:一种故障加速卡快速定位装置,包括设置在训练服务器的空缺GPU卡槽上的模拟卡;
所述模拟卡包括一封装壳体和设置在所述封装壳体内的PCB板,所述封装壳体的结构与所述空缺GPU卡槽相适应,所述PCB板上设有I2C存储芯片和X16金手指,所述I2C存储芯片用于存储对应的所述GPU卡槽的预烧录信息,所述I2C存储芯片和X16金手指连接,所述X16金手指与所述GPU卡槽之间进行信号交互;
当在所述空缺GPU卡槽插入所述模拟卡时,所述训练服务器GPU状态图显示所述空缺GPU卡槽已插入加速卡。
作为一种改进的方案,所述X16金手指的I2C数据和时钟信号与所述I2C存储芯片的对应管脚连接;
所述X16金手指的3.3V电压信号、接地信号也分别与所述I2C存储芯片的对应管脚连接。
作为一种改进的方案,所述I2C存储芯片的型号为24LC64的64K大容量I2C串行存储芯片。
作为一种改进的方案,所述I2C存储芯片设有管脚VCC、管脚WP、管脚SCL、管脚SDA、管脚A0、管脚A1、管脚A2以及管脚GND;
其中,所述管脚SCL、管脚SDA分别通过SCL信号线、SDA信号线与所述X16金手指连接,所述管脚WP、管脚A0、管脚A1、管脚A2以及管脚GND分别接地,所述引脚VCC与所述PCB板的IOVDD端连接。
作为一种改进的方案,所述管脚SCL与所述X16金手指之间的所述SCL信号线上设有第一电路节点,所述第一电路节点引出的线路串接电阻R5后与所述IOVDD端连接;
所述管脚SDA与所述X16金手指之间的所述SDA信号线上设有第二电路节点,所述第二电路节点引出的线路串接电阻R6后与所述IOVDD端连接。
作为一种改进的方案,所述管脚A0、管脚A1、管脚A2以及管脚GND的接地线路依次接通。
作为一种改进的方案,所述管脚A0与管脚A1之间的接通线路上设有第三电路节点,所述第三电路节点引出的线路串接电容C23后与所述IOVDD端连接。
本发明的另一目的在于提供一种故障加速卡快速定位方法,所述方法包括下述步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911356438.2/2.html,转载请声明来源钻瓜专利网。