[发明专利]一种故障加速卡快速定位装置及故障加速卡快速定位方法在审
申请号: | 201911356438.2 | 申请日: | 2019-12-25 |
公开(公告)号: | CN111176942A | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 杨智军 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30;G06F11/32;G06F13/40 |
代理公司: | 济南诚智商标专利事务所有限公司 37105 | 代理人: | 黄晓燕 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 故障 加速卡 快速 定位 装置 方法 | ||
1.一种故障加速卡快速定位装置,其特征在于,包括设置在训练服务器的空缺GPU卡槽上的模拟卡;
所述模拟卡包括一封装壳体和设置在所述封装壳体内的PCB板,所述封装壳体的结构与所述空缺GPU卡槽相适应,所述PCB板上设有I2C存储芯片和X16金手指,所述I2C存储芯片用于存储对应的所述GPU卡槽的预烧录信息,所述I2C存储芯片和X16金手指连接,所述X16金手指与所述GPU卡槽之间进行信号交互;
当在所述空缺GPU卡槽插入所述模拟卡时,所述训练服务器GPU状态图显示所述空缺GPU卡槽已插入加速卡。
2.根据权利要求1所述的故障加速卡快速定位装置,其特征在于,所述X16金手指的I2C数据和时钟信号与所述I2C存储芯片的对应管脚连接;
所述X16金手指的3.3V电压信号、接地信号也分别与所述I2C存储芯片的对应管脚连接。
3.根据权利要求2所述的故障加速卡快速定位装置,其特征在于,所述I2C存储芯片的型号为24LC64的64K大容量I2C串行存储芯片。
4.根据权利要求3所述的故障加速卡快速定位装置,其特征在于,所述I2C存储芯片设有管脚VCC、管脚WP、管脚SCL、管脚SDA、管脚A0、管脚A1、管脚A2以及管脚GND;
其中,所述管脚SCL、管脚SDA分别通过SCL信号线、SDA信号线与所述X16金手指连接,所述管脚WP、管脚A0、管脚A1、管脚A2以及管脚GND分别接地,所述引脚VCC与所述PCB板的IOVDD端连接。
5.根据权利要求4所述的故障加速卡快速定位装置,其特征在于,所述管脚SCL与所述X16金手指之间的所述SCL信号线上设有第一电路节点,所述第一电路节点引出的线路串接电阻R5后与所述IOVDD端连接;
所述管脚SDA与所述X16金手指之间的所述SDA信号线上设有第二电路节点,所述第二电路节点引出的线路串接电阻R6后与所述IOVDD端连接。
6.根据权利要求5所述的故障加速卡快速定位装置,其特征在于,所述管脚A0、管脚A1、管脚A2以及管脚GND的接地线路依次接通。
7.根据权利要求6所述的故障加速卡快速定位装置,其特征在于,所述管脚A0与管脚A1之间的接通线路上设有第三电路节点,所述第三电路节点引出的线路串接电容C23后与所述IOVDD端连接。
8.一种故障加速卡快速定位方法,其特征在于,所述方法包括下述步骤:
当在空缺的GPU卡槽上安装预先配置的模拟卡时,控制BMC通过I2C总线对包含所述模拟卡在内的所有加速卡进行预烧录信息的读取;
对读取到的所有预烧录信息进行解析,并根据对预烧录信息的解析,在训练服务器GPU状态图上显示所有GPU卡槽的状态,所述状态包括空缺、正常和故障。
9.根据权利要求8所述的故障加速卡快速定位方法,其特征在于,所述方法包括下述步骤:
预先配置的模拟卡,所述模拟卡用于安装在训练服务器的空缺GPU卡槽上,且模拟卡包括一封装壳体和设置在所述封装壳体内的PCB板,所述封装壳体的结构与所述空缺GPU卡槽相适应,所述PCB板上设有I2C存储芯片和X16金手指,所述I2C存储芯片用于存储对应的所述GPU卡槽的预烧录信息,所述I2C存储芯片和X16金手指连接,所述X16金手指与所述GPU卡槽之间进行信号交互;
当在所述空缺GPU卡槽插入所述模拟卡时,所述训练服务器的训练服务器GPU状态图显示所述空缺GPU卡槽已插入加速卡。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911356438.2/1.html,转载请声明来源钻瓜专利网。