[发明专利]自动检查服务器与GPU箱互连线缆错插的方法及装置在审
申请号: | 202111065477.4 | 申请日: | 2021-09-10 |
公开(公告)号: | CN113791368A | 公开(公告)日: | 2021-12-14 |
发明(设计)人: | 田东顺;殷奎龙 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G01R31/67 | 分类号: | G01R31/67;G01R31/68;G01R31/54 |
代理公司: | 济南舜源专利事务所有限公司 37205 | 代理人: | 张营磊 |
地址: | 215100 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自动 检查 服务器 gpu 互连 线缆 方法 装置 | ||
本发明提供一种自动检查服务器与GPU箱互连线缆错插的方法及装置,所述方法步骤:在用于对接服务器与GPU箱的每对PCIe端口的每根高速线缆中设置在位信号线,并设置在位信号线两端分别与GPU箱的第一CPLD芯片连接,及服务器的第二CPLD芯片连接;第一CPLD芯片通过每根在位信号线向第二CPLD芯片发送不同频率的信号;设置在服务器的BMC解析第二CPLD芯片接收到的各在位信号线的实际信号频率,并判断各实际信号频率是否与对应预设信号频率相同,进而判定是否出现互连线缆错插漏插,以及定位错插漏插线缆的序号。本发明实现服务器与GPU箱装配后的调测和错误定位,能够有效识别插接松动、错插和漏插线缆的错误情况。
技术领域
本发明属于服务器生产装配纠错技术领域,具体涉及一种自动检查服务器与GPU箱互连线缆错插的方法及装置。
背景技术
随着AI计算、高性能运算、人工智能应用的迅速发展,推动了异构运算设备的广泛应用。为了获取强大的异构计算能力和扩展性能,通常将CPU运算和GPU运算分成服务器和GPU箱两个独立的设备,两者之间使用PCIe高速线缆连通。
实际应用中,每个PCIe端口为x16带宽,即包含16组通信通道。由于每条高速线缆中有4组通信通道,因此每个PCIe端口需要使用4条高速线缆。GPU箱有4个PCIe X16端口,即需要16条高速线缆,与服务器连接。
在生产装配环节,人工装配时无法自动检测线缆是否有错插、漏插等问题。往往依靠人工目检的方式,识别出问题并纠正经常发生线缆顺序插错的情况。同一端口内的线缆插错、跨端口插错等问题,会导致产品PCIe降带宽、无法通信、GPU系统序号与物理序号不对应等问题,经常会被误判为GPU板卡功能问题,排查澄清需要专职的检查人员,检查每台设备的每根线缆,工作量大,会耗费较多人力资源;完全依赖检查人员人工筛查,稍有疏忽,会有漏检、错检的风险;当插接错误的线缆数据较多时,往往需要耗费较大精力进行调整线序,甚至全部拆下后,重新进行连接。
此为现有技术的不足,因此,针对现有技术中的上述缺陷,提供一种自动检查服务器与GPU箱互连线缆错插的方法及装置,是非常有必要的。
发明内容
针对现有技术的上述服务器与GPU箱装配时,无法自动检测线缆是否有错插、漏插等问题,往往依靠人工目检的方式,耗费大量人力,漏检及错检风险大,且不便于调整错误线序的缺陷,本发明提供一种自动检查服务器与GPU箱互连线缆错插的方法及装置,以解决上述技术问题。
第一方面,本发明提供一种自动检查服务器与GPU箱互连线缆错插的方法,包括如下步骤:
S1.在用于对接服务器与GPU箱的每对PCIe端口的每根高速线缆中设置在位信号线,并设置在位信号线第一端与GPU箱的第一CPLD芯片连接,以及设置在位信号线第二端与服务器的第二CPLD芯片连接;
S2.第一CPLD芯片通过GPIO管脚产生不同频率信号,并通过连接的在位信号线向第二CPLD芯片发送;
S3.设置在服务器中的BMC解析第二CPLD芯片的GPIO管脚连接的在位信号线的实际信号频率,并判断各实际信号频率是否与对应预设信号频率相同,进而判定是否出现互连线缆错插漏插,以及定位错插漏插线缆的序号。
进一步地,步骤S1具体步骤如下:
S11.在用于连接服务器与GPU箱的每对PCIe端口的每根高速线缆中设置一根在位信号线;
S12.设置各在位信号线第一端与GPU箱的第一CPLD芯片的一个第一GPIO管脚连接;
S13.设置各在位信号线第二端与服务器的第二CPLD芯片的一个第二GPIO管脚连接;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111065477.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:封边带背涂品质评价方法
- 下一篇:一种光探测方法及光探测器