[发明专利]PCIE链路的稳定性测试方法、装置、计算机设备和介质在审
申请号: | 202011260110.3 | 申请日: | 2020-11-12 |
公开(公告)号: | CN112416672A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 许飞;魏冰清;王永懿;张珅;秦晓宁 | 申请(专利权)人: | 宁畅信息产业(北京)有限公司 |
主分类号: | G06F11/22 | 分类号: | G06F11/22 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 宋永慧 |
地址: | 100089 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | pcie 稳定性 测试 方法 装置 计算机 设备 介质 | ||
本申请涉及一种PCIE链路的稳定性测试方法、装置、计算机设备和存储介质。涉及计算机应用技术领域,该方法根据待测PCIE链路中GPU的拓扑结构构建GPU通信环;向GPU通信环中的目标GPU发送测试指令,控制目标GPU根据测试指令中测试数据块的大小生成测试数据块,并控制GPU通信环包括的各个GPU依次传输测试数据块;在传输测试数据块的过程中,获取GPU通信环包括的各个GPU的状态数据,根据各状态数据确定待测PCIE链路的测试结果。本申请实施例,基于GPU通信环将待测PCIE链路上的所有通信节点连接起来,通过控制GPU通信环包括的各个GPU依次传输测试数据块实现了对待测PCIE链路整体加压,因此可以实现测试PCIE链路的整体性能,测试结果更能反映待测PCIE链路的整体性能。
技术领域
本申请涉及计算机应用技术领域,特别是涉及一种PCIE链路的稳定性测试方法、装置、计算机设备和介质。
背景技术
在深度学习训练中,常常采用多个GPU并行训练的方式进行网络训练。随着深度学习网络的复杂度越来越高,进行网络训练时需要的GPU的数量越来越多。然而,由于CPU上的通道数有限,因此,可直接连接到CPU上的GPU的数量受到限制。为此,目前提出了在CPU上连接PCIE交换芯片,然后在PCIE交换芯片上连接多个GPU的方案。其中,由CPU、PCIE交换芯片以及多个GPU组成的链路称为PCIE链路。在实际应用中,PCIE链路构建好之后,需要对PCIE链路进行压力测试,以检测该PCIE链路的性能。
现有技术中,对PCIE链路进行压力测试的方法一般是:对PCIE链路上的由PCIE交换芯片和每个GPU组成的单条链路分别进行测试,得到每个单条链路的测试结果。
然而,上述每个单条链路的测试结果并不能准确反映PCIE链路的整体性能。
发明内容
基于此,有必要针对上述技术问题,提供一种PCIE链路的稳定性测试方法、装置、计算机设备和介质。
一种PCIE链路的稳定性测试方法,该方法包括:
根据待测PCIE链路的拓扑结构构建GPU通信环,GPU通信环以GPU为通信节点,是将所有的通信节点通过首尾连接形成的单向环,数据在GPU通信环上依次传输;
向GPU通信环中的目标GPU发送测试指令,测试指令携带有测试数据块的大小,控制目标GPU根据测试指令中测试数据块的大小生成测试数据块,并控制GPU通信环包括的各个GPU依次传输测试数据块;
在传输测试数据块的过程中,获取GPU通信环包括的各个GPU的状态数据,状态数据包括待测PCIE链路报错信息和GPU当前带宽中的至少一种;
根据各状态数据确定待测PCIE链路的测试结果。
本申请实施例,基于GPU通信环将待测PCIE链路上的所有通信节点连接起来,通过控制GPU通信环包括的各个GPU依次传输测试数据块实现了对待测PCIE链路整体加压,因此可以实现测试PCIE链路的整体性能,测试结果更能反映待测PCIE链路的整体性能。
在其中一个实施例中,向GPU通信环中的目标GPU发送测试指令,包括:
获取待测PCIE链路中的GPU的理论带宽;
根据GPU的理论带宽确定待测PCIE链路的最大有效带宽;
根据最大有效带宽确定测试数据块的大小,根据测试数据块的大小生成测试指令。
本申请实施例,最大有效带宽表示GPU的数据传输能力的上限,基于最大有效带宽确定的测试数据块的大小可以使得待测PCIE链路在传输过程中处于满压状态。
在其中一个实施例中,根据各状态数据确定待测PCIE链路的测试结果,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁畅信息产业(北京)有限公司,未经宁畅信息产业(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011260110.3/2.html,转载请声明来源钻瓜专利网。