[发明专利]一种多GPU系统的EDP测试方法、系统、设备及存储介质在审
申请号: | 201711157420.0 | 申请日: | 2017-11-20 |
公开(公告)号: | CN107832177A | 公开(公告)日: | 2018-03-23 |
发明(设计)人: | 韩超 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | G06F11/22 | 分类号: | G06F11/22 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 罗满 |
地址: | 450018 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 gpu 系统 edp 测试 方法 设备 存储 介质 | ||
技术领域
本发明涉及GPU技术领域,特别涉及一种多GPU系统的EDP测试方法、系统、设备及存储介质。
背景技术
当前,为了满足客户提出的高性能计算机服务器的需求,相关企业研发了全新架构的计算型服务器PCIE-BOX,通过PCIE redriver卡和MiniSASHD高速线缆外接一台Server使用,此时的GPUBOX相当于Server端的PCIE设备,目前Server端最多可以连接4个GPUBOX服务器节点。
GPU进行并行运算,GPU数量和带宽的提升固然大幅提高了计算处理的性能,但是,GPUBOX在高功耗、高频率的情况下供电需要满足GPU的Input EDP(即Electrical Design Power,电气设计功耗)测试,测试时GPUBOX需要与Server端进行联合测试。
目前,单Server最多可支持16颗GPU,当多个GPUBOX节点搭配不同的GPU时,单次EDP测试全程需要3个小时左右的时间,并且需要测试很多次,期间还需要人工进行多次干预,以对测试过程进行管理和不断地调整,从而需要耗费大量的测试时间,整个测试过程十分的繁杂。
综上所述可以看出,如何提升多GPU系统的EDP测试效率是目前亟待解决的问题。
发明内容
有鉴于此,本发明的目的在于提供一种多GPU系统的EDP测试方法、系统、设备及存储介质,能够大幅提升多GPU系统的EDP测试效率。其具体方案如下:
第一方面,本发明公开了一种多GPU系统的EDP测试方法,包括:
步骤S11:检测当前Server端的操作系统中是否已安装显卡驱动;
步骤S12:若所述操作系统中没安装显卡驱动,则直接进入步骤S13;若所述操作系统中已安装显卡驱动,则卸载该显卡驱动,并进入步骤S13;
步骤S13:安装与多个待测GPUBOX节点所搭配使用的GPU分别对应的nvqual测试程序;
步骤S14:利用安装完毕的nvqual测试程序来调用Expect脚本,以对相应的GPU进行一次或多次EDP测试,得到相应的EDP测试结果。
可选的,所述若所述操作系统中已安装显卡驱动,则卸载该显卡驱动的步骤,包括:
若所述操作系统中已安装显卡驱动,则关闭当前正使用该显卡驱动的进程,然后卸载该显卡驱动。
可选的,所述安装与多个待测GPUBOX节点所搭配使用的GPU分别对应的nvqual测试程序的步骤之前,还包括:
通过第一参数设定接口获取用户输入的待测GPUBOX节点的节点特征参数,以利用该节点特征参数确定相应的待测GPUBOX节点。
可选的,所述待测GPUBOX节点的节点特征参数包括IP地址。
可选的,所述利用安装完毕的nvqual测试程序来调用Expect脚本,以对相应的GPU进行一次或多次EDP测试的步骤之前,还包括:
通过第二参数设定接口获取用户输入的EDP测试次数。
可选的,所述安装与多个待测GPUBOX节点所搭配使用的GPU分别对应的nvqual测试程序的步骤,包括:
安装与所述多个待测GPUBOX节点所搭配使用的GPU对应的GPU驱动程序和CUDA测试程序,并配置相应的CUDA环境变量;
获取并安装与所述多个待测GPUBOX节点所搭配使用的GPU的型号分别对应的nvqual测试程序。
可选的,所述安装与多个待测GPUBOX节点所搭配使用的GPU分别对应的nvqual测试程序的步骤之前,还包括:
将与所述多个待测GPUBOX节点所搭配使用的GPU对应的GPU驱动程序、CUDA测试程序和nvqual测试程序保存至所述Server端的操作系统下。
第二方面,本发明公开了一种多GPU系统的EDP测试系统,包括显卡驱动检测模块、显卡驱动卸载模块、nvqual安装模块和EDP测试模块;其中,
所述显卡驱动检测模块,用于检测当前Server端的操作系统中是否已安装显卡驱动,如果否,则启动所述nvqual安装模块的工作流程,如果是,则启动所述显卡驱动卸载的工作流程;
所述显卡驱动卸载模块,用于在所述操作系统中已安装显卡驱动的情况下,卸载该显卡驱动,并启动所述nvqual安装模块的工作流程;
所述nvqual安装模块,用于安装与多个待测GPUBOX节点所搭配使用的GPU分别对应的nvqual测试程序;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711157420.0/2.html,转载请声明来源钻瓜专利网。