[发明专利]一种单机多GPU通信的方法及装置有效
申请号: | 201611149576.X | 申请日: | 2016-12-13 |
公开(公告)号: | CN106776455B | 公开(公告)日: | 2020-08-21 |
发明(设计)人: | 张清;龚湛;宋书涛 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F15/163 | 分类号: | G06F15/163 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 单机 gpu 通信 方法 装置 | ||
本发明公开了单机多GPU通信的方法及装置,该方法包括:确定GPU直连关系数据;根据数据广播确定预定通信数据及需要进行通信的GPU,并将需要进行通信的GPU中包含预定通信数据的GPU划分为第一集合,其他GPU划分为第二集合;第一集合中的GPU根据GPU直连关系数据向第二集合中与其具有直连关系的GPU传输预定通信数据,并将第二集合中具有预定通信数据的GPU移到第一集合中,直到第二集合为空或第二集合中存在与第一集合中GPU不存在直连关系的剩余GPU;当第二集合中存在剩余GPU,CPU向剩余GPU传输预定通信数据;避免了所有GPU间的数据传输都要经过CPU而造成CPU成为瓶颈。
技术领域
本发明涉及数据处理技术领域,特别涉及一种单机多GPU通信的方法及装置。
背景技术
自从2006年英伟达(NVIDIA)公司推出图形处理器G80(包含了128个流式多处理器)以来,图形处理器(GPU,Graphic Processing Unit)在某些大规模并行计算的应用上,相对于CPU来说性能提高可达100倍以上。GPU拥有更多的晶体管,用于数据处理而不是像CPU那样去处理数据cache和指令控制,这意味着GPU具有巨大的并行计算能力。GPU众核处理器计算资源密度更高,具有更高的计算性能,双精性能超过1TFlops。
随着高性能计算应用软件的发展,应用对计算性能的需求越来越高,CPU+GPU异构协同计算相对于传统的CPU集群带来了更高的性能、更低的成本等优势,越来越多的高性能计算应用软件采用CPU+GPU异构协同计算的计算模式。
CPU+GPU异构协同计算架构如图1所示,在一个计算节点内采用了CPU+GPU异构的计算方式。在某些计算量非常巨大的应用场景中,如深度学习神经网络的训练,多个GPU必须协调工作,因此多GPU间的数据传输速度对整个应用的性能影响非常大。如何在现有的硬件架构基础上完成高效的数据传输是一个难题。
发明内容
本发明的目的是提供一种单机多GPU通信的方法及装置,利用GPU Direct技术,避免了所有GPU间的数据传输都要经过CPU而造成CPU成为瓶颈,同时根据具体的硬件拓扑进行合理的路径规划,实现多GPU间的高速通信。
为解决上述技术问题,本发明提供一种单机多GPU通信的方法,所述方法包括:
对全部GPU进行检测,确定GPU直连关系数据;
根据数据广播确定预定通信数据及需要进行通信的GPU,并将需要进行通信的GPU中包含所述预定通信数据的GPU划分为第一集合,不包含所述预定通信数据的GPU划分为第二集合;
所述第一集合中的GPU根据所述GPU直连关系数据向所述第二集合中与其具有直连关系的GPU传输所述预定通信数据,在完成数据传输后,将所述第二集合中具有所述预定通信数据的GPU移动到所述第一集合中,直到所述第二集合为空或者所述第二集合中存在与所述第一集合中GPU不存在直连关系的剩余GPU为止;
当所述第二集合中存在所述剩余GPU时,CPU向所述剩余GPU传输所述预定通信数据。
可选的,对全部GPU进行检测,确定GPU直连关系数据,包括:
利用双重循环遍历所有2块GPU的组合,得到任意2个GPU间是否存在直连关系的数据表。
可选的,具有直连关系的两个GPU之间通过GPU Direct技术进行数据传输。
可选的,CPU向所述剩余GPU传输所述预定通信数据,包括:
在timestep时所述第一集合中的预定GPU将所述预定通信数据传输到CPU的内存,并从所述内存中将所述预定通信数据传输到所述剩余GPU内。
本发明还提供一种单机多GPU通信的装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611149576.X/2.html,转载请声明来源钻瓜专利网。