[发明专利]一种异构并行计算装置及运算节点互联网络有效
申请号: | 201710683470.6 | 申请日: | 2017-08-11 |
公开(公告)号: | CN107391432B | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 全大英;刘恒良;陶波;孔维太 | 申请(专利权)人: | 中国计量大学 |
主分类号: | G06F15/173 | 分类号: | G06F15/173 |
代理公司: | 浙江杭州金通专利事务所有限公司 33100 | 代理人: | 刘晓春 |
地址: | 310018 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 并行 计算 装置 运算 节点 互联网络 | ||
本发明提出了一种异构并行计算装置及其运算节点互联网络,能够针对雷达、通信和人工智能的实时信号处理和并行计算;异构并行计算装置包含一个中心控制节点、多个GPU运算节点和一个运算节点互联网络;运算节点互联网络采用星形网络,中心控制节点可以直接与所有GPU运算节点实现点对点通信,用于传递实时控制信息和实时并行计算任务以及数据,适用于所执行的计算具备突发、并行的特点的场合;运算节点互联网络采用环形网络,中心控制节点给GPU节点逐级分配任务,而所处理的数据可以通过环形网络逐级传递而不需要通过中心控制节点,以减轻中心控制节点的数据吞吐率,适合于大规模的流水线式运算处理的场合。
技术领域
本发明涉及运用到雷达、通信、和人工智能的高性能计算的技术领域,具体为一种异构并行计算装置及其运算节点互联网络。
背景技术
在雷达、通信、和人工智能的高性能计算领域,对于运算的数据吞吐率、单位时间运算能力和处理实时性的要求越来越高。在这些领域,传统的处理器主要包括MCU、CPU、DSP、FPGA等。从系统开发和软件编程的角度看,上述器件的开发难度大体上存在从易到难的趋势。但是从大规模运算的实时性来看,MCU和CPU的处理实时性最低,DSP居中,而FPGA最高。
随着桌面和移动计算机的发展,作为显卡的核心芯片图形处理器GPU的处理能力越来越强,甚至已经采用GPU核心开发出了专门针对移动设备应用的应用处理器,比如NVIDIA公司的Tegra TX1系列处理器。因此也出现了一些采用GPU进行雷达成像、通信系统计算和人工智能算法实现的设计。还出现了一些采用CPU结合GPU的处理器架构。这些方案的优点是采用高级语言在PC平台上进行编程,相比传统的DSP和FPGA平台,开发难度较低,开发周期短。但是存在以下不足:
1)在诸如雷达成像和高速通信等要求计算强实时性的场合,缺乏手段进行严格的时序控制;
2)多GPU系统往往采用复杂的网络连接,需要较多的系统开销,进一步降低了系统的运算能力;
3)适合于采用PC机和服务器的场合,无法满足大量的嵌入式设备的需求。
因此,针对雷达、通信和人工智能的实时信号处理和并行计算领域,为了弥补上述不足,有必要开发兼顾实时性和运算能力,并具备嵌入式应用能力的异构并行计算装置及运算节点互联网络。
发明内容
本发明所要解决的技术问题是提供应用于雷达、通信和人工智能的实时信号处理和并行计算领域的一种异构并行计算装置。为此,本发明采用如下技术方案:
一种异构并行计算装置,其特征在于,包括以下3个组成部分:
1-a)一个中心控制节点,其作用是实现实时运算加速、任务分配、时序控制和外部通信;
所述中心控制节点由FPGA构成;
所述实时运算加速是指能够完成实时的逻辑和算术运算;
所述任务分配,是指将具备流水或者并行处理的计算任务分配到不同的运算节点完成;将处理逻辑复杂的海量计算交由GPU运算节点完成,而高实时性的逻辑和算术运算交由中心控制节点完成;
所述时序控制,是指为各运算节点提供统一的时间基准和相互间的握手通信;
所述外部通信,是指从外部接受运算任务和数据,并提供运算结果;
1-b)多个GPU运算节点,用作完成运算任务;
1-c)运算节点互联网络,其作用是实现中心控制节点和所有GPU运算节点的通信互联。
本发明还提供了一种用于异构并行计算装置的运算节点互联网络,其特征在于,包括以下3个组成部分:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国计量大学,未经中国计量大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710683470.6/2.html,转载请声明来源钻瓜专利网。