[发明专利]用于通过中间阶层运算的并行计算来加速计算的方法和装置有效
申请号: | 201380026108.1 | 申请日: | 2013-05-07 |
公开(公告)号: | CN104364755B | 公开(公告)日: | 2019-04-02 |
发明(设计)人: | 维努·坎达戴 | 申请(专利权)人: | 维努·坎达戴 |
主分类号: | G06F9/38 | 分类号: | G06F9/38 |
代理公司: | 北京思睿峰知识产权代理有限公司 11396 | 代理人: | 谢建云 |
地址: | 印度安得拉*** | 国省代码: | 印度;IN |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 通过 中间 阶层 运算 并行 计算 加速 方法 装置 | ||
本发明构成一种用于实现中间运算的并行计算的方法和设备,这些中间运算在给定应用中的许多算法中为通用的并且还包括大多数计算密集型运算。该方法包括:设计适合于预先定义的应用的一组中间级函数,从处理器获得对应于中间级运算的指令,计算运算对象和结果的地址,执行多个中间级运算中所涉及的计算。在一示例性实施例中,设备由本地数据地址生成器、可编程计算单元和本地存储器接口构成,该本地数据地址生成器计算多个运算对象和结果的地址,该可编程计算单元执行中间级运算的并行计算,该本地存储器接口接口到在多个块中被组织的本地存储器中。本地数据地址生成器和可编程计算单元可配置成覆盖需要大量计算的任意域。
技术领域
本发明中所设计的方法和装置总体涉及高性能计算领域并且具体地涉及使用硬件加速器对不同的应用加速。本发明特别是涉及使用为不同的应用专门设计的运算的并行计算来设计集成电路的架构。
背景技术
存在对高性能计算的日益增长的需求。常常,高计算能力的要求也与低功耗的竞争要求相关联。例如,多媒体计算为一个这样的情况,其中,朝高分辨率和高清晰度应用的要求针对大多数通过蓄电池工作的装置。对于这样的装置,存在严格的功率和性能要求。存在用来在尝试消耗较少能量的同时增加计算功率的多项技术。
高性能处理器(RISC和DSP处理器)的设计,处理器的扩展,诸如单指令多数据(SIMD)、多指令多数据(MIMD)、协处理器等等,为对处理器的现有改型以实现更好的计算能力。还尝试了类似于多议题、VLIW(非常长的指令字)或更一般超标量架构的具有面向性能架构的处理器,但是,由于它们的大回路规模和功率消耗,成功率更低。
处理器架构的扩展的SIMD和MIMD型尝试在单个处理器循环中执行多项运算来实现较高的计算速度。适当设计的寄存器组被用来为多个运算提供运算对象以及存储那些运算的结果。
处理器的SIMD和类似的扩展需要以特定方式组织数据,并且因此仅在这样的数据组织容易得到且无需重排的先前步骤的情况下提供优点。此外,由于SIMD技术涉及仅基础数学运算, 所以在处于基础数学级的计算的顺序次序为必须的情况下,SIMD不能被用于算法的部分。因此,这些类型的扩展提供有限的计算加速,在计算类似视频解码的完全算法所需的周期上,最好的情况提供至多40%的缩短。因此这些类型的扩展由于所需的附加电路而产生更少的功率优点。
存在用来实现高性能的其它创新途径,诸如向量处理发动机、可配置加速器等。关于用于浮点运算[Nil]、可适应算术节点[N2]和可配置算术单元[E4]的可重配置阵列处理器的工作试图使用向量处理和可配置性来实现执行数学运算上的效率。
实现上文描述的较高计算能力的方法均在于更加有效地执行基础数学运算。DSP处理器执行诸如相乘和累加(MAC)的运算,这些运算为在基础数学运算之上的步骤。尽管这些算法为在不同应用的不同算法中产生的通用基本算法,但是出于上文陈述的原因,在该基础运算级下加速能够在计算中提供有限的加速。
另一方面,多芯架构被广阔地用来加快计算。在个人计算机、膝上型计算机和平板计算机以及甚至在高端移动电话中使用这些架构。精细功率管理方案用来最小化因多核心而产生的功率消耗。
多芯架构通过对算法的并行处理实现较高的计算能力。因此,算法对于并行处理(多线程)、对于将有效的多芯架构应是服从的。因此,除了因多个核心的存在而产生的较高功率消耗之外,在多芯处理器中可达到的计算加速也受到限制。
被用来对计算加速的不同的途径是构建实施整个算法或其需要大量计算的一部分的电路(硬件加速器)。通常设计硬件加速器来对算法的计算最昂贵的部分加速(音频编解码器中的傅里叶变换、视频编解码器中的去块滤波器等)。常常构建硬件加速器用于类似视频解码器的完全算法。该途径提供极好的算法加速。在这种情况下,功率要求也是最小的,因为回路具体地针对给定的计算设计。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于维努·坎达戴,未经维努·坎达戴许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380026108.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:单个数据缓冲器的并行处理
- 下一篇:用于基于位置信息的低功率处理的系统和方法