[发明专利]基于国产申威26010处理器的基2一维FFT的高性能实现方法有效
申请号: | 201710150446.6 | 申请日: | 2017-03-14 |
公开(公告)号: | CN106933777B | 公开(公告)日: | 2019-03-19 |
发明(设计)人: | 张佳佳;杨超;尹万旺;赵玉文;魏迪;刘芳芳;袁欣辉 | 申请(专利权)人: | 中国科学院软件研究所;无锡江南计算技术研究所 |
主分类号: | G06F17/14 | 分类号: | G06F17/14 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 杨学明;顾炜 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 国产 26010 处理器 fft 性能 实现 方法 | ||
本发明提出一种基于国产申威26010处理器的基2一维FFT的高性能实现方法,基于国产处理器申威26010平台,设计从核内行或列寄存器通信机制、访存‑计算重叠的双缓冲机制和256位单指令流多数据流的向量化运算等多种优化技术,同时提出基于两层分解的Stockham FFT计算框架且分解规则为库利‑图基算法,设计“接口层‑主核层‑从核层‑核心层”的四层结构框架进行基2一维FFT计算,从而有效解决FFT计算的访存带宽受限问题,有效提升基2一维FFT计算性能。与开源FFTW库相比,基于本平台的基2一维FFT计算性能急剧升高,以FFT计算的每秒浮点运算次数为例,其平均加速比为34.4,最高加速比达到50.3。
技术领域
本发明属于傅里叶变换领域,具体涉及基于国产申威26010处理器的基2一维FFT的高性能实现方法。
背景技术
快速傅里叶变换(Fast Fourier Transform,FFT)是离散傅里叶变换的快速计算方法。离散傅里叶变换(Discrete Fourier Transform,DFT)是指傅里叶变换在时域和频域都表示为离散状态,将信号的时域采样变换为离散时间傅里叶变换的频域采样。DFT将自然科学与工程技术中连续而复杂的问题转换为离散而简单的运算。对于数据规模为N的一维输入序列,DFT计算公式如下:
其中,ωN为旋转因子(twiddle factor)序列,ωN=e-i2π/N,eix=cos x+i sin x,由DFT计算公式可知,其实质为DFT矩阵与输入向量x的矩阵向量乘。规模为N的一维DFT矩阵的数学表达式为:
FFT主要利用ωN的对称性和周期性,将DFT分解为若干有规律的矩阵向量乘,使得DFT的浮点运算量减少到O(NlogN)。FFT算法种类繁多,变换形式复杂,主要处理对象有基2变换规模和非基2变换规模以及合数变换规模和素数变换规模,数据类型有单精度复数、双精度复数、单精度实数与双精度实数。本发明中,处理对象为基2一维FFT,数据类型为双精度复数。
国产申威26010处理器是江南计算技术研究所自主研制的高性能计算平台,该平台是1个主核与64个从核组成单个核组、并由4个核组组成单个CPU的众核平台。平台使用扩展的ALPHA架构指令集,支持从核核组寄存器通信机制、访存指令和计算指令同步发射机制以及256位SIMD向量化运算。该高性能计算平台性能优越,越来越多的科学计算与工业应用运行于该平台,然而目前开源FFTW函数库直接应用于该平台的计算性能较差,因此针对该申威平台开发FFT函数库是必需的。
发明内容
本发明技术解决问题:克服现有技术的基于开源FFTW函数库直接应用于本平台性能较低的问题,提供一种基于国产申威26010处理器的基2一维快速傅里叶变换的高性能实现方法,设计多种高性能优化手段,并且提出两层分解的FFT算法结构,有效应用于基2一维FFT计算,充分提高FFT函数库性能。
传统FFT算法并行度有限且访存局部性低,在申威众核平台上难以充分利用众多计算资源。依据众核计算平台的核间拓扑结构和存储层次特点,本发明基于国产申威26010处理的一个核组,设计接口层、主核层、从核层和核心层的四层结构框架进行FFT处理。一个核组由一个主核与64个从核组成;接口层和主核层为主核上操作,且操作输入输出数据存储于主核内存,从核层和核心层为从核上操作,且操作输入输出数据存储于从核局存LDM,即Local Direct Memory。具体实现如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院软件研究所;无锡江南计算技术研究所,未经中国科学院软件研究所;无锡江南计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710150446.6/2.html,转载请声明来源钻瓜专利网。