[发明专利]一种支持FFT加速的SIMD向量处理器无效
申请号: | 201110393712.0 | 申请日: | 2011-12-02 |
公开(公告)号: | CN102495721A | 公开(公告)日: | 2012-06-13 |
发明(设计)人: | 李丽;孙敏敏;王佳文;潘红兵;郑维山;沙金;李伟 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F9/34 | 分类号: | G06F9/34 |
代理公司: | 南京汇盛专利商标事务所(普通合伙) 32238 | 代理人: | 陈扬 |
地址: | 210093 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 支持 fft 加速 simd 向量 处理器 | ||
技术领域
本发明涉及一种支持FFT加速的SIMD向量处理器及其设计方法,具体地说是一种支持可变点数,对FFT/IFFT运算加速效率较高而整体硬件开销较低的SIMD向量处理器及其设计方法。
背景技术
快速傅里叶变换(Fast Fourier Transformation, FFT)运算一般都通过专用硬件加速器(称为FFT处理器)或DSP处理器完成。专用硬件加速器能获得较高的加速效率,但是会占用较多额外资源,包括片上存储资源和片上计算逻辑资源,特别是当变换的长度极大时,专用硬件加速器所占用的额外资源将无法承受。用DSP处理器软件编程的方式完成FFT运算虽然不会占用额外的硬件资源且具有很大的灵活性,但是其处理速度相对较慢,满足不了某些应用的实时性要求。
在一些数字信号处理算法,如距离-多普勒算法中,涉及大量各种长度的向量处理,最长可达到16K甚至更长。对这些向量的处理既包括规则的向量运算(向量加减法、向量乘法等)也包括FFT/IFFT运算。SIMD向量处理器可用来加速规则的向量运算,但是尚未出现同时能够直接加速FFT运算(加速效率和专用加速器相当)的SIMD向量处理器,在这种情况下,还需要另外使用FFT硬件加速器来加速各种点数的FFT/IFFT运算,额外的片上资源将会被占用。
发明内容
为了加速大点数FFT的运算效率,同时避免使用专门硬件加速器所带来的额外硬件开销,本发明的目的是提供一种支持FFT加速的SIMD向量处理器。该SIMD向量处理器能够直接加速FFT运算,还可提供和专用硬件加速器加速效率相当的FFT运算加速,在保证性能的同时避免额外的硬件开销。
本发明的目的是通过以下技术方案来实现的:
一种支持FFT加速的SIMD向量处理器,其特征在于:该处理器包括控制单元、计算单元、存储器子系统、存储交织单元和地址产生单元;所述计算单元支持各种向量运算的快速处理,所述存储器子系统包括存放操作数的存储器组A、存放系数的存储器组B和存放运算结果的存储器组C,且存储器组A、存储器组B和存储器组C内的单个存储体的位宽为一个复数字,支持4路数据并行的复数向量运算和8路数据并行的实数向量运算;计算单元、地址产生单元和存储交织单元均与控制单元连接;地址产生单元根据运算类型、运算的数据并行度及向量的长度产生所需的操作数地址序列、系数地址序列、结果地址序列;存储交织单元与地址产生单元和计算单元连接,并实现存储体的地址映射。
本发明中,存储器组A、存储器组B和存储器组C均为4个存储体。存储交织单元实现存储器组A、存储器组B和存储器组C内部4个存储体的地址映射,使同时读取的4个操作数位于4个不同的存储体,且同时写入的4个运算结果位于4个不同的存储体;通过可编程地址映射方法,支持各种长度向量的规则向量运算和FFT/IFFT运算。
所述可编程地址映射方法是可通过软件编程方式设置向量长度,对于不同的向量长度,地址映射方法也相应变化,且在各向量长度下,均能保证规则向量运算和FFT/IFFT运算无冲突读写。
计算单元包括2个复数乘法器和4个复数加法器,支持2路数据并行的复数乘法、卷积运算,4路数据并行的复数加减法、累加运算,4路数据并行的复数模方运算,4路数据并行的FFT/IFFT运算,以及8路数据并行的实数乘法、卷积、加减法、累加运算。对于上述的n路数据并行的向量运算,平均每个时钟周期处理n个向量单元(不考虑处理每个向量前的流水线填充时间)。其加速效率与专用硬件加速器相当,且支持可变点数,因此在保障系统计算效率的同时,节省了在设计中因使用FFT专用硬件加速单元而带来的巨额片上存储资源与逻辑资源开销。
本发明中的存储子系统包括三个存储器组,分别存放操作数、系数和运算结果,每组存储器分为4个存储体,存储体的位宽为一个复数字,以支持4路数据并行的复数向量运算和8路数据并行的实数向量运算。地址产生单元,能够根据运算类型(规则运算、FFT/IFFT运算)、运算的数据并行度(2、4、8)、向量的长度等产生所需的操作数地址序列、系数地址序列(对某些运算不需要,如累加运算和复数模方运算)、结果地址序列。
本发明能够直接加速FFT运算的SIMD向量处理器,除了能够加速规则向量运算之外,还可提供和专用硬件加速器加速效率相当的FFT运算加速,在保证性能的同时避免额外的硬件开销。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110393712.0/2.html,转载请声明来源钻瓜专利网。