[发明专利]一种支持FFT加速的SIMD向量处理器无效

专利信息
申请号: 201110393712.0 申请日: 2011-12-02
公开(公告)号: CN102495721A 公开(公告)日: 2012-06-13
发明(设计)人: 李丽;孙敏敏;王佳文;潘红兵;郑维山;沙金;李伟 申请(专利权)人: 南京大学
主分类号: G06F9/34 分类号: G06F9/34
代理公司: 南京汇盛专利商标事务所(普通合伙) 32238 代理人: 陈扬
地址: 210093 江苏省南京*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 支持 fft 加速 simd 向量 处理器
【说明书】:

技术领域

发明涉及一种支持FFT加速的SIMD向量处理器及其设计方法,具体地说是一种支持可变点数,对FFT/IFFT运算加速效率较高而整体硬件开销较低的SIMD向量处理器及其设计方法。

背景技术

快速傅里叶变换(Fast Fourier Transformation, FFT)运算一般都通过专用硬件加速器(称为FFT处理器)或DSP处理器完成。专用硬件加速器能获得较高的加速效率,但是会占用较多额外资源,包括片上存储资源和片上计算逻辑资源,特别是当变换的长度极大时,专用硬件加速器所占用的额外资源将无法承受。用DSP处理器软件编程的方式完成FFT运算虽然不会占用额外的硬件资源且具有很大的灵活性,但是其处理速度相对较慢,满足不了某些应用的实时性要求。

在一些数字信号处理算法,如距离-多普勒算法中,涉及大量各种长度的向量处理,最长可达到16K甚至更长。对这些向量的处理既包括规则的向量运算(向量加减法、向量乘法等)也包括FFT/IFFT运算。SIMD向量处理器可用来加速规则的向量运算,但是尚未出现同时能够直接加速FFT运算(加速效率和专用加速器相当)的SIMD向量处理器,在这种情况下,还需要另外使用FFT硬件加速器来加速各种点数的FFT/IFFT运算,额外的片上资源将会被占用。

发明内容

为了加速大点数FFT的运算效率,同时避免使用专门硬件加速器所带来的额外硬件开销,本发明的目的是提供一种支持FFT加速的SIMD向量处理器。该SIMD向量处理器能够直接加速FFT运算,还可提供和专用硬件加速器加速效率相当的FFT运算加速,在保证性能的同时避免额外的硬件开销。

本发明的目的是通过以下技术方案来实现的:

一种支持FFT加速的SIMD向量处理器,其特征在于:该处理器包括控制单元、计算单元、存储器子系统、存储交织单元和地址产生单元;所述计算单元支持各种向量运算的快速处理,所述存储器子系统包括存放操作数的存储器组A、存放系数的存储器组B和存放运算结果的存储器组C,且存储器组A、存储器组B和存储器组C内的单个存储体的位宽为一个复数字,支持4路数据并行的复数向量运算和8路数据并行的实数向量运算;计算单元、地址产生单元和存储交织单元均与控制单元连接;地址产生单元根据运算类型、运算的数据并行度及向量的长度产生所需的操作数地址序列、系数地址序列、结果地址序列;存储交织单元与地址产生单元和计算单元连接,并实现存储体的地址映射。 

本发明中,存储器组A、存储器组B和存储器组C均为4个存储体。存储交织单元实现存储器组A、存储器组B和存储器组C内部4个存储体的地址映射,使同时读取的4个操作数位于4个不同的存储体,且同时写入的4个运算结果位于4个不同的存储体;通过可编程地址映射方法,支持各种长度向量的规则向量运算和FFT/IFFT运算。

所述可编程地址映射方法是可通过软件编程方式设置向量长度,对于不同的向量长度,地址映射方法也相应变化,且在各向量长度下,均能保证规则向量运算和FFT/IFFT运算无冲突读写。

计算单元包括2个复数乘法器和4个复数加法器,支持2路数据并行的复数乘法、卷积运算,4路数据并行的复数加减法、累加运算,4路数据并行的复数模方运算,4路数据并行的FFT/IFFT运算,以及8路数据并行的实数乘法、卷积、加减法、累加运算。对于上述的n路数据并行的向量运算,平均每个时钟周期处理n个向量单元(不考虑处理每个向量前的流水线填充时间)。其加速效率与专用硬件加速器相当,且支持可变点数,因此在保障系统计算效率的同时,节省了在设计中因使用FFT专用硬件加速单元而带来的巨额片上存储资源与逻辑资源开销。

本发明中的存储子系统包括三个存储器组,分别存放操作数、系数和运算结果,每组存储器分为4个存储体,存储体的位宽为一个复数字,以支持4路数据并行的复数向量运算和8路数据并行的实数向量运算。地址产生单元,能够根据运算类型(规则运算、FFT/IFFT运算)、运算的数据并行度(2、4、8)、向量的长度等产生所需的操作数地址序列、系数地址序列(对某些运算不需要,如累加运算和复数模方运算)、结果地址序列。

 

本发明能够直接加速FFT运算的SIMD向量处理器,除了能够加速规则向量运算之外,还可提供和专用硬件加速器加速效率相当的FFT运算加速,在保证性能的同时避免额外的硬件开销。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110393712.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top