[发明专利]在高性能计算系统中生成向量处理指令集结构的方法有效
| 申请号: | 201010162391.9 | 申请日: | 2010-04-28 |
| 公开(公告)号: | CN101833468A | 公开(公告)日: | 2010-09-15 |
| 发明(设计)人: | 王东琳;谢少林;尹志刚;林啸;张志伟;闫寒;薛晓军 | 申请(专利权)人: | 中国科学院自动化研究所 |
| 主分类号: | G06F9/45 | 分类号: | G06F9/45 |
| 代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 周国城 |
| 地址: | 100080 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 性能 计算 系统 生成 向量 处理 指令 集结 方法 | ||
技术领域
本发明涉及数字信号处理技术领域,特别是一种在高性能计算系统中生成向量处理指令集结构的方法。
背景技术
在过去的四十年期间,DSP处理器得到了突飞猛进的发展。但DSP计算能力必须进一步提升才能满足当前应用需求。半导体工艺是DSP发展的基础,一直是DSP发展的最主要动力,过去DSP性能提升绝大部分来源于芯片工作频率的提高。但由于集成电路制造工艺和功耗的限制,主频提升的时代已经结束,必须依靠架构创新才能进一步提高处理器性能,但架构的优化只能针对特定应用领域。
数字信号处理中绝大部分算法都可以抽象成向量之间的运算。但当今DSP处理器大都以标量为基本处理单位,只对标量计算进行优化设计,向量数据也转化成标量数据后再进行计算。由于工艺和功耗的限制,处理器时钟频率无法进一步提高;当今的处理器架构再也无法通过提高标量数据计算速度来提高向量计算速度。处理器必须针对向量数据的内在并行性进行优化设计。
“指令”是设计者所定义的、芯片可以理解的符号。通过向芯片发送不同的指令序列,程序员指定芯片不同时刻的动作。芯片所能理解的所有指令的集合,即为该芯片的指令集。程序员利用指令集中的指令,实现信号处理算法。
已有一些专利和文章讨论了向量处理器的指令集架构,但这些指令集都只讨论了向量的四则运算,没有针对数字信号处理算法进行分析和提取,所得到的指令集架构不一定适合指定的应用领域;同时,这些专利都是在标量的基础上来讨论向量计算,利用标量的计算资源来实现向量计算,无法进一步利用向量数据内在并行性进行优化设计。
提取和设计向量指令集是进行向量化DSP处理器设计的第一个步骤,指令集结构是否适合应用领域特性将直接影响芯片的整体性能,因此,向量指令集结构设计在芯片设计流程中是一个非常重要的环节。如何将数字信号处理算法抽象成以向量为基本单位的、并行的元操作,同时定义相应的向量指令集,是数字信号处理器研究领域中的一个重要问题。
发明内容
(一)要解决的技术问题
有鉴于此,本发明的主要目的是提供一种在高性能计算系统中生成向量处理指令集结构的方法,以生成适合于特定领域的向量处理指令集,进而提高处理器性能。
(二)技术方案
为达到上述目的,本发明采用的技术方案如下:
一种在高性能计算系统中生成向量处理指令集结构的方法,该方法包括:
步骤1:分析数字信号处理领域内的核心算法,得到各核心算法的逻辑表达式;
步骤2:从该逻辑表达式中抽象出数字信号处理领域内的向量元操作;
步骤3:根据抽象出的向量元操作,生成针对专用向量指令语法和行为的向量处理指令集结构。
上述方案中,步骤1中所述核心算法至少包括脉冲压缩、多普勒处理、空时数据向量生成和三角线性方程组求解。
上述方案中,其特征在于:
对于脉冲压缩,其逻辑表达式为:
其中x(l,p,n)为输入的三维数据,x1(l,p,n)为输出的三维数据,hp(kp)为数值固定的滤波器系数,Kp也为一固定值,表示滤波器系数长度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010162391.9/2.html,转载请声明来源钻瓜专利网。





