[发明专利]GPDSP共享乘法器结构的定点浮点运算部件在审

申请号：	201510725430.4	申请日：	2015-10-29
公开（公告）号：	CN105607889A	公开（公告）日：	2016-05-25
发明（设计）人：	雷元武;彭元喜;韩珊珊;陈书明;刘宗林;田甜;胡封林;刘祥远;刘仲;陈海燕;王耀华;陈虎;马胜;孙书为;许邦建	申请（专利权）人：	中国人民解放军国防科学技术大学
主分类号：	G06F7/52	分类号：	G06F7/52
代理公司：	湖南兆弘专利事务所 43008	代理人：	周长清
地址：	410073 湖南省长沙市砚瓦池正街47号中国***	国省代码：	湖南;43
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	gpdsp 共享乘法器结构定点浮点运算部件
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明主要涉及到微处理器结构与设计领域，特指一种适合高性能通用数字信号处理器 (General-PurposeDigitalSignalProcessor，简称GPDSP)中具有共享乘法器结构的定点浮点乘积运算单元。

背景技术

传统数字信号处理领域中，数据通常以定点方式组织、存储和处理，传统DSP对定点运算提供很高的定点运算性能。然而，在现代通信、图像处理和雷达信号处理等应用领域，随着数据处理量加大、数据计算的精度和实时性要求的增加，通常需要使用更高性能的微处理器。对于数据精度和实时性的要求也在不断提高，由于算法具有高的浮点计算密集型，处理器的浮点数据处理能力显得越发重要。因此，通用高性能DSP需要对定点和浮点运算进行高效的硬件支持。

无论是定点算术和浮点算术，乘法是数字信号处理中的重要运算，许多运算的性能是由乘法运算所能达到的性能决定的。衡量数字信号处理器的性能的重要指标之一就是单位时间内所能完成乘累加运算的次数。工程和科学应用领域使用大量矩阵类运算，其中包含大量的点积操作，图形图像和通信领域内FFT/IFFT、FIR滤波运算，包含大量的复数乘法和乘加运算。

GPDSP的运算单元中有大量与乘法相关的指令需要用到定点乘法器，如定点乘加单元中的乘法运算、乘加运算、点积运算和复数乘法运算，浮点乘加单元中的单精度浮点尾数乘法，双精度浮点尾数乘法和乘累加、乘后加运算。通常情况下这些指令不同时执行，传统设计浮点与定点分别使用各自的乘法器完成相应运算。这样的设计导致硬件复用率低，占用面积大，浪费硬件资源。

发明内容

本发明要解决的技术问题就在于：针对现有技术存在的技术问题，本发明提供一种能够提高硬件利用率、减少芯片面积的GPDSP共享乘法器结构的定点浮点运算部件。

为解决上述技术问题，本发明采用以下技术方案：

一种GPDSP共享乘法器结构的定点浮点运算部件，包括：

浮点乘加单元，用于支持双精度浮点操作和SIMD结构双单精度浮点乘法、乘加、乘减和复数乘法操作；

定点乘加单元，用于支持64位有符号或无符号定点乘法操作和SIMD结构的双32位有符号或无符号定点乘法操作；

64位定点乘法器，通过复用同一个乘法器的结构，将浮点尾数乘法视作无符号定点乘法进行运算。

作为本发明的进一步改进：所述64位定点乘法器为采用4个32×32乘法器组成一个64 位乘法器，用来完成定点32位SIMD乘法、64位乘法、SIMD单精度浮点尾数乘法以及双精度浮点尾数乘法。

作为本发明的进一步改进：在所述64位定点乘法器中，被乘数Src1和乘数Src2为64 位定点乘法器的输入端，作为64位的定点输入或作为53位的浮点输入，经过操作数选择模块使操作数位宽适合32位乘法器；64位的定点输入分为低32位Src[31:0]和高32位 Src[63:32],53位浮点操作分为低24位Src[23:0]和高29位Src[52:24]；浮点尾数乘法作为无符号定点乘法，不足32位的填0补齐。

作为本发明的进一步改进：在所述32×32乘法器采用基4Booth编码共产生17个部分积；第一级压缩是首先将其中的16个部分积使用四个4-2压缩器产生8个结果；第二级压缩将上一级的八个结果与未参与第一级压缩的一个部分积通过3个3-2压缩器压缩成6个结果；第三级压缩则是两个3-2压缩器产生4个结果；最后一级压缩用一个4-2压缩器得到最后的两个结果。

作为本发明的进一步改进：所述定点乘加单元中执行以下流水站：

E1站的加法器执行加法指令和减法指令，E1站输出加减法指令结果；

E1E2站同时执行32位乘法指令及乘加、乘减、点积、复数指令的乘法部分，E2站输出 32位乘法器结果，结果写2拍；

E3站执行乘加、乘减、点积、复数等指令的加法部分，同时指令64位乘法指令，E3站输出乘加、乘减结果、64位乘法指令和CMUL复数乘法指令，后两者写2拍；

E4站执行点积和复数指令的最后处理，E4站输出点积和复数指令的结果。

作为本发明的进一步改进：所述浮点乘加单元中执行以下流水站：

E1站完成读操作数、例外判断、指数计算，乘法指令的部分积产生、和第一级的部分积压缩；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学，未经中国人民解放军国防科学技术大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201510725430.4/2.html，转载请声明来源钻瓜专利网。