[发明专利]一种低功耗高吞吐的浮点数乘累加单元的实现方法有效

专利信息
申请号: 201310066901.6 申请日: 2013-03-01
公开(公告)号: CN103176767A 公开(公告)日: 2013-06-26
发明(设计)人: 沈海斌;沈俊 申请(专利权)人: 浙江大学
主分类号: G06F7/52 分类号: G06F7/52
代理公司: 杭州求是专利事务所有限公司 33200 代理人: 张法高
地址: 310027 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 功耗 吞吐 浮点 累加 单元 实现 方法
【说明书】:

技术领域

发明涉及中央处理器以及数字信号处理器中核心运算单元的设计领域,尤其涉及一种低功耗高吞吐的浮点数乘累加单元的实现方法。

背景技术

计算机和通讯技术的迅猛发展,极大的改变了我们的工作和生活方式,人类的生产生活越来越依赖计算机等设备,科学研究和工程应用都对浮点数的运算性能提出了很高的要求,其中乘累加是数字信号处理、科学计算中的关键运算单元。

在传统结构中,矢量点乘运算由于数据相关性的原因,流水线无法每个周期计算一次乘累加,所以吞吐率会大幅下降,其每秒浮点运算次数与峰值性能相距甚远。在实现诸如有限长单位冲激响应滤波器时,传统的浮点数运算装置需要多次寄存器存取操作才能完成,性能损失严重。另外,随着嵌入式手持设备越来越普及,系统的功耗越来越被人们所关注和研究,因而如何降低芯片功耗也成为当前集成电路设计中的关键因素之一。

发明内容

本发明的目的在于克服现有设计对矢量点乘操作的不足,提供一种低功耗高吞吐的浮点数乘累加单元的实现方法。

低功耗高吞吐的浮点数乘累加单元的实现方法的步骤如下:

1)提取计算矢量点乘运算的个数N,在N个周期内每周期输入一对操作数A与操作数B,前三级流水线执行操作数A与操作数B的浮点乘法操作,得到乘积结果,乘积结果采用进位保留形式传递给下一级;

2)在第四级流水线将乘积进行位宽拓展,对于双精度浮点数将乘积从基2权重转换到基64权重,对于单精度浮点数将乘积从基2权重转换到基32权重,将权重提高以后,尾数位宽增加,指数位宽减少;

3)将转换后的乘积在第五级流水线进行累加操作,累加的临时结果反馈到输入端,与下一周期输入的乘积继续累加,直到N次全部完成,从而消除流水线的停顿,到达每周期完成一次乘积累加,累加器采用4-2进位保留加法器;

4)将进位保留结果通过第六级流水线与第七级流水线的最终加法器与移位器完成权重的复原,在第N+6个周期输出最终乘累加的结果。

所述的权重转换为:乘积需要的位宽调整采用基64-2/32-2转换模块,对于双精度浮点数指数的高5位保留,尾数根据指数低6位左移;对于单精度浮点数指数的高3位保留,尾数根据指数低5位左移。

所述的累加操作为:累加值根据三种指数差值的执行不同的常量移位,分别对应累加值右移位64位,左移位64位,或者不移位,将移位后的尾数相加,在累加器执行的过程中,如果累加的临时结果积累了超过63个零,那么需要将临时结果左移64位,从而使有效位大于53位。

与现有技术相比,本发明的有益效果在于:

1)本发明的浮点数乘累加装置可以完成任意长度N的矢量点乘运算,可以每周期计算一次乘累加,避免了处理器中寄存器的频繁存取操作。本发明可以全流水执行,上述运算可以在N+6个周期内完成,兼容单精度与双精度浮点数;

2)本发明执行一次长度为N的矢量点乘运算,规格化与舍入模块仅仅使用到一次,从而大幅降低了该类运算的功耗;

3)本发明具有模块化设计思想,可以运用到处理器,或者在FPGA上组成运算阵列,完全符合IEEE浮点数运算标准,针对矢量运算具有低功耗和高吞吐率的特点。

附图说明

图1是低功耗高吞吐的浮点数乘累加单元的实现方法的原理图;

图2是本发明的浮点数数据存储格式示意图;

图3是本发明的乘法器模块图;

图4是本发明的基64-2转换模块图;

图5是本发明的单周期累加算法的原理示意图;

图6是本发明的单周期累加模块图;

图7是本发明的低功耗原理示意图。

具体实施方法

如图1、2所示,低功耗高吞吐的浮点数乘累加单元的实现方法的步骤如下:

1)提取计算矢量点乘运算的个数N,在N个周期内每周期输入一对操作数A与操作数B,前三级流水线执行操作数A与操作数B的浮点乘法操作,得到乘积结果,乘积结果采用进位保留形式传递给下一级;

2)在第四级流水线将乘积进行位宽拓展,对于双精度浮点数将乘积从基2权重转换到基64权重,对于单精度浮点数将乘积从基2权重转换到基32权重,将权重提高以后,尾数位宽增加,指数位宽减少;

3)将转换后的乘积在第五级流水线进行累加操作,累加的临时结果反馈到输入端,与下一周期输入的乘积继续累加,直到N次全部完成,从而消除流水线的停顿,到达每周期完成一次乘积累加,累加器采用4-2进位保留加法器;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310066901.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top