[发明专利]Softmax函数的设计优化及硬件实现方法及系统有效
申请号: | 201810892536.7 | 申请日: | 2018-08-07 |
公开(公告)号: | CN109165006B | 公开(公告)日: | 2021-08-06 |
发明(设计)人: | 张卓健;邵启明;王少军;王琴 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F7/556 | 分类号: | G06F7/556;G06N3/063;G06N3/04 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 庄文莉 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | softmax 函数 设计 优化 硬件 实现 方法 系统 | ||
1.一种Softmax函数的设计优化及硬件实现方法,其特征在于,包括如下步骤:
第一输入步骤:进行第一遍输入;
第一指数运算步骤:针对多个输入数据,通过查找表实现指数运算;
累加步骤:对多个输入数据的指数运算结果求和,得到分母;
求倒步骤:对分母求倒得出分母的倒数;
第二输入步骤:进行第二遍输入;
第二指数运算步骤:通过查找表实现指数运算,计算出分子;
最终乘法步骤:对分母的倒数和分子相乘,得到最终结果;
通过数量级获取单元做到硬件决定输出定点化方案,数量级获取单元的具体运算方式如下:
数量级获取单元会获取同一组数据的指数运算结果并按位求或,最终的求或结果通过计数与判断数得高位连续为零的个数Z1,同时数量级获取单元也会得到累加器的结果并通过计数与判断数得高位连续为零的个数Z2,接着把Z1与Z2传给求倒单元从而让求倒单元取得指数运算单元结果和累加器结果的有效位,达到不损失精度条件下减小位宽从而减小资源与功耗的目的;同时因为求倒运算的延迟与位宽紧密相关,求倒运算的延迟也相应减小了,输出的定点化方案也由Z1和Z2算得,设输出总位宽为Wout,输出定点化方案小数位宽为Wfrac,指数运算单元输出位宽为Wexp,累加器输出位宽为Waccu,则Wfrac=(Wexp-Z1)-(Waccu-Z2)-(Wout-1)。
2.根据权利要求1所述的Softmax函数的设计优化及硬件实现方法,其特征在于,所述查找表由外部配置并存储在片上。
3.根据权利要求1所述的Softmax函数的设计优化及硬件实现方法,其特征在于,还包括查找表拆分步骤:
将1个寻址位宽为16位的查找表分为4个寻址位宽为4位的查找表,并使用3个乘法器,求出4个查找表数据的积,得到完整的指数运算结果。
4.根据权利要求1所述的Softmax函数的设计优化及硬件实现方法,其特征在于,采用restoring算法实现对分母求导。
5.根据权利要求1所述的Softmax函数的设计优化及硬件实现方法,其特征在于,还包括数量级获取步骤:
获取同一组数据的指数运算结果并按位求或,获取分母结果,实现输出定点化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810892536.7/1.html,转载请声明来源钻瓜专利网。