[发明专利]用于深度学习加速的非常低精度浮点表示有效

申请号：	201910352202.5	申请日：	2019-04-29
公开（公告）号：	CN110457068B	公开（公告）日：	2023-03-14
发明（设计）人：	王乃刚;K·高帕拉克里斯南;崔正旭;S·M·穆尔乐;A·安哥拉瓦尔;D·布兰德	申请（专利权）人：	国际商业机器公司
主分类号：	G06F9/30	分类号：	G06F9/30;G06F7/483
代理公司：	中国贸促会专利商标事务所有限公司 11038	代理人：	鲍进
地址：	美国***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于深度学习加速非常精度浮点表示
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种方法，包括：

使用由非常低精度VLP格式表示的数字来配置用于浮点计算的专用电路，其中该VLP格式包括少于十六位；

进一步配置专用电路以将该VLP格式分配为符号位、指数位e和尾数位p；

操作进一步配置的专用电路以存储VLP格式的数值的近似值，其中该近似值被表示为分数的倍数的函数，其中该分数是能够仅使用尾数位表示的离散值的数量的倒数；以及

附加地配置专用电路以用与“非数字”值NaN相同的方式用VLP格式表示无穷大。

2.如权利要求1所述的方法，其中VLP格式使用八个位，其中该格式使用五个位作为指数位并且使用两个位作为尾数位。

3.如权利要求2所述的方法，其中分数的倍数的函数是

(-1)^s*2^(e-b)*(1+f/4)

其中s是能由单个符号位表示的可能值并且是0或1，其中e是能由五个指数位表示的三十二个可能值之一并且是从0到31，其中b是偏离率，并且其中f是能由两个尾数位表示的四个可能值之一并且是从0到3。

4.如权利要求1所述的方法，其中VLP格式使用九个位，其中该格式使用六个位作为指数位并且使用两个位作为尾数位。

5.如权利要求4所述的方法，其中分数的倍数的函数是

(-1)^s*2^(e-b)*(1+f/4)

其中s是能由单个符号位表示的可能值并且是0或1，其中e是能由六个指数位表示的六十四个可能值之一并且是从0到63，其中b是偏离率，并且其中f是能由两个尾数位表示的四个可能值之一并且是从0到3。

6.如权利要求1所述的方法，其中VLP格式使用九个位，其中该格式使用五个位作为指数位并且使用三个位作为尾数位。

7.如权利要求6所述的方法，其中分数的倍数的函数是

(-1)^s*2^(e-b)*(1+f/8)

其中s是能由单个符号位表示的可能值并且是0或1，其中e是能由五个指数位表示的三十二个可能值之一并且是从0到31，其中b是偏离率，并且其中f是能由三个尾数位表示的八个可能值之一并且是从0到7。

8.如权利要求1所述的方法，其中VLP格式使用总共十五个位，其中该格式使用n个位作为指数位并且使用p个位作为尾数位，使得n+p等于十四，其中一个位被保留用于符号。

9.如权利要求1所述的方法，其中专用电路包括浮点单元FPU。

10.如权利要求1所述的方法，还包括：

在VLP格式下，在操作专用电路时，当表示零、无穷大和NaN时，忽略符号位。

11.如权利要求1所述的方法，其中VLP格式仅保留两个表示，一个保留表示零，另一个保留表示NaN。

12.如权利要求1所述的方法，其中表示近似值的函数被表述为(-1)^s*2^(e-bias)*(1+f/(2^p))

其中e是从0到2^(n)-1，

F是从0到2^(p)-1，

n＝指数位的数量，以及

p＝尾数位的数量。

13.一种计算机可读介质，其上存储程序指令，所存储的程序指令包括实现权利要求1-12之一所述的方法中的步骤的程序指令。

14.一种计算机系统，包括处理器、计算机可读存储器和计算机可读存储设备，以及存储在存储设备上以供处理器经由存储器执行的程序指令，所存储的程序指令包括实现权利要求1-12之一所述的方法中的步骤的程序指令。

15.一种计算机系统，包括用于实现权利要求1-12之一所述的方法中的步骤的装置。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于国际商业机器公司，未经国际商业机器公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910352202.5/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载