[发明专利]使用低位宽点积引擎对高位宽数求和在审
申请号: | 202110494255.8 | 申请日: | 2021-05-07 |
公开(公告)号: | CN113626759A | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 克里希纳库马尔·纳拉亚南·奈尔;伊赫桑·基什阿德斯坦尼扎德;托马斯·马克·乌尔里希 | 申请(专利权)人: | 脸谱公司 |
主分类号: | G06F17/16 | 分类号: | G06F17/16;G06F17/15;G06N3/063 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 周靖;杨明钊 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 低位 宽点积 引擎 高位 求和 | ||
1.一种设备,包括:
点积处理组件,其被配置为计算第一组元素与第二组元素的点积,所述第一组元素存储在第一存储单元中,其中:
使用第一数量的位来表示所述第一组元素中的每个元素;
使用大于所述第一数量的位的第二数量的位来表示存储在所述第一存储单元中的一组值中的每个值;和
所述一组值中的每个值被存储为跨越所述第一组元素的元素中的多于一个元素的分割段;
数据对齐组件,其被配置为:
接收所述点积处理组件的结果;和
修改所述点积处理组件的结果中的一个或更多个;和
累加器,其被配置为对所述数据对齐组件的输出求和,以至少部分地确定所述一组值的和。
2.根据权利要求1所述的设备,其中所述第一存储单元包括一个或更多个寄存器。
3.根据权利要求1所述的设备,其中所述第一存储单元被配置为存储256位。
4.根据权利要求1所述的设备,还包括被配置为存储所述第二组元素的第二存储单元。
5.根据权利要求1所述的设备,其中所述第二组元素中的每个元素使用所述第一数量的位来表示,并且具有或者是零或者是一的值。
6.根据权利要求1所述的设备,其中所述点积是整数点积。
7.根据权利要求1所述的设备,其中所述第一数量的位是八位,并且所述第二数量的位是三十二位。
8.根据权利要求1所述的设备,其中所述数据对齐组件被配置为修改所述点积处理组件的一个或更多个结果,包括通过被配置为至少部分地基于迭代计数来对所述一个或更多个结果进行位移位。
9.根据权利要求1所述的设备,其中所述点积是浮点点积。
10.根据权利要求1所述的设备,其中所述第一数量的位是十六位,并且所述第二数量的位是三十二位。
11.根据权利要求10所述的设备,其中所述第一数量的位被格式化为脑浮点浮点格式,并且所述第二数量的位被格式化为单精度浮点格式。
12.根据权利要求1所述的设备,其中所述数据对齐组件被配置为修改所述点积处理组件的一个或更多个结果,包括通过被配置为至少部分地基于迭代计数从所述一个或更多个结果的指数部分减去指定值。
13.根据权利要求1所述的设备,其中所述数据对齐组件包括选择逻辑组件,所述选择逻辑组件被配置为至少部分地基于迭代计数来选择数据修改。
14.根据权利要求13所述的设备,其中所述选择逻辑组件包括一个或更多个多路复用器。
15.根据权利要求1所述的设备,其中所述数据对齐组件包括位移位器。
16.根据权利要求1所述的设备,其中所述数据对齐组件包括减法器或被配置为添加负数的加法器。
17.根据权利要求1所述的设备,其中所述设备是专用集成电路设备。
18.根据权利要求1所述的设备,其中所述点积是人工神经网络操作的一部分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于脸谱公司,未经脸谱公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110494255.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:具有换向机构的车辆传动系部件
- 下一篇:基于EPDM橡胶的高温压敏胶粘剂