[发明专利]机器学习加速器的功率减小在审
申请号: | 202180023299.0 | 申请日: | 2021-03-08 |
公开(公告)号: | CN115298669A | 公开(公告)日: | 2022-11-04 |
发明(设计)人: | 马克西姆·V·卡扎科夫;塞缪尔·劳伦斯·瓦斯蒙特 | 申请(专利权)人: | 超威半导体公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N3/08;G06N3/04 |
代理公司: | 上海胜康律师事务所 31263 | 代理人: | 李献忠;张华 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器 学习 加速器 功率 减小 | ||
1.一种用于执行神经网络操作的方法,所述方法包括:
识别第一矩阵图块和第二矩阵图块;
获取所述第一矩阵图块的第一范围信息和所述第二矩阵图块的第二范围信息;
基于所述第一范围信息和所述第二范围信息选择矩阵乘法路径;以及
使用所选择的矩阵乘法路径对所述第一矩阵图块和所述第二矩阵图块执行矩阵乘法,以生成图块矩阵乘法乘积。
2.根据权利要求1所述的方法,其中:
所述第一图块是神经网络的层的输入的一部分,并且所述第二图块是所述神经网络的所述层的权重矩阵的一部分。
3.根据权利要求2所述的方法,所述方法还包括:
通过分析所述层的输入来自动生成所述第一范围信息。
4.根据权利要求1所述的方法,其中选择所述矩阵乘法路径包括从一组两个或更多个矩阵乘法路径中选择所述矩阵乘法路径,其中每个矩阵乘法路径被配置为针对一组不同的输入范围执行矩阵乘法运算。
5.根据权利要求2所述的方法,其中所述层包括通用神经元层。
6.根据权利要求5所述的方法,其中所述第一矩阵图块和所述第二矩阵图块的所述矩阵乘法包括分批通用神经元层操作的一部分。
7.根据权利要求2所述的方法,其中所述层包括卷积层。
8.根据权利要求7所述的方法,其中针对包括多个滤波器切口的一组范围元数据块存储范围信息。
9.根据权利要求8所述的方法,其中获取所述第一范围信息包括检索由其生成所述第一图块的范围元数据块的范围。
10.一种用于执行神经网络操作的系统,所述系统包括:
一组矩阵乘法路径;以及
图块矩阵乘法器,所述图块矩阵乘法器被配置为:
识别第一矩阵图块和第二矩阵图块;
获取所述第一矩阵图块的第一范围信息和所述第二矩阵图块的第二范围信息;
基于所述第一范围信息和所述第二范围信息选择所述一组乘法路径中的矩阵乘法路径;以及
使用所选择的矩阵乘法路径对所述第一矩阵图块和所述第二矩阵图块执行矩阵乘法,以生成图块矩阵乘法乘积。
11.根据权利要求10所述的系统,其中:
所述第一图块是神经网络的层的输入的一部分,并且所述第二图块是所述神经网络的所述层的权重矩阵的一部分。
12.根据权利要求11所述的系统,所述系统还包括:
神经网络处理块,所述神经网络处理块被配置为通过分析所述层的输入来自动生成所述第一范围信息。
13.根据权利要求11所述的系统,其中每个矩阵乘法路径被配置为针对一组不同的输入范围执行矩阵乘法运算。
14.根据权利要求11所述的系统,其中所述层包括通用神经元层。
15.根据权利要求14所述的系统,其中所述第一矩阵图块和所述第二矩阵图块的所述矩阵乘法包括分批通用神经元层操作的一部分。
16.根据权利要求11所述的系统,其中所述层包括卷积层。
17.根据权利要求16所述的系统,其中针对包括多个滤波器切口的一组范围元数据块存储范围信息。
18.根据权利要求17所述的系统,其中获取所述第一范围信息包括检索由其生成所述第一图块的范围元数据块的范围。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于超威半导体公司,未经超威半导体公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202180023299.0/1.html,转载请声明来源钻瓜专利网。