[发明专利]有损稀疏加载SIMD指令族在审
申请号: | 201980072070.9 | 申请日: | 2019-06-26 |
公开(公告)号: | CN113168324A | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 圣查理·森;德里克·艾伦·阿古仁;约瑟夫·利·格雷特豪斯 | 申请(专利权)人: | 超威半导体公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F9/38;G06N3/063 |
代理公司: | 上海胜康律师事务所 31263 | 代理人: | 李献忠;张华 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 有损 稀疏 加载 simd 指令 | ||
1.一种系统,其包括:
多个处理元件;以及
控制逻辑;
其中所述控制逻辑被配置为:
确定在一个或多个输入向量操作数中包括多少非零值;
响应于确定所述一个或多个输入向量操作数中非零值的数量大于或等于第一阈值,致使所述多个处理元件处理所述一个或多个输入向量操作数;并且
响应于确定非零值的所述数量小于所述第一阈值,致使所述多个处理元件跳过所述一个或多个输入向量操作数的处理;
其中所述系统被配置为通过处理一个或多个第一输入向量操作数并且跳过一个或多个第二输入向量操作数的处理来执行给定应用程序。
2.如权利要求1所述的系统,其中所述给定应用程序是用于生成第一数据集的分类的神经网络实现方式,并且其中所述系统被配置为通过跳过与神经网络的一个或多个层的所述一个或多个第二输入向量操作数相关联的所述处理来减少实现所述神经网络时的功耗和执行时间中的至少一者。
3.如权利要求1所述的系统,其中非零值是大于第二阈值的绝对值。
4.如权利要求3所述的系统,其中所述第一阈值和所述第二阈值是能够基于神经网络的错误容限来编程的。
5.如权利要求3所述的系统,其中所述系统被配置为将所述第一阈值和所述第二阈值设置为基于神经网络的错误容限的值。
6.如权利要求1所述的系统,其中由所述多个处理元件执行的所述处理包括矩阵乘法运算,以用于将第一组输入向量操作数与第二组输入向量操作数相乘。
7.如权利要求1所述的系统,其中所述控制逻辑还被配置为:响应于确定给定输入向量操作数中非零值的所述数量小于所述第一阈值,将处理所述给定输入向量操作数的指令的程序计数器偏移存储在跳过队列中。
8.一种方法,其包括:
通过联接到多个处理元件的控制逻辑确定在一个或多个输入向量操作数中包括多少非零值;
响应于确定所述一个或多个输入向量操作数中非零值的数量大于或等于第一阈值,致使所述多个处理元件处理所述一个或多个输入向量操作数;
响应于确定非零值的所述数量小于所述第一阈值,致使所述多个处理元件跳过所述一个或多个输入向量操作数的处理;以及
通过处理一个或多个第一输入向量操作数并且跳过一个或多个第二输入向量操作数的处理来执行给定应用程序。
9.如权利要求8所述的方法,其中所述给定应用程序是用于生成第一数据集的分类的神经网络实现方式,其中所述方法还包括:通过跳过与神经网络的一个或多个层的所述一个或多个第二输入向量操作数相关联的所述处理来减少实现所述神经网络时的功耗和执行时间中的至少一者。
10.如权利要求8所述的方法,其中非零值是大于第二阈值的绝对值。
11.如权利要求10所述的方法,其中所述第一阈值和所述第二阈值是能够基于神经网络的错误容限来编程的。
12.如权利要求10所述的方法,其还包括:将所述第一阈值和所述第二阈值设置为基于神经网络的错误容限的值。
13.如权利要求8所述的方法,其中由所述多个处理元件执行的所述处理包括矩阵乘法运算,以用于将第一组输入向量操作数与第二组输入向量操作数相乘。
14.如权利要求8所述的方法,其还包括:响应于确定给定输入向量操作数中非零值的所述数量小于所述第一阈值,将处理所述给定输入向量操作数的指令的程序计数器偏移存储在跳过队列中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于超威半导体公司,未经超威半导体公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980072070.9/1.html,转载请声明来源钻瓜专利网。