[发明专利]使用SIMD指令进行高效的直接卷积在审
申请号: | 201880066852.7 | 申请日: | 2018-09-06 |
公开(公告)号: | CN111213125A | 公开(公告)日: | 2020-05-29 |
发明(设计)人: | J·R·戴蒙德;A·P·帕特尔 | 申请(专利权)人: | 甲骨文国际公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 罗亚男 |
地址: | 美国加*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 simd 指令 进行 高效 直接 卷积 | ||
1.一种系统,包括:
处理器,被配置为对向量执行卷积,其中,为了对所述向量执行卷积,所述处理器被配置为执行多个向量指令,其中所述多个向量指令中的每个向量指令被配置为对多个具有多个数据位的数据通道执行运算,并且其中所述多个向量指令被配置为:
加载多个源向量,其中,为了加载所述多个源向量,所述多个向量指令被配置为加载中心向量、从所述向量的第一数据通道之前的一个或多个数据通道开始的多个数据通道的左向量、以及从所述向量的第一数据通道之后的一个或多个数据通道开始的多个数据通道的右向量;以及
生成一个或多个输出向量,其中,为了生成所述一个或多个输出向量,所述多个向量指令被配置为将通过用于所述卷积的相应加权值缩放的所述多个源向量中的每个源向量与所述一个或多个输出向量相加。
2.如权利要求1所述的系统,其中,为了加载左向量和右向量,所述多个向量指令被配置为:
加载所述向量之前紧邻的先前向量;
加载所述向量之后紧邻的后续向量;
执行向量提取指令,以使用所述先前向量和所述向量生成左向量;以及
执行其他向量提取指令,以使用所述向量和所述后续向量生成右向量。
3.如权利要求2所述的系统,其中,所述向量提取指令被配置为:
将第一向量寄存器与第二向量寄存器级联以产生中间结果;
将所述中间结果左移多个通道;以及
生成包含所述中间结果的上部的输出向量。
4.如权利要求1所述的系统:
其中,所述多个向量指令还被配置为加载用于所述卷积的多个加权值的一个或多个加权向量;以及
其中,为了将通过用于所述卷积的相应加权值缩放的所述多个源向量中的每个源向量与所述一个或多个输出向量中的特定输出向量相加,所述多个向量指令包括针对所述多个源向量中的每个源向量的向量缩放指令,每个源向量的向量缩放指令被配置为:
从所述一个或多个加权向量中的指定的加权向量的指定通道加载用于所述卷积的相应加权值;
将所述多个源向量中的一个源向量的多个数据通道中的每个通道乘以所述相应加权值以生成经缩放的向量;
将经缩放的向量与所述一个或多个输出向量中的所述特定输出向量相加。
5.如权利要求1所述的系统,其中,对所述向量的所述卷积实现步幅值,其中,在针对要包括的每个数据通道的卷积中要省略的数据通道的值基于所述步幅值,并且其中,为了加载所述多个源向量,所述多个向量指令被配置为:
加载所述向量之前紧邻的先前向量;
加载所述向量之后紧邻的后续向量;
执行向量提取指令,以使用所述先前向量、所述向量和所述后续向量生成第一中间向量和第二中间向量;和
执行向量混洗指令,以使用所述第一中间向量和所述第二中间向量加载左向量;
执行向量混洗指令,以使用所述向量和所述后续向量加载中心向量和右向量。
6.如权利要求1所述的系统,其中,所述卷积是多维卷积,并且其中,所述一个或多个输出向量包括多个输出向量。
7.如权利要求1所述的系统,其中,所述处理器被配置为执行所述卷积作为卷积神经网络的一部分。
8.一种方法,包括:
由包括实现向量指令的处理器的计算机对向量执行卷积,包括:
加载多个源向量,包括中心向量、包括从所述向量的第一数据通道之前的一个或多个数据通道开始的数据通道的左向量、以及包括从所述向量的第一数据通道之后的一个或多个数据通道开始的数据通道的右向量;以及
生成包括所述多个源向量的加权和的一个或多个输出向量,其中,生成所述一个或多个输出向量包括:将通过用于所述卷积的相应加权值缩放的所述多个源向量中的每个源向量与所述一个或多个输出向量相加;以及
其中向量指令是对一个或多个数据寄存器操作的指令,所述一个或多个数据寄存器包括多个数据通道,每个数据通道包括多个数据位。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于甲骨文国际公司,未经甲骨文国际公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880066852.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:局部用组合物和治疗方法
- 下一篇:用于蓄存用于机动车的电能的蓄存装置