[发明专利]用于访问矩阵操作数的多变量跨步读取操作在审

专利信息
申请号: 202010589581.2 申请日: 2020-06-24
公开(公告)号: CN112445526A 公开(公告)日: 2021-03-05
发明(设计)人: 尼廷·N·加莱格拉特;托尼·L·魏纳;杰夫·德尔基亚罗;迈克尔·罗津;罗伯特·T·罗德斯;乌杰瓦尔·巴萨瓦拉杰·萨贾纳尔;安妮·Q·叶 申请(专利权)人: 英特尔公司
主分类号: G06F9/30 分类号: G06F9/30
代理公司: 北京东方亿思知识产权代理有限责任公司 11258 代理人: 姜飞
地址: 美国加利*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 访问 矩阵 作数 多变 跨步 读取 操作
【说明书】:

本申请涉及用于访问矩阵操作数的多变量跨步读取操作。在一个实施例中,矩阵处理器包括用于存储矩阵操作数和跨步读取序列的存储器,其中:矩阵操作数被乱序地存储在存储器中;并且跨步读取序列包括以正确的顺序从存储器中读取矩阵操作数的一系列读取操作。矩阵处理器还包括电路,用于:接收要由矩阵处理器执行的第一指令,其中,第一指令用于指示矩阵处理器对矩阵操作数执行第一操作;基于跨步读取序列从存储器中读取矩阵操作数;以及通过对矩阵操作数执行第一操作来执行第一指令。

技术领域

本公开总体上涉及矩阵处理系统的领域,并且更具体地但非排他地涉及用于从存储器中提取矩阵操作数的多变量跨步(strided)读取操作。

背景技术

训练人工神经网络和/或使用神经网络执行推理通常需要涉及复杂的矩阵算术(例如许多大的多维度矩阵操作数的矩阵乘法和卷积)的许多计算密集型操作。这些矩阵操作数的存储器布局对于神经网络的整体性能非常重要。在某些情况下,例如,以特定格式存储在存储器中的矩阵操作数可能需要被提取和/或转换为不同格式,以对基础矩阵元素执行某些操作。例如,为了执行某些神经网络操作,矩阵操作数的维度可能需要被重新排列(shuffled)或重新排序,或者矩阵操作数的某些部分可能需要被提取、切片(sliced)、修剪和/或重新排序。在许多计算架构中,这要求将原始矩阵操作数从存储器中完整地读取、转换为适当的格式或顺序、作为新的矩阵操作数存储回存储器中,然后进行操作。这种方法可能效率极低,因为它增大了处理延迟、存储器访问延迟和存储器利用率。

发明内容

根据本申请的一方面,提供了一种矩阵处理器,包括:存储器,用于存储矩阵操作数和跨步读取序列,其中:所述矩阵操作数被乱序地存储在所述存储器中;并且所述跨步读取序列包括用于以正确的顺序从所述存储器中读取所述矩阵操作数的读取操作序列;控制电路,用于接收要由所述矩阵处理器执行的第一指令,其中,所述第一指令用于指示所述矩阵处理器对所述矩阵操作数执行第一操作;读取电路,用于基于所述跨步读取序列从所述存储器中读取所述矩阵操作数;以及执行电路,用于通过对所述矩阵操作数执行所述第一操作来执行所述第一指令。

根据本申请的另一方面,提供了至少一种非暂态机器可访问存储介质,其上存储有指令,其中,所述指令在机器上被执行时使所述机器:接收要由矩阵处理器执行的第一指令,其中,所述第一指令用于指示所述矩阵处理器对矩阵操作数进行第一操作,其中,所述矩阵操作数被乱序地存储在所述矩阵处理器的存储器中;访问存储在所述存储器中的跨步读取序列,其中,所述跨步读取序列包括用于以正确的顺序从所述存储器中读取所述矩阵操作数的读取操作序列;基于所述跨步读取序列从所述存储器中读取所述矩阵操作数;以及使得所述第一指令由所述矩阵处理器执行,其中,所述第一指令要通过对所述矩阵操作数执行所述第一操作来执行。

根据本申请的又一方面,提供了一种方法,包括:接收要由矩阵处理器执行的第一指令,其中,所述第一指令用于指示所述矩阵处理器对矩阵操作数进行第一操作,其中,所述矩阵操作数被乱序地存储在所述矩阵处理器的存储器中;访问存储在所述存储器中的跨步读取序列,其中,所述跨步读取序列包括用于以正确的顺序从所述存储器中读取所述矩阵操作数的读取操作序列;基于所述跨步读取序列从所述存储器中读取所述矩阵操作数;以及使得所述第一指令由所述矩阵处理器执行,其中,所述第一指令要通过对所述矩阵操作数执行第一操作来执行。

根据本申请的再一方面,提供了一种系统,包括:主机处理器;以及矩阵处理器,包括:存储器,用于存储矩阵操作数和跨步读取序列,其中:所述矩阵操作数被乱序地存储在所述存储器中,并且所述跨步读取序列包括用于以正确的顺序从所述存储器中读取所述矩阵操作数的读取操作序列;控制电路,用于接收要由所述矩阵处理器执行的第一指令,其中,所述第一指令用于指示所述矩阵处理器对所述矩阵操作数执行第一操作,并且其中,所述第一指令是要从所述主机处理器接收的;读取电路,用于基于所述跨步读取序列从所述存储器中读取所述矩阵操作数;以及执行电路,用于通过对所述矩阵操作数执行所述第一操作来执行所述第一指令。

附图说明

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010589581.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top