[发明专利]一种处理器、介质和处理器的操作方法有效
申请号: | 201910559688.X | 申请日: | 2019-06-25 |
公开(公告)号: | CN111381880B | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 艾伦·格雷汉姆·亚历山大;西蒙·克里斯蒂安·诺尔斯;马杜拉·戈尔 | 申请(专利权)人: | 图核有限公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F9/38 |
代理公司: | 深圳鹰翅知识产权代理有限公司 44658 | 代理人: | 周婧;黃幸兒 |
地址: | 英国布*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 处理器 介质 操作方法 | ||
本申请公开一种处理器、介质和处理器的操作方法,其中一种具有指令集的处理器,该指令集包括具有操作数的加载‑存储指令,该操作数在至少一个寄存器文件中的寄存器之中指定两个加载操作中的每一个的相应目的地、存储操作的相应源,以及布置为保持三个存储器地址的地址寄存器对,该三个存储器地址是该两个加载操作中的每一个的相应加载地址和存储操作的相应存储地址。加载‑存储指令还包括三个立即步长操作数,每个指定一个存储地址和该两个加载地址中的每一个的相应步长值,其中每个立即步长操作数的至少一些可能值通过指定该一个或多个寄存器文件其中一个中的步长寄存器内的多个字段之一来指定该相应步长值,每个字段保持不同的步长值。
技术领域
本公开涉及具有高语义密度(semantic density)的加载-存储指令形式。
背景技术
对开发为特定应用而设计的处理器(例如图形处理器(GPU)及数字信号处理器(DSP))的兴趣正在上升。另一类最近受到关注的特定于应用的处理器是专用于机器智能应用的处理器,其被申请人命名为“IPU”(智能处理单元)。这些处理器可以被采用为例如加速器处理器,该加速器处理器布置为执行主机分配的工作,例如训练或帮助训练知识模型,例如神经网络,或者执行或帮助执行基于这种模型的预测或推断。
机器智能算法是基于对“知识模型”执行迭代更新,这可以由多个互连节点的图形表示。每个节点表示其输入的函数。一些节点接收对图形的输入,一些接收来自一个或多个其他节点的输入,而一些节点的输出形成其他节点的输入,一些节点的输出提供图形的输出(在一些情况下,给定节点甚至可能具有以下全部:对图形的输入、来自图形的输出和对其他节点的连接)。此外,由一个或多个相应参数(例如权重)对每个节点的函数进行参数化。在学习级期间,目标是基于经验输入数据集,找到各个参数的值,使得图形作为整体针对可能输入范围而生成期望的输出。用于这样做的各种算法在本领域中是已知的,例如基于随机梯度下降(stochastic gradient descent)的反向传播算法(back propagationalgorithm)。在基于输入数据的多次迭代中,逐渐调整参数以减少它们的误差,并且因此图形收敛于解(solution)。在随后的阶段,学习的模型然后可以用于对在给定的指定输入集的情况下对输出进行预测,或者在给定的指定输出集的情况下对输入(原因)进行推断。
设计为用于机器智能应用的处理器可以在其指令集中包括专用指令,用于执行机器智能应用中常用的算术操作(指令集是处理器的执行单元配置为识别的基本机器代码指令类型集,每个类型由相应的操作码和零个或更多个操作数定义)。例如,机器智能应用(例如神经网络)中所需的常见操作是在输入数据集上进行内核(kernel)的卷积(convolution),其中内核表示神经网络中节点的权重。为了在数据上进行大尺寸内核的卷积,可以将卷积分成多个向量或矩阵积,每个积(product)输出拟与后续积的输出累加的部分和。已经存在一些处理器,这些处理器在其指令集中包括专用于执行向量和矩阵乘法类型操作的算术指令,以用于执行卷积。
发明内容
相较于较简单、较传统的算术指令类型(例如加法、乘法等),这些类型的算术指令在单一指令中包含大量语义内容(即,每个指令执行大量逻辑)。然而,为了伴随这种复杂的指令或操作,还期望在指令集中提供加载-存储指令,其在单一指令中包含高浓度的语义信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于图核有限公司,未经图核有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910559688.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:灯具单元
- 下一篇:PIN二极管中的高效散热