[发明专利]聚合分散指令在审
申请号: | 201680072596.3 | 申请日: | 2016-11-18 |
公开(公告)号: | CN108369517A | 公开(公告)日: | 2018-08-03 |
发明(设计)人: | A·杰哈;E·乌尔德-阿迈德-瓦尔;R·凡伦天;M·J·查尼;M·B·吉尔卡尔 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/38 | 分类号: | G06F9/38;G06F15/80 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 何焜;黄嵩泉 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 聚合 存储位置 数据元素 存储器接口 存储器 解码 指令 处理器 存储 起始存储器地址 存储数据结构 数据结构指定 解码器 存储操作 第一位置 指令描述 寄存器 可访问 响应 | ||
描述了聚合分散指令。处理器可以包括存储器接口和用于存储数据结构的数据元素的寄存器。数据元素可以连续地存储在经由存储器接口可访问的存储器中的第一位置中。处理器可以进一步包括用于对为数据结构指定存储操作的聚合分散指令进行解码的解码器以及用于响应于经解码的聚合分散指令将数据元素连续地存储到存储器中的第二存储位置的执行单元。第二存储位置可以由第二存储位置的起始存储器地址标识。
本公开涉及处理器的领域,并且更具体地涉及处理器中的聚合分散指令。
背景技术
为了改善多媒体应用以及具有类似特性的其他应用的效率,微处理器系统中的单指令多数据(SIMD)架构使一个指令能并行地对若干操作数进行操作。具体而言,SIMD架构利用将许多数据元素紧缩在一个寄存器或连续存储器位置内的优势。利用并行硬件执行,由一个指令对分开的数据元素执行多个操作。
附图简述
通过下文给出的具体实施方式并通过本公开的各实施例的附图,将更完整地理解本公开的各实施例。然而,不应当认为这些附图将本公开限制为特定实现方式,而是这些附图仅用于说明和理解。
图1是示出根据一个实施例的实现聚合分散指令的计算系统的框图。
图2示出了根据一个实施例的执行聚合分散指令的方法的示图。
图3A示出了根据一个实施例的示例单指令多数据(SIMD)聚合分散指令。
图3B进一步示出了根据一个实施例的示例单指令多数据(SIMD)聚合分散指令。
图4A是示出根据一个实施例的实现聚合分散操作的处理器的微架构的框图。
图4B是示出根据一个实施例的有序流水线以及寄存器重命名级、乱序发布/执行流水线的框图。
图5示出了根据一个实施例的包括用于执行聚合分散操作的逻辑电路的处理器的微架构的框图。
图6是根据一个实施例的计算机系统的框图。
图7是根据另一实施例的计算机系统的框图。
图8是根据一个实施例的芯片上系统的框图。
图9示出了根据一个实施例的计算系统的框图的另一实现方式。
图10示出了根据一个实现方式的计算系统的框图的另一实现方式。
具体实施方式
处理器可以使用单指令多数据(SIMD)指令集来并行地执行多个操作。处理器可以并行地执行多个操作,同时地将操作应用到同一个数据片或多个数据片。在涉及不规则存储器访问模式的应用中难以获得SIMD性能提高。例如,存储要求对可能或可能不存储在连续存储器位置中的数据元素的频繁和随机的更新的数据表的应用通常要求对数据的重新布置以便完全地利用SIMD硬件。对数据的重新布置可能产生大量开销,从而限制从SIMD硬件获得的效率。
随着SIMD向量宽度增加(即,对其执行单个操作的数据元素的数量),应用开发者(和编译者)发现,由于与重新布置存储在非连续存储器存储中的数据元素相关联的开销,完全地利用SIMD硬件是日益困难的。因此,需要更高效地处置SIMD架构中的非连续存储器访问模式。
SIMD指令集可以包括用于执行分散操作的指令以及聚集(gather)指令。聚集指令是从存储器读取数据元素集合并将它们紧缩在一起(可能紧缩在单个寄存器或高速缓存行中)的指令。当要被读取的数据元素在存储器中分散(非连续)时,聚集指令的有用性尤其明显。聚集指令从集合(例如,结构体(struct))的每个数据元素的存储器中的非连续位置中读取数据元素并将其与集合的其他数据元素连续地存储以用于未来可访问性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680072596.3/2.html,转载请声明来源钻瓜专利网。