[发明专利]使用索引阵列和有限状态机的分散有效

专利信息
申请号: 201280072904.4 申请日: 2012-06-02
公开(公告)号: CN104303142B 公开(公告)日: 2019-03-08
发明(设计)人: Z·斯波伯;R·凡伦天;S·赖肯;S·什沃茨曼;G·奥菲尔;I·亚诺弗;G·帕特金;O·利维 申请(专利权)人: 英特尔公司
主分类号: G06F9/06 分类号: G06F9/06;G06F9/30;G06F9/305
代理公司: 上海专利商标事务所有限公司 31100 代理人: 张欣
地址: 美国加利*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 使用 索引 阵列 有限状态机 分散
【说明书】:

公开了使用索引阵列和有限状态机进行分散/聚集操作的方法和装置。装置的实施例可包括:解码逻辑,用于解码分散/聚集指令并生成微操作。索引阵列保持一组索引和相应的一组掩码元素。有限状态机促成分散操作。地址生成逻辑至少针对具有第一值的每个相应掩码元素从该组索引中的索引生成地址。在缓冲器中为所生成的该组地址中的每个地址分配存储。将对应于所生成的该组地址的数据元素复制到缓冲器。如果相应的掩码元素具有所述第一值,则访问该组中的地址以存储数据元素,并且响应于其相应存储的完成,掩码元素被改变为第二值。

技术领域

本公开一般涉及计算和/或通信领域。具体而言,本公开涉及响应于和/或为了支持分散/聚集操作而使用索引阵列和有限状态机。

背景技术

目前的诸多处理器通常包括用于提供计算密集型操作但提供高度数据并行性的指令,这些指令可通过使用多种数据存储设备的高效实现来使用,这些数据存储设备诸如:单指令多数据(SIMD)向量寄存器。

对于一些应用,例如针对诸如三维(3D)图像渲染之类的操作,存储器访问可能是复杂的、不一致的、或不连续的。向量化过程所使用的存储器可能并非总是连续的或者处于毗邻存储器位置。多种架构可能需要额外的指令来在执行任何算术运算之前对寄存器中的数据进行排序,这最小化了指令吞吐量并显著增加了所需时钟周期的数量。

用于改善存储器访问和对往来于更宽向量的数据进行排序的机制可包括实现聚集和分散操作,以针对来自其他非本地和/或不连续的存储器位置的数据产生本地连续存储器访问。聚集操作可从存储装置中的一组不连续或随机的存储器位置收集数据,并将不同的数据组合到打包结构中。分散操作可将打包结构中的元素散开至一组不连续或随机的存储器位置。

另外,这些存储器位置中的一些可能未被高速缓存,或可能已经被移出物理存储器的页。如果聚集操作由于页故障或一些其他原因而中断,在一些架构下,机器的状态可能未保存,从而需要重复整个聚集操作,而不是在聚集操作中断之处重新开始。由于在任一聚集操作上可能需要多次存储器访问,所以可能需要许多时钟周期来完成,任何后续的依赖算术运算必须等待该聚集操作完成。这样的延迟代表瓶颈,该瓶颈会限制例如从宽或大宽度向量架构原本预期的性能优势。

用于改进存储器访问并对往来于较宽向量的数据进行排序的替换机制可包括使用计算机中的不同存储器芯片向或从数据向量并行地加载或存储分开的字。再次,这些存储器位置中的一些可能已经被移出物理存储器的页,且因此重启因页故障或其他某些原因而中断的操作仍然存在问题,但这次,加载或存储可并行地执行。于是,按正确次序解决此类故障可能是困难的或者要求串行化,并且所有加载或存储可能需要在解决此类故障之前完成。

一些机制可包括使用完成掩码来实现聚集和分散以分别跟踪个体加载和存储的完成,但用于向量寄存器和完成掩码的物理寄存器存储可能更靠近具有用于执行SIMD类型算术的宽数据路径的执行单元而非例如用于访问存储器的地址生成逻辑。在此类情形中,从向量寄存器中的个体数据元素生成用于访问非本地和/或不连续的存储器位置的地址并跟踪个体完成掩码也会减少执行宽SIMD类型聚集或分散操作所期望的益处。

到目前为止,尚未充分探索针对这样的性能受限问题和瓶颈的潜在解决方案。

附图说明

在附图的各图中通过示例而非限制地示出本发明

图1示出响应于和/或为了支持分散和/或聚集操作而使用索引阵列和有限状态机的计算系统的一个实施例。

图2示出响应于和/或为了支持分散和/或聚集操作而使用索引阵列和有限状态机的处理器的一个实施例。

图3A示出根据一个实施例的用于提供向量分散和/或聚集功能的指令编码。

图3B示出根据另一个实施例的用于提供向量分散和/或聚集功能的指令编码。

图3C示出根据另一个实施例的用于提供向量分散和/或聚集功能的指令编码。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201280072904.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top