[发明专利]用于跨步访问的系统、装置和方法在审
申请号: | 201680067042.4 | 申请日: | 2016-12-15 |
公开(公告)号: | CN108351782A | 公开(公告)日: | 2018-07-31 |
发明(设计)人: | E·乌尔德-阿迈德-瓦尔;S·赛尔;J·哈 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/345 | 分类号: | G06F9/345 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 李炜;黄嵩泉 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 索引 覆写 寄存器 掩码 置换 方法和装置 索引寄存器 方法描述 结构阵列 数据元素 源寄存器 访问 指令 传递 保留 | ||
描述了用于跨步访问的系统、方法和装置。在一些实施例中,多个寄存器被加载有来自结构阵列的数据。随后,利用写掩码,以索引值来覆写置换操作中不需要的数据元素。寄存器现在包含数据和索引值的混合。当该相同的写掩码被传递到将索引寄存器覆写为目的地的置换指令时,数据值被保留,并且以如由索引值所控制的来自另两个源寄存器的数据来覆写这些索引值。
技术领域
本发明的领域总体上关于计算机处理器架构,更具体地关于当被执行时导致特定结果的指令的集合。
背景技术
为了效率而一类用户代码改变涉及消除存储器聚集-分散操作的使用。此类不规则的存储器操作会增加等待时间(latency)和带宽使用两者,并且限制编译器向量化的范围。一些应用可受益于将以结构阵列(AOS)表示编写的数据结构转换为阵列结构(SOA)表示的数据布局改变。
附图说明
在所附附图中以示例方式而非限制方式说明本发明,在附图中,类似的附图标记指示类似的要素,其中:
图1图示用于从四个寄存器聚集某个数据类型的元素的指令的执行的实施例。
图2图示由处理器执行以从四个紧缩数据寄存器聚集元素的方法的实施例;
图3图示用于从四个寄存器聚集某个数据类型的元素的指令的执行的实施例;
图4图示由处理器执行以从四个紧缩数据寄存器聚集元素的方法的实施例;
图5图示用于从三个寄存器聚集某个数据类型的元素的指令的执行的实施例;
图6图示由处理器执行以从三个紧缩数据寄存器聚集元素的方法的实施例;
图7示出用于利用用于5个双型的跨步5(Stride5)结构的聚集指令将AoS结构转换为SoA格式的序列的实施例。
图8图示用于AOS至SOA转换的软件序列的实施例;
图9图示使用移动和置换指令进行AOS至SOA转换的实施例;
图10图示用于使用加载和置换指令进行的AOS至SOA转换的示例性代码;
图11图示使用移动和置换指令进行的AOS至SOA转换的实施例;
图12图示用于使用加载和置换指令进行的AOS至SOA转换的示例性代码;
图13A-图13B是图示根据本发明的实施例的通用向量友好指令格式及其指令模板的框图;
图14A-图14D是图示根据本发明的实施例的示例性专用向量友好指令格式的框图;
图15是根据本发明的一个实施例的寄存器架构1500的框图;
图16A是示出图示本发明的实施例的示例性有序流水线和示例性的寄存器重命名的乱序发布/执行流水线的框图。
图16B是图示根据本发明的实施例的要包括在处理器中的有序架构核的示例性实施例和示例性的寄存器重命名的乱序发布/执行架构核的框图;
图17A-图17B图示更具体的示例性有序核架构的框图,该核将是芯片中的若干逻辑块(包括相同类型和/或不同类型的其他核)中的一个逻辑块;
图18是根据本发明的实施例可具有多于一个核、可具有集成存储器控制器、以及可具有集成图形器件的处理器1800的框图;
图19-图22是示例性计算机架构的框图;以及
图23是根据本发明的实施例的对照使用软件指令转换器将源指令集中的二进制指令转换成目标指令集中的二进制指令的框图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680067042.4/2.html,转载请声明来源钻瓜专利网。