[发明专利]用于执行向量位混洗的方法和装置有效
申请号: | 201580064635.0 | 申请日: | 2015-11-25 |
公开(公告)号: | CN107003852B | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | E·乌尔德-阿迈德-瓦尔;J·考博尔;R·凡伦天;M·J·查尼;G·索尔;R·艾斯帕萨 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F15/80 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 何焜 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 执行 向量 位混洗 方法 装置 | ||
1.一种处理器,包括:
解码器,用于解码向量位混洗指令,所述向量位混洗指令包括第一源操作数、第二源操作数和目的地操作数;
第一向量寄存器,由所述第一源操作数标识,用于存储多个源数据元素;
第二向量寄存器,由所述第二源操作数标识,用于存储多个控制元素,所述控制元素中的每一个对应于所述第一向量寄存器中的所述多个源数据元素中的不同的一个并且包括多个位字段,每个位字段对应于由所述目的地操作数标识的目的地掩码寄存器中的单个位位置,并且每个位字段进一步用于标识来自所述对应的源数据元素的会被复制到所述目的地掩码寄存器中的所述对应的单个位位置的恰好一个位;以及
向量位混洗逻辑,用于响应于经解码的向量位混洗指令、对于所述第二向量寄存器中的每个位字段,标识来自所述对应的源数据元素的恰好一个位,并且仅将来自所述对应的源数据元素的所标识的位复制到所述目的地掩码寄存器中的对应于所述位字段的单个位位置。
2.如权利要求1所述的处理器,其特征在于,所述源数据元素中的每一个包括64位数据元素,以及其中每个位字段包括至少6位以标识来自所述64位数据元素中的每一个的位。
3.如权利要求2所述的处理器,其特征在于,所述位字段中的每一个包括控制字节,以及其中6位选自所述控制字节中的每一个以标识来自所述64位数据元素中的每一个的每个位。
4.如权利要求3所述的处理器,其特征在于,来自每个数据元素的八位是通过使用所述控制字节中的八个而被选择的。
5.如权利要求4所述的处理器,其特征在于,来自每个数据元素的位会被串接在所述目的地掩码寄存器内。
6.如权利要求5所述的处理器,其特征在于,所述第一向量寄存器用于存储所述64位数据元素中的八个,以及其中所述目的地掩码寄存器用于存储选自所述八个64位数据元素的八个对应的8位值。
7.如权利要求6所述的处理器,其特征在于,所述掩码寄存器内的位用于为由所述处理器执行的一个或多个后续指令执行掩码操作。
8.一种用于指令执行的方法,包括:
解码向量位混洗指令,所述向量位混洗指令包括第一源操作数、第二源操作数和目的地操作数,其中所述第一源操作数用于标识用于存储多个源数据元素的第一向量寄存器并且所述第二源操作数用于标识用于存储多个控制元素的第二向量寄存器,所述控制元素中的每一个对应于所述第一向量寄存器中的所述多个源数据元素中的不同的一个并且包括多个位字段,每个位字段对应于由所述目的地操作数标识的目的地掩码寄存器中的单个位位置,并且每个位字段进一步用于标识来自所述对应的源数据元素的会被复制到所述目的地掩码寄存器中的所述对应的单个位位置的恰好一个位;以及
执行经解码的向量位混洗指令,包括对于所述第二向量寄存器中的每个位字段,标识来自所述对应的源数据元素的恰好一个位,并且仅将来自所述对应的源数据元素的所标识的位复制到所述目的地掩码寄存器中的对应于所述位字段的单个位位置。
9.如权利要求8所述的方法,其特征在于,所述源数据元素中的每一个包括64位数据元素,以及其中每个位字段包括至少6位以标识来自所述64位数据元素中的每一个的位。
10.如权利要求9所述的方法,其特征在于,所述位字段中的每一个包括控制字节,以及其中6位选自所述控制字节中的每一个以标识来自所述64位数据元素中的每一个的每个位。
11.如权利要求10所述的方法,其特征在于,来自每个数据元素的八位是通过使用所述控制字节中的八个而被选择的。
12.如权利要求11所述的方法,其特征在于,来自每个数据元素的位会被串接在所述目的地掩码寄存器内。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580064635.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于放射治疗的图像导引
- 下一篇:带进位的原子加法指令