[发明专利]向量友好指令格式及其执行有效
| 申请号: | 201510464707.2 | 申请日: | 2011-09-30 |
| 公开(公告)号: | CN104951277B | 公开(公告)日: | 2017-11-21 |
| 发明(设计)人: | R·C·凡伦天;J·C·三额詹;R·E·桑斯;R·D·凯文;B·L·托尔;S·G·杜兰;J·G·韦德梅耶;S·萨姆德若拉;M·B·吉尔卡尔;E·T·格罗科斯基;J·C·哈尔;D·R·布拉德福德;E·乌尔德-阿迈德-瓦尔;J·C·阿贝尔;M·查尼;S·阿布拉罕;S·赛尔;A·T·福塞斯;C·扬特;L·吴 | 申请(专利权)人: | 英特尔公司 |
| 主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F9/06;G06F9/305 |
| 代理公司: | 上海专利商标事务所有限公司31100 | 代理人: | 何焜 |
| 地址: | 美国加利*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 向量 友好 指令 格式 及其 执行 | ||
1.一种计算装置,包括:
处理器,被配置为用于执行按照指令格式的指令,其中,所述指令格式具有多个字段,所述多个字段包括数据元素宽度(W)字段和写掩码字段,其中,所述指令格式支持不同的向量操作的指定,其中,所述向量操作中的每一个生成包括在不同的数据元素位置处的多个数据元素的目的地向量操作数,其中,所述指令格式通过所述数据元素宽度字段中的不同的值支持不同的数据元素宽度的指定,其中,所述指令格式通过所述写掩码字段中的不同的值支持从所指定的向量操作所得到的所述数据元素中的哪些是否在所述目的地向量操作数的相应数据元素位置中被反映的指定,其中,保留能够在所述写掩码字段中的所述不同的值中的一个,用于指示所指定的向量操作的全部结果将要在所述目的地向量操作数的相应数据元素位置中被反映,其中,能够在所述写掩码字段中的所述不同的值中的其他值区分存储能配置写掩码的不同的写掩码寄存器,且其中,在按照所述指令格式的指令的每次发生时,所述数据元素宽度字段和所述写掩码字段能够各自存储仅一个值。
2.如权利要求1所述的计算装置,其特征在于,所述数据元素宽度包括32比特或64比特数据元素宽度。
3.如权利要求1所述的计算装置,其特征在于,所述写掩码寄存器是至少64比特。
4.如权利要求1所述的计算装置,其特征在于,由所述不同的向量操作生成的所述目的地向量操作数是512比特。
5.如权利要求1到4中的任何一项所述的计算装置,其特征在于,所述写掩码的单个比特被用于所述目的地向量操作数的所述数据元素位置中的每一个。
6.如权利要求1所述的计算装置,其特征在于,所述写掩码寄存器的低16比特被用于带有32比特数据元素的512比特向量,且所述写掩码寄存器的低8比特被用于带有64比特数据元素的512比特向量。
7.如权利要求1所述的计算装置,其特征在于,对两个源操作数和所述目的地向量操作数的所述不同的向量操作操作中的至少某些不覆写所述两个源操作数中的任一个。
8.如权利要求1所述的计算装置,其特征在于,所述不同的向量操作中的至少某些对两个源操作数操作,且所述目的地向量操作数覆写所述两个源操作数中的一个。
9.如权利要求1所述的计算装置,其特征在于,保留不反映所指定的向量操作的所述目的地向量操作数的数据元素位置中的所述数据元素。
10.如权利要求1所述的计算装置,其特征在于,所述指令格式还包括写掩码控制字段,其中所述指令格式通过所述写掩码控制字段中的不同的值支持执行归并写掩码操作还是执行归零写掩码操作。
11.如权利要求10所述的计算装置,其特征在于,所述不同的数据元素宽度包括8比特、16比特、32比特或64比特数据元素宽度。
12.如权利要求10所述的计算装置,其特征在于,所述指令格式还包括实际操作码字段,其中所述指令格式通过所述实际操作码字段中的不同的值支持:对于每次发生,所述数据元素宽度字段的内容在64比特与32比特数据元素尺寸之间选择还是在16比特与8比特数据元素尺寸之间选择。
13.如权利要求10所述的计算装置,其特征在于,用于所述发生的数据元素宽度区分哪些数据元素位置对应于所述能配置写掩码的哪些比特。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510464707.2/1.html,转载请声明来源钻瓜专利网。





