[发明专利]用于对数据字内的数据进行重新定位的可重配置设备有效
| 申请号: | 201180076085.6 | 申请日: | 2011-12-30 |
| 公开(公告)号: | CN104011617B | 公开(公告)日: | 2018-03-30 |
| 发明(设计)人: | A·阿加瓦尔;S·徐;R·克里西那莫西 | 申请(专利权)人: | 英特尔公司 |
| 主分类号: | G06F1/00 | 分类号: | G06F1/00;G06F13/14;G06F9/06 |
| 代理公司: | 上海专利商标事务所有限公司31100 | 代理人: | 姬利永 |
| 地址: | 美国加利*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 数据 进行 重新 定位 配置 设备 | ||
技术领域
所公开的技术涉及平行数据重新定位电路,并且更具体地涉及以可选择的子字(sub-word)长度对数据执行置换、移位、和轮转功能。
背景
为了继续在消费者中流行,移动及其他设备中的微处理器必须在各种任务下运行良好。微处理器的某些最繁重的功能包括视频处理、图形处理、高质量音频处理、以及实时数据处理,所有这些对消费者而言都很重要。这些应用都具有高数据吞吐量要求,这转换为高功率要求,而同时,平台还要求低功率预算,以便最大化电池寿命。
许多微处理器指令集架构包括单指令多数据(SIMD)处理指令,其在多段数据上执行相同的指令、或指令集。这种指令比要求每个数据部分具有其自己的指令更高效。许多这些指令集架构包括子字平行整数/浮点算术向量指令,诸如AVX和SSE指令集。这些指令集通过在低精度数据上并行地执行若干操作,改善这种数据密集型应用的性能。SIMD架构常用于处理这种指令的高吞吐量需求。这些指令集中的关键数据功能包括置换、移位、和轮转,所有这些是被构造成用于执行SIMD指令的特殊化硬件的功率及性能关键组件。
现有的电路中的典型移位/轮转单元具有固定的操作数位宽度和并行度。然而,位宽度和并行度的配置对不同的应用具有不同的要求。一种处理各种应用的要求的方法是具有包括用于多个平行数据宽度中的每一个的单独移位器的移位/轮转电路,然而,这导致可观的面积和泄露功率开销。
图1是包括具有不同宽度的多个移位器的常规设计的移位/轮转设备的功能框图。移位/轮转系统100包括一系列四个移位/轮转电路110、112、114、和116,每个电路包括64位的数据字宽度。64位数据字可配置用于32位、16位、和8位的子字尺寸。同时,移位/轮转系统100可操纵高达256位。
如图1所见,基于所选择的子字的宽度在移位/轮转电路中选择特定的移位器。例如,如果子字具有8位宽度,那么八个8位移位器用于执行所选择的移位/轮转动作。如果代替子字具有32位的宽度,则使用两个32位移位器。
例如,参考图2,假定操作是将32位子字向右轮转19位距离。使用常规的移位/轮转系统,诸如图1的系统100,会首先使用解复用器将32位子字加载到移位/轮转电路110的32位移位器之一中。然后,执行轮转命令并且32位移位器将数据向右轮转19个位置。最终使用4:1复用器将所轮转的数据发送到输出。不在本操作中使用移位/轮转电路110的8位和16位移位器。因而,移位/轮转系统100不仅较大而且包括很少使用的若干组件,导致可观的面积和泄露功率开销。
本发明实施例解决了现有技术中的这些和其他限制。
附图简要说明
通过举例而非通过限制在附图中示出本发明实施例,并且在附图中,相似的附图标记指代相似的元素。
图1是常规设计的移位/轮转设备的功能框图。
图2是示出图1的移位/轮转设备中的移位操作的框图。
图3是根据本发明实施例的置换/移位/轮转设备的功能框图。
图4是示出图3的置换/移位/轮转设备中的移位操作的框图。
图5是示出根据本发明实施例的置换/移位/轮转设备的置换部分的附加细节的功能框图。
图6是示出根据本发明实施例的置换/移位/轮转设备的移位部分的附加细节的功能框图。
图7是示出根据本发明实施例的图6的移位设备的移位部分之一的附加细节的功能框图。
图8是示出根据本发明实施例的图7所示移位部分之一的一个级的进一步的细节的功能框图。
图9是可实现本发明实施例的计算机系统的功能框图。
详细说明
图3是根据本发明实施例的置换/移位/轮转设备的功能框图。置换/移位/轮转设备300包括置换部分310和移位/轮转部分350。为了简明,置换/移位/轮转设备300在此被称为数据操纵设备300,置换部分310被称为置换器310,并且移位/轮转部分350在此被称为移位器350,不管移位器350是在移位功能还是在轮转功能上操作,以下详细描述这两者。
置换器310包括32个单独的置换电路,每个具有8位粒度。换言之,8个位同时移动。在图3所示的实施例中,置换器310是265位宽度,其可跨32个8位子字执行任意置换。
移位器350包括八个8位移位器362的四个单独的实例,以及下述的控制和掩码电路372。对于总共256位,移位器350的每个实例在八个8位移位器中处理64位,其匹配置换器310的数据路径尺寸。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180076085.6/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





