[发明专利]具有单指令多数据处理电路的数据处理装置有效
| 申请号: | 201410320577.0 | 申请日: | 2014-07-07 |
| 公开(公告)号: | CN104281437B | 公开(公告)日: | 2018-09-18 |
| 发明(设计)人: | 大卫·雷蒙德·鲁茨;内尔·伯吉斯 | 申请(专利权)人: | ARM有限公司 |
| 主分类号: | G06F9/30 | 分类号: | G06F9/30 |
| 代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 李晓冬 |
| 地址: | 英国*** | 国省代码: | 英国;GB |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 具有 指令 多数 处理 电路 数据处理 装置 | ||
本发明涉及具有单指令多数据处理电路的数据处理装置。该数据处理装置具有:置换电路,执行用来改变至少一个源操作数的数据元素尺寸或数据元素位置的置换操作,以生成第一和第二SIMD操作数;以及SIMD处理电路,对第一和第二SIMD操作数执行SIMD操作。响应于需要置换操作的第一SIMD指令,指令解码器控制置换电路执行置换操作,以生成第一和第二SIMD操作数,然后控制SIMD处理电路使用这些操作数执行SIMD操作。响应于不需要置换操作的第二SIMD指令,指令解码器控制SIMD处理电路使用由该指令识别的第一和第二SIMD操作数执行SIMD操作,而不需要使它们经过置换电路。
技术领域
本发明涉及数据处理领域。更具体地,本发明涉及具有单指令多数据(SIMD)处理电路的数据处理装置。
背景技术
一种数据处理装置可以具有用于对包含多个数据元素的第一操作数和第二操作数执行SIMD操作的SIMD处理电路。SIMD处理电路具有多个并行的处理的通道(lane),这些通道各自对第一操作数和第二操作数的相应数据元素执行特定操作。例如,第一操作数和第二操作数各自可以包括32位数据值,每个操作数包括4个8位数据元素。SIMD加法操作可以对各对8位数据元素并行执行4组8位加法。
有时,数据元素出现在操作数内的顺序可能与将由SIMD操作结合的数据元素的顺序不同,因此,在执行SIMD操作之前对数据元素执行一些重新排列可能是必要的。本技术试图提高这种重新排列的实现,来提高SIMD处理操作的性能。
发明内容
从一个方面来看,本发明提供了一种数据处理装置,包括:
单指令多数据(SIMD)处理电路,被配置为对包括多个数据元素的第一SIMD操作数和第二SIMD操作数执行SIMD操作,该SIMD处理电路具有多个用于处理第一SIMD操作数和第二SIMD操作数的相应数据元素的并行处理通道;
置换电路,被配置为对包括多个源数据元素的至少一个源操作数执行置换操作,以生成所述第一SIMD操作数和所述第二SIMD操作数,所述置换操作生成所述第一SIMD操作数和所述第二SIMD操作数中的至少一个,所述第一SIMD操作数和所述第二SIMD操作数中的所述至少一个与所述至少一个源操作数具有不同数据元素尺寸和不同数据元素位置中的至少一种;以及
指令解码器,被配置为对需要由SIMD处理电路执行SIMD操作的SIMD指令进行解码;
其中,响应于需要置换操作和识别所述至少一个源操作数的第一SIMD指令,指令解码器被配置为控制置换电路对所述至少一个源操作数执行置换操作以生成第一SIMD操作数和第二SIMD操作数,并且,指令解码器被配置为控制SIMD处理电路使用由置换电路生成的第一SIMD操作数和第二SIMD操作数执行SIMD操作;并且
响应于不需要置换操作和识别第一SIMD操作数和第二SIMD操作数的第二SIMD指令,指令解码器被配置为控制SIMD处理电路使用由第二SIMD指令识别的第一SIMD操作数和第二SIMD操作数执行SIMD操作,而不需要使第一SIMD操作数和第二SIMD操作数经过置换电路。
现有的SIMD处理单元通常具有用于对两个输入操作数执行重新排列操作以生成与这些输入操作数相比具有不同数据元素顺序的SIMD操作数的初始阶段,以便后续的处理阶段然后可以对所重新排列的操作数执行SIMD操作。即使不需要重新排列,这些输入操作数将仍经过重新排列阶段,而不改变这些数据元素的位置。然而,这通常意味着需要两个处理周期来执行所有的SIMD操作,一个用于执行重新排列,另一个用于执行SIMD操作本身。第一周期主要专用于对输入操作数的数据元素进行复用,以便这些数据元素正确对齐以进行第二周期或进一步处理周期中的SIMD操作。然而,本技术的发明人意识到,对于许多SIMD指令,这种排列周期是不必要的。然而,在传统的装置中,所有的SIMD指令都要为元素重新排列付出代价。因此,大多数现有SIMD操作需要比它们需要执行的更多的周期。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于ARM有限公司,未经ARM有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410320577.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:高效送风口
- 下一篇:用于旋转式汽车前滑柱双工位装配台





