[发明专利]具有多个着色器引擎的处理单元有效
| 申请号: | 201080049825.2 | 申请日: | 2010-09-03 |
| 公开(公告)号: | CN102598061A | 公开(公告)日: | 2012-07-18 |
| 发明(设计)人: | M·曼托;R·C·泰勒;J·T·布雷迪 | 申请(专利权)人: | 先进微装置公司 |
| 主分类号: | G06T15/00 | 分类号: | G06T15/00 |
| 代理公司: | 北京戈程知识产权代理有限公司 11314 | 代理人: | 程伟;王锦阳 |
| 地址: | 美国加利*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 具有 着色 引擎 处理 单元 | ||
技术领域
本发明通常针对在计算机系统中实施的计算操作。更具体而言,本发明是针对在计算机系统执行计算操作的处理单元。
背景技术
图形处理单元(GPU)是一种适用于执行图形处理任务的复杂集成电路(integrated circuit)。举例而言,GPU能依终端使用者应用所需的执行图形处理任务,例如视讯游戏(video-game)。此GPU可以是离散的(即分散)装置及/或包装件或也可能包含在相同装置内及/或包装件中如另一个处理器(如,CPU)。举例而言,GPU常集成于路由或桥接装置,举例而言,如北桥装置。在上述例子中,所述终端使用者应用与GPU间有多层的软件。所述终端使用者应用是与应用编程接口(API)相连接。API可使终端使用者应用以标准化格式输出图形数据及命令,而不是取决于GPU的格式。市售API有几种类型,包含由微软(Microsoft Corporation of Redmond)开发的DirectX、Khronos集团发表的Washington and OpenGL。所述API是与驱动程序相连接。所述驱动程序将从API所接收的标准程序码转换为可被GPU理解的指令的本机格式。所述驱动程序通常由GPU的制造商写入,接着GPU执行自驱动程序产生的指令。
藉由GPU所执行的图形处理任务,其通常涉及复杂的数学运算,如矩阵或向量的运算。为了有效的执行这些运算,GPU通常包含处理组件的阵列,称之为着色器引擎。处理组件的阵列被组织为一种单一指令多重数据(SIMD)装置。所述着色器引擎执行指令的顺序,称之为着色器程序。所述必需执行着色器程序的数据是平行分散于着色器引擎中的不同处理组件。不同处理组件可能在不同的数据片段执行相同的操作。因此,GPU可以比典型的中央处理单元(CPU)更快的执行图形处理任务所需的复杂数学计算。
过去,GPU必需包含不同的着色器引擎以执行完成单一图形处理任务所需的不同着色器程序。举例而言,单一图形处理任务可能需要至少两个不同的着色器程序的执行:用于操作三角形的顶点的顶点着色器;以及用于决定即将显示于显示装置(如,电脑萤幕)上的像素的像素着色器。为了执行这两组计算,典型的GPU包含两个不同的着色器引擎:(i)第一着色器引擎,用于执行所述顶点着色器;以及(ii)第二着色器引擎,用于执行所述像素着色器。
最近,GPU已经被设计成含有一整合着色器引擎。整合着色器引擎包含能执行数个不同类型的着色器程序的处理组件的阵列。整合着色器引擎,举例而言,可利用在整合着色器的处理组件的阵列之间重复循环的每一个着色器,而不是在管线中不同着色器引擎中进行的方式,来执行顶点着色器、几何着色器及像素着色器。除了典型的图形处理任务(如,顶点着色器、几何着色器、像素着色器等)之外,整合着色器引擎最近也可用于执行通用计算操作(如,数学算法、物理模拟等)。
为了保持竞争力,GPU的计算能力必需不断增加以跟上顾客的需求及API与终端使用者应用的要求。一种增加GPU的计算能力的方式为增加着色器引擎的阵列中的处理组件的数量。然而,为了要提供数据及工作负荷给数量已增加的处理组件,馈送处理组件的输入/输出总线也必须相对的增加,此举仅是为了维持GPU现有的效能。
为解决GPU的计算能力增加的问题,可能的方法为增加着色器引擎中的SIMD的宽度。然而,这个解决方法会有SIMD分歧的问题。当SIMD装置上有不同线程采取着色器程序的分支指令(branch instruction)中的不同方向运行时,则会发生SIMD分歧。举例而言,着色器程序可能具有如表1所示的分支指令。会发生SIMD分歧,举例而言,若运行于SIMD装置的第一线程输入分支指令的“then”段(如,operation 1),且行于SIMD装置的第二线程运输入分支指令的“else”段(如,operation 2)。在此条件下,所述第二线程(输入“else”段)将必须等待第一线程(输入“if”语句)。与SIMD分歧有关的等待需耗费着色器程序额外的时间来执行。由于SIMD分歧潜在的问题,若想增加GPU的计算能力,单纯增加SIMD的宽度可能不是一个可行的选择。
表1.
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于先进微装置公司,未经先进微装置公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201080049825.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:垂直整合的处理腔室
- 下一篇:用于向网站访客提供目标内容的方法和装置





