[发明专利]图形处理器单元管线中的条件执行位有效
| 申请号: | 200810135197.4 | 申请日: | 2008-08-15 |
| 公开(公告)号: | CN101441761A | 公开(公告)日: | 2009-05-27 |
| 发明(设计)人: | 泰森·J·伯兰格;克雷格·M·奥克鲁丽卡 | 申请(专利权)人: | 辉达公司 |
| 主分类号: | G06T1/20 | 分类号: | G06T1/20;G06F9/38;G06F7/57 |
| 代理公司: | 北京律盟知识产权代理有限责任公司 | 代理人: | 王允方 |
| 地址: | 美国加利*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图形 处理器 单元 管线 中的 条件 执行 | ||
相关美国申请案
本申请案涉及T.博格兰(T.Bergland)等人于2007年8月15日申请的第11/893,499号美国专利申请案,标题为“在图形处理器单元管线中缓冲解串行化的像素数据”(Buffering Deserialized Pixel Data in a Graphics Processor Unit Pipeline)且代理人案号为NVID-P003219,该申请案转让给本发明的受让人,且其全文在此以引用的方式并入本文中。
本申请案涉及T.博格兰(T.Bergland)等人于2007年8月15日申请的第11/893,622号美国专利申请案,标题为“图形处理器单元管线中的共用的可读取且可写入的总值”(Shared Readable and Writeable Global Values in a Graphics Processor Unit Pipeline)且代理人案号为NVID-P003476,该申请案转让给本发明的受让人,且其全文在此以引用的方式并入本文中。
技术领域
本发明的实施例大体上涉及计算机图形。
背景技术
近年来在计算机性能方面的进步已令图形系统能够使用个人计算机、家庭电子游戏计算机、手持装置等来提供更加真实的图形图像。在此类图形系统中,执行若干程序,以便将图元渲染或绘制到系统的屏幕。图元是图形的基本组成部分,例如是点、线、多边形等。所渲染的图像由这些图元的组合形成。可利用许多程序来执行三维(3-D)图形渲染。
已经研发出专用的图形处理单元(GPU),以提高图形渲染程序的执行速度。GPU通常并入有一个或一个以上渲染管线。每一渲染管线包含若干经设计以用于高速执行图形指令/数据的基于硬件的功能单元。一般来说,将指令/数据馈送到管线前端,且计算出的结果出现在管线后端。GPU的基于硬件的功能单元、高速缓冲存储器、固件等经设计以对基本图元进行操作,并产生实时渲染的3-D图像。
人们越来越关注于在例如手机、个人数字助理(PDA)和其它装置等便携或手持装置中渲染3-D图形图像。然而,便携或手持装置通常相对于例如台式计算机等更大的装置来说具有限制。举例来说,因为便携装置通常用电池供电,所以功率消耗成了人们关 注的一个问题。此外,由于其尺寸较小,所以便携装置内部的可用空间有限。需要在手持装置中在此类装置的限制内快速地执行真实的3-D图形渲染。
发明内容
本发明的实施例提供用于在图形处理器单元管线中快速且高效地处理数据的方法和系统。
用于一像素群组的像素数据沿着图形管线共同前进到算术逻辑单元(ALU)。在ALU中,以SIMD(单个指令、多个数据)的方式向一群组中的所有像素应用同一指令。举例来说,在给定的时钟循环中,指令将指定从用于所述像素群组中的第一像素的像素数据中选出的一组操作数。在下一时钟循环中,指令将指定从用于所述群组中的第二像素的像素数据中选出的另一组操作数,依此类推。根据本发明的实施例,一条件执行位与每一组操作数相关联。所述条件执行位的值确定ALU如何(是否)处理相应组的操作数。
一般来说,如果一条件执行位被设置成不执行,那么ALU不对与所述条件执行位相关联的像素数据进行操作。更具体来说,在一个实施例中,如果条件执行位被设置成不执行,则ALU不锁存像素数据;此可通过将到ALU的输入触发器选通以使得所述触发器不在像素数据中计时来实现。因此,ALU不改变状态——ALU中的锁存器(触发器)保持处于其在前一时钟循环中所处的状态。通过不为触发器计时节省了功率,而且还因为对组合逻辑的输入保持不变且因此没有任何晶体管改变状态而节省了功率(触发器之所以不从一个状态过渡成另一个状态,是因为如果条件位被设置成不执行,那么操作数从一个时钟循环到下一时钟循环保持不变)。
总的来说,在一像素群组上应用指令,但可能不必对所述群组中的每一像素均执行所述指令。为了在管线中维持适当的次序,向群组中的每一像素应用所述指令——针对群组中的每一像素选择一组操作数。然而,如果与一组操作数相关联的条件执行位被设置成不执行,那么ALU不对那些操作数进行操作——不对操作数执行相关联的指令,而是改为复制下游操作数。因此,不必对触发器计时,且不必切换组合逻辑,因而节省了功率。由此,本发明的实施例非常适合于手持和其它便携的用电池操作的装置中的图形处理(但本发明不限于在那些类型的装置上使用)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辉达公司,未经辉达公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810135197.4/2.html,转载请声明来源钻瓜专利网。





