[发明专利]动态常量更新机制在审
| 申请号: | 202010936286.X | 申请日: | 2020-09-08 |
| 公开(公告)号: | CN113095996A | 公开(公告)日: | 2021-07-09 |
| 发明(设计)人: | M·阿波达卡;J·费特;D·西米尼;T·罗克斯;K·莱维特-格瑞维奇 | 申请(专利权)人: | 英特尔公司 |
| 主分类号: | G06T1/20 | 分类号: | G06T1/20 |
| 代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 陈依心;何焜 |
| 地址: | 美国加利*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 动态 常量 更新 机制 | ||
本申请公开了动态常量更新机制。一种用于促进对着色器数据常量的更新的装置。该装置包括一个或多个处理器,用于检测着色器程序中的一个或多个数据常量的变化,在着色器程序的执行期间生成包括经更新的常量数据的微代码块,并且将微代码块传送至着色器程序。
背景技术
图形处理单元(GPU)通常用于执行包括可编程着色器的图形应用以实现各种着色算法。这些着色器被驱动器编译为机器代码以生成针对特定平台的计算内核(kernel)(或内核)。然而,这种编译是计算昂贵的并且典型地发生在场景初始化期间。当所编译的内核稍后被执行时,可能存在驱动器或应用可能需要转发给内核的经更新的数据以改变行为(例如,以向着色器提供动态输入)。常规机制通过用数据重新编译内核来提供动态输入。然而,此类解决方案引发中央处理单元(CPU)(例如,跟踪、重新编译)和GPU(例如,指令高速缓存未命中)两者的损失。
附图说明
为了以能够详细理解本发明的以上记载特征的方式,可通过参考实施例来对以上简要概括的本发明进行更具体的描述,这些实施例中的一些在所附附图中被图示。然而,应注意的是,附图仅展示本发明的典型的实施例,且因此将不被视为限制其范围,因为本发明可以承认其他等效实施例。
图1是根据实施例的处理系统的框图;
图2A-图2D图示由本文中描述的实施例提供的计算系统和图形处理器;
图3A-图3C图示由实施例提供的附加的图形处理器和计算加速器架构的框图;
图4是根据一些实施例的图形处理器的图形处理引擎的框图;
图5A-图5B图示根据实施例的包括在图形处理器核中采用的处理元件阵列的线程执行逻辑500;
图6图示根据实施例的附加执行单元600;
图7是图示根据一些实施例的图形处理器指令格式的框图;
图8是根据另一个实施例的图形处理器的框图;
图9A和图9B图示根据一些实施例的图形处理器命令格式和命令序列;
图10图示根据一些实施例的用于数据处理系统的示例性图形软件架构;
图11A-图11D图示根据实施例的集成电路封装组件;
图12是图示根据实施例的示例性芯片上系统集成电路的框图;
图13A和图13B是图示附加的示例性图形处理器的框图;
图14图示采用动态更新机制的计算设备的一个实施例;
图15图示内核堆的一个实施例;
图16图示常量变化的一个实施例;以及
图17是图示用于执行动态更新的过程的一个实施例的流程图。
具体实施方式
在以下描述中,陈述许多具体细节以提供对本发明的更透彻理解。然而,将对本领域技术人员显而易见的是,可在没有这些特定细节中的一个或多个细节的情况下实施本发明。在其他实例中,未描述公知的特征以避免使本发明模糊。
在实施例中,在着色器程序的执行期间,在确定存在经更新的数据后,经更新的常量被嵌入微代码块。在进一步的实施例中,微代码块利用跳转指令被流送到着色器程序,并且被执行以在着色器程序中实现经更新的常量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010936286.X/2.html,转载请声明来源钻瓜专利网。





