[发明专利]GPU中一种染色片段调度管理的硬件加速实现方法有效
申请号: | 201810797837.1 | 申请日: | 2018-07-19 |
公开(公告)号: | CN108958921B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 吴兴涛;石小刚;黄光新 | 申请(专利权)人: | 南京军微半导体科技有限公司 |
主分类号: | G06F9/48 | 分类号: | G06F9/48;G06T1/20 |
代理公司: | 合肥禾知知识产权代理事务所(特殊普通合伙) 34246 | 代理人: | 卢双双 |
地址: | 210000 江苏省南京市江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | gpu 一种 染色 片段 调度 管理 硬件加速 实现 方法 | ||
本发明公开了GPU中一种染色片段调度管理的硬件加速实现方法,它涉及GPU设计领域。包括以下步骤:1、染色片段的寄存器配置;2、预判控制;3、输入数据打包;4、存储控制;5、状态控制。本发明可以提高GPU内部像素染色单元的处理性能,并达到节省资源的目的,且该方法支持可配置、可扩展的多通道光栅化后的片段调度任务;最大效率地提升像素染色器的工作效率,并节省硬件设计资源。
技术领域
本发明涉及的是GPU设计领域,具体涉及GPU中一种染色片段调度管理的硬件加速实现方法。
背景技术
染色片段的调度管理是可编程流水线设计实现的GPU中一个重要问题。它的快慢直接影响了像素染色器的效率,从而影响了整个图形管线或者图像管线输出像素的快慢。传统调度染色片段方法采用调度固定行,并通过总线仲裁实现1对1的调度。这样实现的缺点是:
1、传统调度方式未考虑处理器线程使用情况,调度完成数据通过总线仲裁方式完成调度从而给总线带来压力,出现总线频繁请求导致切换带来的功耗问题,并且调度效率低下。
2、由于光栅化后输出的染色片段的每一行数据根据图元的不同,数据量大小不同,同时处理器对不同数据的处理时间存在差异。如果采用最后通过总线仲裁方式完成调度,会导致每一个处理器的使用没有达到100%,最终导致处理器内部线程过饱和,有的处理器线程过饥饿,从而导致像素染色效率低下。
综上所述,本发明设计了GPU中一种染色片段调度管理的硬件加速实现方法。
发明内容
针对现有技术上存在的不足,本发明目的是在于提供GPU中一种染色片段调度管理的硬件加速实现方法,可以提高GPU内部像素染色单元的处理性能,并达到节省资源的目的,且该方法支持可配置、可扩展的多通道光栅化后的片段调度任务;最大效率地提升像素染色器的工作效率,并节省硬件设计资源。
为了实现上述目的,本发明是通过如下的技术方案来实现:GPU中一种染色片段调度管理的硬件加速实现方法,包括以下步骤:1、染色片段的寄存器配置;2、预判控制;3、输入数据打包;4、存储控制;5、状态控制。
作为优选,所述的步骤1为了实现将光栅化后2个通道内的数据调度到1个CCU(像素处理器管理单元)中的4个GCU(像素处理器)中,同时完成2个GCU处理一个通道数据。并且为了避免调度后的片断数据经过像素染色处理后输出出现先后顺序颠倒问题,约定通道0的数据调度到GCU0和GCU2,通道1的数据调度到GCU1和GCU3,调度管理器中的寄存器配置模块可以完成根据处理器的处理能力不同而调整调度管理器的工作参数,以最大发挥处理器的能力。
作为优选,所述的步骤2采用预判控制模块,所述的预判控制模块需要根据光栅化输出的数据的坐标X值以及对应数据属性0来判断这是数据的第一个,并检测该X值参数,具体数值可以根据调度管理器中寄存器配置模块来同步调整,如果处理器的最大工作线程为16,那么需要检测X值对应的第4位来判断应该将该片段调度到哪一个处理器中。
作为优选,所述的步骤3采用输入数据打包单元,完成统计输入到每一个存储FIFO模块中的光栅化片段的数量,每当检测到数据属性为0时,数据个数就加1,如果检测到数据个数已经满足了接收从坐标开始所带属性数据的处理器最大线程调度单位的数据后,就停止接收光栅化的数据,并将最后一个数据多发送一次作为结束标记。
作为优选,所述的步骤4采用存储控制模块,存储控制模块的内部设计4个同步FIFO,一方面可以存放指定到GCU0、GCU1、GCU2、GCU3的数据,同时可以提高光栅化的工作效率,不至于调度缓慢而导致光栅化停止。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京军微半导体科技有限公司,未经南京军微半导体科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810797837.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种分布式任务调度方法及系统
- 下一篇:用于执行任务的方法和装置