[发明专利]用于部分波前合并的方法和系统在审
申请号: | 201810758486.3 | 申请日: | 2018-07-11 |
公开(公告)号: | CN110716750A | 公开(公告)日: | 2020-01-21 |
发明(设计)人: | 朱韵鹏;吉姆歇德·米尔扎 | 申请(专利权)人: | 超威半导体公司;ATI科技无限责任公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F9/38;G06T1/20;G06T1/60 |
代理公司: | 31263 上海胜康律师事务所 | 代理人: | 樊英如;邱晓敏 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 寄存器 合并 工作项 管理器 单指令多数据 向量处理 不活动 统一 复制 检测 移动 分配 访问 | ||
描述了用于部分波前合并的方法和系统。向量处理机器采用所述部分波前合并将部分波前合并成一个或多个波前。所述系统包括部分波前管理器和统一寄存器。所述部分波前管理器检测在不同的单指令多数据(“SIMD”)单元中的包含不活动工作项和活动工作项的波前(以下称为“部分波前”),将所述部分波前移动到一个或多个SIMD单元中并将所述部分波前合并成一个或多个波前。所述统一寄存器允许在所述一个或多个合并的波前中的每个活动工作项访问原始SIMD单元中的先前分配的寄存器。因此,所述统一寄存器的内容不必被复制到执行所述一个或多个合并的波前的所述SIMD单元。
背景技术
向量处理机器,诸如图形处理单元(GPU)、通用图形处理单元 (GPGPU)和类似机器,使用或包括被配置为根据单指令多数据 (“SIMD“)范式执行计算的一个或多个并行处理单元。在这些类型的机器中,某一数量的工作项构成波前(wavefront),该波前在一个SIMD 单元中运行。
部分波前是包括一些不活动工作项的波前。部分波前在应用中常见,并导致构成SIMD单元的资源的利用率降低。例如,OpenCl内核可以具有复杂的分支模式。在一些情况下,一些工作项在一个分支下执行,同时剩余工作项不活动。在另一情况下,一些工作项在一个分支下执行,而其他一些工作项在另一分支下执行。分支可以具有不同的执行时间,这导致具有更短执行时间的工作项不活动,同时具有更长执行时间的工作项正在执行。
附图说明
可从结合附图以举例的方式给出的以下描述中获得更详细的了解,在附图中:
图1是根据某些实现方式的示例装置的框图;
图2是根据某些实现方式的图1的装置的框图;
图3是根据某些实现方式的具有统一寄存器和部分波前管理器的系统的框图;
图4是根据某些实现方式的用于图3中所示的系统的部分波前合并的流程图;和
图5是根据某些实现方式的具有统一寄存器和部分波前管理器 的另一系统的框图;和
图6是根据某些实现方式执行部分波前合并的系统600的框图。
具体实现方式
本文描述的是用于部分波前合并的方法和系统。向量处理机器采用部分波前合并将部分波前合并成一个波前,其中部分波前包括一些不活动工作项。这导致在单指令多数据(“SIMD”)单元中的计算资源的更高利用率,诸如算术逻辑单元(ALU)利用率。系统包括部分波前管理器和统一寄存器结构。在实现方式中,统一寄存器结构是单一寄存器结构。在实现方式中,单一寄存器结构由多个寄存器组成。在实现方式中,统一寄存器结构包括多个寄存器,其中每个寄存器与ALU 或SIMD相关联。在实现方式中,每个这样的寄存器由多个寄存器组成。例如但不限于,统一寄存器结构可以是通用寄存器(GPR)。部分波前管理器检测在不同的单指令多数据(“SIMD”)单元中的包含不活动工作项和活动工作项的波前(以下称为“部分波前”),将部分波前移动到适当数量的SIMD中并将部分波前合并成一个或多个波前。统一寄存器结构允许合并的波前的部分波前中的每个活动工作项访问原始SIMD单元中先前分配的寄存器。因此,先前分配的寄存器的内容不必被复制到执行合并的波前的SIMD。这与软件解决方案形成对比,在软件解决方案中,活动工作的状态必须从一个线程移动到另一线程。
图1是可以实现本公开的一个或多个特征的示例装置100的框图。装置100可以包括例如计算机、游戏装置、手持式装置、机顶盒、电视机、移动电话或平板计算机。装置100包括处理器102、存储器 104、存储装置106、一个或多个输入装置108以及一个或多个输出装置110。装置100还可以任选地包括输入驱动器112和输出驱动器114。应理解的是,装置100可以包括图1中未示出的附加部件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于超威半导体公司;ATI科技无限责任公司,未经超威半导体公司;ATI科技无限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810758486.3/2.html,转载请声明来源钻瓜专利网。