[发明专利]具有通用寄存器资源管理的矢量处理器有效
申请号: | 201710061694.3 | 申请日: | 2017-01-26 |
公开(公告)号: | CN108364251B | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 朱韵鹏;吉姆歇德·米尔扎 | 申请(专利权)人: | 超威半导体公司;ATI科技无限责任公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06T1/20;G06F9/30 |
代理公司: | 上海胜康律师事务所 31263 | 代理人: | 樊英如;张华 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 具有 通用 寄存器 资源管理 矢量 处理器 | ||
本发明涉及一种具有通用寄存器资源管理的矢量处理器。一种用于在矢量处理器的计算单元中分配寄存器的方法包括:确定将在计算单元处由内核的多个线程同时使用的寄存器的最大数目。该方法还包括基于所确定的寄存器的最大数目与在计算单元处实现的物理寄存器的总数的比较来设置在计算单元处的寄存器分配的模式。
技术领域
本发明涉及计算机领域,更具体而言,涉及一种具有通用寄存器资源管理的矢量处理器。
背景技术
图形处理单元(GPU)和其它矢量处理器通常采用多个计算单元,每一计算单元具有一个或多个算术逻辑单元(ALU),以并行执行着色器或其它计算内核的对应的多个线程。每个计算单元提供一组物理通用寄存器(GPR),其可以被分配给线程以在计算单元处执行线程期间使用。然而,在计算单元中实现的每个物理GPR消耗相应量的功率。更复杂的着色器或内核通常需要大量的GPR,因此确保足够数量的物理GPR可用于支持这种复杂的计算内核可导致过多的功率消耗,以及需要相当大的模具底面空间(die floorspace)来实现。相反,如果考虑到功率和地面空间限制而使用较少数量的GPR,则处理器通常在可并行执行的线程的数量方面相应地受到限制,这可导致相对低的ALU占用。
发明内容
在本发明的一个方面,提供了一种用于在矢量处理器的计算单元中分配寄存器的方法,所述方法可以包括:确定要由所述计算单元处的内核的多个线程同时使用的寄存器的最大数目;以及基于所确定的寄存器的最大数目与在所述计算单元处实现的物理寄存器的总数的比较,在所述计算单元处设置寄存器分配的模式。
在本发明的另一个方面,提供了一种矢量处理器,其可以包括:成组的一个或多个计算单元,每个计算单元包括:成组的物理寄存器;成组的算术逻辑单元(ALU);和寄存器资源管理器,其用于确定要由所述计算单元处的内核的多个线程同时使用的寄存器的最大数目,以及基于所确定的寄存器的最大数目与在所述计算单元处实现的物理寄存器的总数的比较,在所述计算单元处设置寄存器分配的模式。
在本发明的又一个方面,提供了一种用于矢量处理器的计算单元中的物理寄存器管理的方法,所述方法可以包括:监控在所述计算单元处实现的成组的物理寄存器中的每个物理寄存器的分配状态;响应于识别其中所述成组的物理寄存器中的每个物理寄存器被分配给在所述计算单元处执行的内核的对应线程的超额预订条件;选择虚拟寄存器模式和线程暂停模式中的一个;响应于选择所述虚拟寄存器模式并且响应于来自所述内核的线程的对分配寄存器的请求,实例化所述矢量处理器的存储器层级中的虚拟寄存器并将所述虚拟寄存器分配给所述线程;以及响应于选择所述线程暂停模式并且响应于来自所述内核的线程的对分配寄存器的请求,暂停所述线程的执行,直到所述成组的物理寄存器中的物理寄存器变得可用于分配。
附图说明
通过参考附图,本公开可以被更好地理解,并且其许多特征和优点对于本领域技术人员而言是显而易见的。在不同的附图中使用相同的附图标记表示相似或相同的项目。
图1是根据一些实施方式的利用具有超额预订支持(oversubscriptionsupportion)的GPR资源管理的矢量处理器的框图。
图2是示出根据一些实施方式的图1的矢量处理器的GPR资源管理器的用于设置GPR分配的模式的操作方法的流程图。
图3是示出根据一些实施方式的根据重新捕获分配模式的GPR分配的方法的流程图。
图4是示出根据一些实施方式的根据线程初始化分配模式的GPR分配的方法的流程图。
图5是示出根据一些实施方式的图2的GPR资源管理器的在处于GPR超额预订状态时的操作方法的流程图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于超威半导体公司;ATI科技无限责任公司,未经超威半导体公司;ATI科技无限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710061694.3/2.html,转载请声明来源钻瓜专利网。