[发明专利]用于部分波前合并的方法和系统在审
申请号: | 201810758486.3 | 申请日: | 2018-07-11 |
公开(公告)号: | CN110716750A | 公开(公告)日: | 2020-01-21 |
发明(设计)人: | 朱韵鹏;吉姆歇德·米尔扎 | 申请(专利权)人: | 超威半导体公司;ATI科技无限责任公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F9/38;G06T1/20;G06T1/60 |
代理公司: | 31263 上海胜康律师事务所 | 代理人: | 樊英如;邱晓敏 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 寄存器 合并 工作项 管理器 单指令多数据 向量处理 不活动 统一 复制 检测 移动 分配 访问 | ||
1.一种处理系统,其包括:
多个处理单元,每个处理单元执行构成为波前的多个工作项;
部分波前管理器,其与所述多个处理单元中的每个通信;和
统一寄存器结构,其与所述多个处理单元中的每个通信,
其中所述部分波前管理器:
检测在不同处理单元中的是部分波前的波前,其中部分波前包括不活动工作项和活动工作项;
将所述部分波前移动到一个或多个处理单元中;和
将所述部分波前合并成一个或多个合并的波前,和
其中在所述一个或多个合并的波前中的每个工作项在所述一个或多个合并的波前的执行期间访问在所述统一寄存器结构中的先前分配的寄存器空间。
2.如权利要求1所述的处理系统,其还包括:
通信网络,其与所述统一寄存器结构和所述多个处理单元通信。
3.如权利要求2所述的处理系统,其中所述统一寄存器结构是多个寄存器,并且每个处理单元包括连接到所述通信网络的寄存器。
4.如权利要求1所述的处理系统,其中所述统一寄存器结构是多个寄存器,并且每个处理单元包括连接到通信网络的至少一个寄存器,所述通信网络连接到所述多个处理单元。
5.如权利要求1所述的处理系统,其中所述部分波前管理器针对每个波前记录:
哪些波前正在共享给定程序;
执行掩码,以识别所述活动工作项;和
程序计数器,以指示正在执行哪个指令。
6.如权利要求5所述的处理系统,其中所述部分波前管理器还确定所述活动工作项的总数量是否超过相对于波前可以执行的最大工作项数量。
7.如权利要求5所述的处理系统,其中所述部分波前管理器还确定与共享所述给定程序的所述波前相关联的程序计数器是否在某一阈值内。
8.如权利要求5所述的处理系统,其中所述部分波前管理器还使所述部分波前的所述程序计数器同步到某一同步阈值内。
9.一种用于改善处理系统中的波前处理的方法,所述方法包括:
从多个处理单元中确定部分波前,其中每个处理单元正在执行构成为波前的多个工作项,并且其中部分波前包括不活动工作项和活动工作项;
将所述部分波前移动到一个或多个处理单元中;和
将所述部分波前合并成一个或多个合并的波前,
其中在所述合并的波前中的每个工作项在所述一个或多个合并的波前的执行期间访问在统一寄存器结构中的先前分配的寄存器空间。
10.如权利要求9所述的方法,所述方法还包括:
经由通信网络在所述多个处理单元和所述统一寄存器结构之间进行通信。
11.如权利要求10所述的方法,其中所述统一寄存器结构是多个寄存器,并且每个处理单元包括连接到所述通信网络的至少一个寄存器。
12.如权利要求9所述的方法,其中所述确定部分波前还包括:
针对每个波前记录:
哪些波前正在共享给定程序;
执行掩码,以识别所述活动工作项;和
程序计数器,以指示正在执行哪个指令。
13.如权利要求12所述的方法,其中所述确定部分波前还包括:
确定所述活动工作项的总数量是否超过相对于波前可以执行的最大工作项数量。
14.如权利要求13所述的方法,其中所述确定部分波前还包括:
确定与共享所述给定程序的所述波前相关联的程序计数器是否在某一阈值内。
15.如权利要求14所述的方法,所述方法还包括:
使所述部分波前的所述程序计数器同步到某一同步阈值内。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于超威半导体公司;ATI科技无限责任公司,未经超威半导体公司;ATI科技无限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810758486.3/1.html,转载请声明来源钻瓜专利网。