[发明专利]跨越多核心系统动态分布多维工作集有效
| 申请号: | 201080060260.8 | 申请日: | 2010-12-13 |
| 公开(公告)号: | CN102792271A | 公开(公告)日: | 2012-11-21 |
| 发明(设计)人: | G.H.贝洛斯;J.马德鲁加;B.米诺;B.霍顿 | 申请(专利权)人: | 国际商业机器公司 |
| 主分类号: | G06F9/45 | 分类号: | G06F9/45;G06F9/48;G06F9/50 |
| 代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 张晓明 |
| 地址: | 美国纽*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 跨越 多核 系统 动态 分布 多维 工作 | ||
技术领域
本发明一般涉及多处理器数据处理系统,并且具体涉及配置有多个处理单元的数据处理系统上的操作。更具体地,本发明涉及用于跨越多核心数据处理系统的多个处理处理单元的分布式工作的竞争并行处理的方法和系统。
背景技术
先进的计算处理实现作为多维工作集的工作竞争。例如,在设计用于执行对于2或3维对象的操作的计算标准(例如,OpenCLTM)中提供N维(ND)范围命令,其使得要调度的多维工作集能够使用等于N维的索引空间,其中工作因而在该N维空间上重复(OpenCL是苹果公司的商标)。在这些用于跨越多维空间竞争工作的传统方法的情况下,存在固有的复杂性,使得非常难以有效地调度工作和/或有效地通信(跨越多维)调度和竞争哪个工作。
发明内容
从一个方面来看,本发明提供一种方法、计算机系统架构和计算机程序产品,用于数据处理系统中N维(ND)范围命令的有效分派/完成。所述方法包括:编译器从接收的程序指令生成一个或多个命令,其中所述一个或多个命令由运行时间调度程序利用,以便调度工作用于在数据处理系统内的一个或多个处理单元上执行;与编译器相关联的ND范围工作处理(WP)逻辑确定由编译器生成的命令何时将在ND范围的操作数上实施,以N维配置安排该ND范围的操作数,其中N大于一(1);当N大于一(1)时,将ND范围的操作数自动分解为包括P个顺序排序的工作项目的一(1)维工作元素,P个顺序排序的工作项目每个代表一维工作元素中ND范围的操作数之一;将单维工作元素放置在数据处理系统的命令队列的一个或多个条目内,其中一个或多个条目的每个以排序的顺序保持工作项目的1D阵列;以及实现来自命令队列的工作项目的1D阵列到一个或多个处理单元的顺序分派,其中分派工作项目的1D阵列用于以排序的顺序执行;并且通过将单维工作输出结果映射到对应于由单维工作项目代表的ND范围操作数的原始位置的ND位置,生成ND范围输出。
在检查以下附图和详细的书面描述时,要求保护的主题的其他系统、方法、功能、特征和优点将或将变得对于本领域的技术人员明显。
附图说明
参照附图,现在将仅作为示例描述本发明的实施例,附图中:
图1图示示例多节点、具有多个节点的分布式数据处理系统架构,每个节点具有多个处理器核心和本地存储器,其中可以实施描述的实施例的一个或多个特征;
图2图示具有两个处理节点的非统一存储器访问(NUMA)系统的现有技术实施,处理节点具有工作的预分布部分的本地工作队列,本地工作队列使用工作队列重新平衡算法周期性地重新平衡;
图3图示根据一个实施例的多核心、多节点处理系统的第一示例,该系统配置有具有与每个工作条目相关联的核准处理器单元(APU)掩码和与每个处理器核心相关联的处理器单元(PU)掩码的共享全局命令队列(GCQ),以便实现通过系统内的核准处理器核心的工作的选择性检索;
图4图示根据一个实施例的处理器核心的PU掩码与GCQ内工作元素的APU掩码的逻辑比较,以便确定允许哪些处理器核心检索来自工作元素的工作项目;
图5图示根据一个实施例的工作请求操作,其中通过其PU掩码匹配工作元素的APU掩码的处理器核心,从工作元素顺序检索工作项目;
图6A-6D提供根据一个实施例的框图的序列,其表现具有APU掩码的示例全局命令队列,并且图示随着由一个或多个预先选择的处理器核心从用于处理的工作元素检索工作项目,对于全局命令队列内的计数变量的修改;
图7是根据一个实施例的方法的流程图,通过该方法分配选择的处理器核心用于分派工作元素和相应的APU掩码,并且生成和分配计数变量到GCQ内的工作元素;
图8是根据一个实施例的方法的流程图,通过该方法验证处理器核心用于利用APU掩码和计数变量的来自GCQ内工作元素的工作项目的分配,以便跟踪工作项目和工作元素的执行的完成;
图9是根据本发明的一个实施例的多节点处理系统架构,其具有一个或多个处理节点与GCQ之间的高等待时间,其中通过在每个处理节点提供的本地工作队列支持工作元素的有效处理;
图10图示根据一个实施例的混合多核心数据处理系统架构,其具有仅为具有到GCQ的高访问等待时间的那些处理节点提供的本地工作队列;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201080060260.8/2.html,转载请声明来源钻瓜专利网。





