[发明专利]通过分层性能平衡来减轻负载不平衡有效
申请号: | 201780013348.6 | 申请日: | 2017-02-21 |
公开(公告)号: | CN108701062B | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | S·拉巴散;F·阿达纳兹;J·M·伊斯特;R·J·格雷克 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F9/48 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 高见;张欣 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 通过 分层 性能 平衡 减轻 负载 不平衡 | ||
系统、装置和方法可提供通过布置在分层树中的多个重分配器中的系统级重分配器来获得资源预算信息。另外,可由多个重分配器中的至少一个重分配器来获得应用性能信息。此外,可由多个重分配器中的至少一个重分配器并至少部分地基于资源预算信息和应用性能信息来降低与应用性能信息相关联的多个计算子树之间的性能不平衡。
本申请要求2016年3月25日提交的美国非临时专利申请号15/081,424的优先权权益。
本发明是在由国防部授予的合同号H98230-13-D-0124的政府支持下进行的。政府具有本发明的某些权利。
技术领域
实施例一般涉及计算负载不平衡。更具体地,实施例涉及通过分层性能平衡来减轻计算负载不平衡。
背景技术
高性能计算(HPC)解决方案可将整体同步计算模型应用于大量计算元件(例如,处理器核),其中每个计算元件被指派与一个或多个应用相关联的大致相等的工作量。在计算期间的周期性且频繁的里程碑中,每个计算元件可与其他计算元件全局同步,以便确保正确性以及交换在计算的下一阶段中使用的数据。然而,许多因素可能导致计算元件之间的负载不平衡,其中负载不平衡可进而呈现关于全局同步的挑战。例如,制造变化、系统规模的增加、将应用工作划分成相等大小部分的复杂性、操作系统(OS)守护进程或服务引起的抖动、非统一存储器访问(NUMA)等待时间、以及管芯上互连路由协议之间的不公平性都可能导致负载不平衡,该负载不平衡导致计算元件在不同时刻到达特定的全局同步点。此外,整体应用性能可由最后到达同步点的计算元件确定(和限制)。实际上,早先到达的计算元件可能浪费可观的时间量和能量来在同步点进行等待。
附图说明
通过阅读以下说明书和所附权利要求并通过参考以下附图,各实施例的各种优点对于本领域技术人员将变得显而易见,其中:
图1是根据实施例的布置在分层树中的多个重分配器的示例的框图;
图2是根据实施例的减轻性能不平衡的方法的示例的流程图;
图3是根据实施例的重分配器的示例的框图;
图4是根据实施例的操作重分配器的方法的示例的流程图;
图5是根据实施例的控制电压和频率设置的重分配器的示例的框图;以及
图6是根据实施例的计算系统的示例的示图。
具体实施方式
现转向图1,示出了重分配装置10,其中多个重分配器被布置在分层树中。在所例示的示例中,系统级重分配器12被通信地耦合至一个或多个中间级的重分配器14,该中间级的重分配器14进而可被通信地耦合至一个或多个节点级重分配器16(16a-16c)。另外,所例示的节点级重分配器16被通信地耦合至一个或多个处理器级重分配器18(18a-18c)。一般来说,每个处理器级重分配器18可与多个应用线程相关联(例如,在一个或多个处理器核上执行,未示出),这些应用线程形成、构成和/或定义所讨论的处理器级重分配器18的计算子树。例如,第一处理器级重分配器18a可与在一个或多个处理器核上执行的第一多个应用线程相关联,其中第一多个应用线程形成第一处理器级重分配器18a的第一计算子树。类似地,第二处理器级重分配器18b可与形成第二计算子树的第二多个线程相关联,第三处理器级重分配器18c可与形成第三计算子树的第三多个线程相关联,等等。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780013348.6/2.html,转载请声明来源钻瓜专利网。