[发明专利]一种超算平台资源利用率分析方法有效
申请号: | 201910994549.X | 申请日: | 2019-10-18 |
公开(公告)号: | CN110750358B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 周佳佳 | 申请(专利权)人: | 上海交通大学苏州人工智能研究院 |
主分类号: | G06F9/50 | 分类号: | G06F9/50 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 胡彬 |
地址: | 215000 江苏省苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 平台 资源利用率 分析 方法 | ||
本发明实施例提供一种超算平台资源利用率分析方法,包括:获取用户提交特定任务所使用的CPU数量和GPU数量;判断该GPU数量是否大于或等于CPU数量的N倍,如果否,则判定该特定任务对资源的占用需要调优,提示该用户的该特定任务需要优化。该方法能够为从源头解决资源浪费的问题提供支持。
技术领域
本发明涉及超算领域,尤其涉及一种超算平台资源利用率分析方法。
背景技术
超算平台在各行各业中已经得到广泛应用。用户在向超算平台提交任务时,会申请所需资源,包括CPU的数量、GPU的数量。超算平台基于用户提出的资源需求,由调度系统为用户分配服务器和该服务器上的CPU和GPU资源。目前GPU资源的成本远高于CPU资源的成本,因此超算平台的运维工作重点在追求GPU资源利用率的提高。
发明内容
本发明的目的在于提供一种超算平台资源利用率分析方法,为从源头解决资源浪费的问题提供支持。
为实现上述目的,本发明提供一种超算平台资源利用率分析方法,包括:
获取用户提交特定任务所使用的CPU数量和GPU数量;
判断该GPU数量是否大于或等于CPU数量的N倍,如果否,则判定该特定任务对资源的占用需要调优,提示该用户的该特定任务需要优化。
在一个优选的实施例中,所述获取用户提交特定任务所使用的GPU数量包括:
确定每个GPU运行的任务的任务标识,得到每个GPU与对应的任务标识信息;
基于所有GPU与对应的任务标识信息,统计该特定任务的任务标识对应的GPU的数量,得到该用户提交特定任务所使用的GPU数量。
在一个优选的实施例中,所述获取用户特定任务所使用的CPU数量包括:
确定每个CPU运行的任务的任务标识,得到每个CPU与对应的任务标识信息;
基于所有CPU与对应的任务标识信息,统计该特定任务的任务标识对应的CPU的数量,得到该用户提交特定任务所使用的CPU数量。
在一个优选的实施例中,所述CPU数量为CPU的颗数或CPU的核数。
在一个优选的实施例中,所述CPU的核数为CPU的物理核数、CPU的逻辑核数、或CPU的虚拟核数。
在一个优选的实施例中,所述N等于所有服务器中的CPU数量总和与GPU数量总和的比值。
在一个优选的实施例中,所述N等于当前服务器中的CPU数量与GPU数量的比值。
在一个优选的实施例中,所述提示该用户的该特定任务需要优化包括:
将该用户的该特定任务记录在日志文件中。
在一个优选的实施例中,在收到用户任务发出的申请资源时,对比该资源申请中GPU数量和CPU数量的比值是否小于N,如果是,则将该用户任务分配给CPU资源更多的服务器进行执行。
本发明实施例的方案能够发现用户提交任务对资源的占用不合理情况,最终目的是提醒用户改善其提交任务对资源的申请,为从源头解决资源浪费的问题提供支持。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1是本发明实施例提供的一种超算平台资源利用率分析方法的流程图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学苏州人工智能研究院,未经上海交通大学苏州人工智能研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910994549.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:智能分配方法及终端
- 下一篇:硬件资源配置方法、装置、云侧设备和存储介质