[发明专利]一种资源的管理方法、系统、设备以及介质有效
| 申请号: | 202010602947.5 | 申请日: | 2020-06-29 |
| 公开(公告)号: | CN111858034B | 公开(公告)日: | 2023-01-06 |
| 发明(设计)人: | 王振;王文潇 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
| 主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F9/455 |
| 代理公司: | 北京连和连知识产权代理有限公司 11278 | 代理人: | 张腾;张元 |
| 地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 资源 管理 方法 系统 设备 以及 介质 | ||
本发明公开了一种资源的管理方法,包括以下步骤:响应于接收到用户创建容器的第一指令,判断第一资源池中的资源是否满足待创建的容器所需要的资源;响应于第一资源池中的资源满足所需要的资源,利用第一资源池中的资源创建容器;响应于接收到用户销毁容器的第二指令,将销毁容器后释放的资源加入到第二资源池中;每隔预设时间段优先将第二资源池中的资源利用率大于阈值的第一类节点对应的资源按预设比例归还给第一资源池。本发明还公开了一种系统、计算机设备以及可读存储介质。本发明提出的方案可以使得某些节点预留较大的可支配资源量,减少资源需求大的容器的等待概率,提高集群整体资源利用率。
技术领域
本发明涉及云计算领域,具体涉及一种资源的管理方法、系统、设备以及存储介质。
背景技术
近两年,人工智能领域呈现出以下趋势,一是深度学习,强化学习等模型规模越来越庞大,尤其是模型训练需要消耗巨量CPU,GPU资源,所以模型训练一般需要一个服务器集群支持;二是模型的开发和训练越来越流程化,不同的研发人员参与不同的环节,也需要各自对立的开发训练环境。通常模型的开发环节所使用的资源较少,模型训练过程中使用的资源较多。因此,一个服务器集群中需要提供独立且不同资源规模的开发训练环境。
针对以上需求,现在主流的解决方案是在集群上采用Docker容器化技术+容器调度方案Kubernetes组合的云计算方案,以此云计算方案为基础构建一套人工智能平台,满足用户开发和训练的需求。研发人员在Docker提供的环境中进行开发和训练模型,保证了对于CPU和GPU等物理资源的对立使用;Kubernetes则完成了对容器的调度,保证了对资源的利用率。事实证明,采用Docker容器化技术+容器调度方案Kubernetes组合的云计算方案的这类人工智能平台,实现了隔离性、可移植性和资源灵活调度性,满足了用户的绝大多数需求。
研发人员开发模型创建的容器称为开发环境,所需要的CPU,GPU的资源较少;而训练模型创建的容器称为训练环境,所需要的CPU和GPU 资源巨大。通常集群中,开发环境数量较多,训练环境数量较少。虽然Kubernetes容器编排带来了调度的自动化,减少人工干预,然而在面对模型开发和模型训练并存的集群中,仍然存在一个痛点没有很好的解决。现在的Kubernetes调度策略较为简单或者主要考虑集群中各节点的负载相对均衡,导致容器在各节点上的分配较为均衡,各个节点的资源使用量和剩余量基本一致。当研发人员需要训练模型时,若单个容器需要的资源较大,会出现集群中每个节点的剩余资源均不满足调度的资源要求,导致调度失败,用户无法使用平台的服务,而且也造成了一定程度的浪费。极限情况是集群中每个节点的资源利用率都不高,但是没有一个节点可以满足训练环境所需要的资源要求,用户只能等待资源足够时才能训练模型。这种情况是需要避免的。
发明内容
有鉴于此,为了克服上述问题的至少一个方面,本发明实施例提出一种资源的管理方法,包括以下步骤:
响应于接收到用户创建容器的第一指令,判断第一资源池中的资源是否满足待创建的容器所需要的资源;
响应于所述第一资源池中的资源满足所述所需要的资源,利用所述第一资源池中的资源创建所述容器;
响应于接收到用户销毁所述容器的第二指令,将销毁所述容器后释放的资源加入到第二资源池中;
每隔预设时间段优先将所述第二资源池中的资源利用率大于阈值的第一类节点对应的资源按预设比例归还给所述第一资源池。
在一些实施例中,响应于所述第一资源池中的资源满足所述所需要的资源,利用第一资源池中的资源创建所述容器,进一步包括:
判断所述第一资源池中所述第一类节点对应的资源是否满足所述所需要的资源;
响应于所述第一资源池中第一类节点对应的资源不满足所述所需要的资源,判断所述第一资源池中资源利用率不大于阈值的第二类节点对应的资源是否满足所述所需要的资源;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010602947.5/2.html,转载请声明来源钻瓜专利网。





