[发明专利]一种GPU资源调度方法在审

专利信息
申请号: 202010576793.7 申请日: 2020-06-22
公开(公告)号: CN111796932A 公开(公告)日: 2020-10-20
发明(设计)人: 徐山川;王滨;王臣汉 申请(专利权)人: 贝式计算(天津)信息技术有限公司
主分类号: G06F9/50 分类号: G06F9/50;G06F9/48
代理公司: 北京卓唐知识产权代理有限公司 11541 代理人: 卜荣丽
地址: 100027 北京市朝*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 gpu 资源 调度 方法
【权利要求书】:

1.一种GPU资源调度方法,其特征在于,包括步骤:

S1、首先从集群中收集GPU的基本信息,并提供gpu-usages接口,进入步骤S2;

S2、创建GPU应用,并向Kubernetes调度器发送应用请求,进入步骤S3;

S3、Kubernetes调度器在接收到该应用请求后会遍历集群中所有的GPU应用,进入步骤S4;

S4、通过gpu-usages接口计算满足该应用的调度需求的GPU,进入步骤S5;

S5、GPU管理器按照应用上GPU所在机器将指定的GPU资源绑定到该应用中。

2.如权利要求1所述的一种GPU资源调度方法,其特征在于,步骤S2中,创建GPU应用过程中,应用提供其所需要的显存值以及算力值。

3.如权利要求1或2所述的一种GPU资源调度方法,其特征在于,步骤S1中,收集GPU的基本信息包括GPU的型号、显存和GPU核心。

4.如权利要求3所述的一种GPU资源调度方法,其特征在于,步骤S4中,若集群中没有满足该应用的调度需求的GPU,则进入步骤S6,S6、GPU资源的隔离。

5.如权利要求4所述的一种GPU资源调度方法,其特征在于,S6包括步骤S60和S61,S60、发现应用程序要求的显存超出了预先设定值,或者大于集群中所有GPU显存值,则返回显存分配失败;S61、对执行线程进行包装,周期性检查该程序对GPU的核心使用率,超过设定的使用核心值,或者大于集群中所有GPU显存值,则把当前执行线程划入等待执行线程中。

6.如权利要求1或2或4或5所述的一种GPU资源调度方法,其特征在于,在步骤S2中,创建GPU应用过程中,还应该提供其所需要的GPU的型号和GPU的个数。

7.如权利要求6所述的一种GPU资源调度方法,其特征在于,在步骤S4中,取满足需求的第一个GPU,在应用上标记GPU所在的机器的名字以及GPU在机器中的编号。

8.如权利要求1或2或4或5或7所述的一种GPU资源调度方法,其特征在于,在步骤S4中,通过gpu-usages接口寻找有相应个数空闲GPU的机器,并从中选择空闲个数最少的机器将其名称添加到应用中。

9.如权利要求1或2或4或5或7所述的一种GPU资源调度方法,其特征在于,在步骤S5中,GPU管理器使用穷举法将GPU分配给该应用,完成GPU资源的调度和绑定。

10.如权利要求1-9任意所述的一种GPU资源调度方法,其特征在于,该方法对一个GPU应用或者多个GPU应用完成GPU资源的调度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贝式计算(天津)信息技术有限公司,未经贝式计算(天津)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010576793.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top