[发明专利]GPU资源管理方法、调度方法、装置、电子设备及存储介质在审
申请号: | 202210219719.9 | 申请日: | 2022-03-08 |
公开(公告)号: | CN114565502A | 公开(公告)日: | 2022-05-31 |
发明(设计)人: | 万江凯 | 申请(专利权)人: | 重庆紫光华山智安科技有限公司 |
主分类号: | G06T1/20 | 分类号: | G06T1/20;G06F9/445;G06F9/48 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 张欣欣 |
地址: | 400700 重庆市*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | gpu 资源管理 方法 调度 装置 电子设备 存储 介质 | ||
1.一种GPU资源管理方法,其特征在于,应用于Kubernetes集群中的工作节点,所述Kubernetes集群还包括主节点,所述主节点与所述工作节点通信连接,所述工作节点运行有管理Pod,所述管理Pod内置有GPU卡驱动组件,所述方法包括:
利用所述管理Pod对所述工作节点上的GPU卡进行检测;
若检测到GPU卡,则利用所述管理Pod获取所述工作节点的GPU资源;
利用所述管理Pod将所述工作节点的GPU资源发送至所述主节点,以使所述主节点对所述GPU资源进行调度。
2.如权利要求1所述的GPU资源管理方法,其特征在于,所述方法还包括:
当所述工作节点的GPU卡的工作状态发生变化时,利用所述管理Pod对所述工作节点上的GPU卡重新检测;
统计重新检测到的GPU卡的GPU资源,得到所述工作节点的当前GPU资源;
将所述工作节点的当前GPU资源同步至所述主节点,以指示所述主节点对所述工作节点的GPU资源进行更新。
3.如权利要求1所述的GPU资源管理方法,其特征在于,所述工作节点运行有多个已创建的应用Pod,所述方法还包括:
获取每一所述应用Pod的GPU资源配置;
根据每一所述应用Pod的GPU资源配置,对所述工作节点的GPU资源进行隔离,以使每一所述应用Pod均可获取每一所述应用Pod的GPU资源配置所需的GPU资源。
4.如权利要求1所述的GPU资源管理方法,其特征在于,所述检测到的GPU卡为多个,所述利用所述管理Pod获取所述工作节点的GPU资源的步骤包括:
获取检测到的每一所述GPU卡的GPU资源;
对所有检测到的所述GPU卡的GPU资源进行统计,得到所述工作节点的GPU资源。
5.一种GPU资源调度方法,其特征在于,应用于Kubernetes集群中的主节点,所述Kubernetes集群还包括工作节点,所述工作节点与所述主节点通信连接,所述工作节点运行有管理Pod,所述管理Pod内置有GPU卡驱动组件,所述方法包括:
接收所述工作节点发送的所述工作节点的GPU资源,其中,所述工作节点运行有管理Pod,所述工作节点的GPU资源是所述工作节点利用所述管理Pod对所述工作节点上安装的GPU卡进行检测,并在检测到GPU卡时利用所述管理Pod获取的;
对所述GPU资源进行调度。
6.如权利要求5所述的GPU资源调度方法,其特征在于,所述工作节点为多个,所述对所述GPU资源进行调度的步骤包括:
接收应用Pod创建命令,其中,所述应用Pod创建命令包括待创建应用Pod的GPU资源配置;
基于所述应用Pod创建命令,获取每一所述工作节点的GPU资源;
从所有所述工作节点的GPU资源中确定满足所述GPU资源配置的目标GPU资源;
将所述应用Pod调度至所述目标GPU资源所属的目标工作节点,以使所述目标工作节点创建并运行所述待创建应用Pod。
7.如权利要求5所述的GPU资源调度方法,其特征在于,所述方法还包括:
接收新的工作节点上报的用于申请加入至所述Kubernetes集群的加入请求;
基于所述加入请求,将所述管理Pod调度至所述新的工作节点,以使所述新的工作节点创建并运行所述管理Pod,并将所述新的工作节点利用所述管理Pod获取的所述新的工作节点的GPU资源发送至所述主节点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆紫光华山智安科技有限公司,未经重庆紫光华山智安科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210219719.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:多火型节能耐用电热锅加热方法及其电热锅
- 下一篇:旋转电位器