[发明专利]一种GPU资源管理方法及装置在审
| 申请号: | 202110828880.1 | 申请日: | 2021-07-22 |
| 公开(公告)号: | CN113703961A | 公开(公告)日: | 2021-11-26 |
| 发明(设计)人: | 王勇 | 申请(专利权)人: | 新华三大数据技术有限公司 |
| 主分类号: | G06F9/50 | 分类号: | G06F9/50 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 450000 河南省郑州市郑州高*** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 gpu 资源管理 方法 装置 | ||
1.一种GPU资源管理方法,其特征在于,所述方法包括:
监测各主机的GPU的运行状态;
若监测到目标主机的第一GPU的运行状态为非健康状态,则确定出所述目标主机中当前使用所述第一GPU的目标虚拟机;
将至少一个所述目标虚拟机当前使用的GPU由所述第一GPU调整为运行状态为健康状态的其它GPU。
2.如权利要求1所述的方法,其特征在于,监测各主机的GPU的运行状态的步骤包括:
基于预设的周期获取各主机的各GPU的性能参数;
基于获取到的各GPU的性能参数和预设的各性能参数的权重值,分别计算各GPU的健康值;
其中,若一个GPU的健康值小于预设值,则判定该GPU的运行状态为非健康状态;否则,判定该GPU的运行状态为健康状态。
3.如权利要求1所述的方法,其特征在于,将至少一个所述目标虚拟机当前使用的GPU由所述第一GPU调整为运行状态为健康状态的其它GPU的步骤包括:
判断所述目标主机上是否存在运行状态为健康状态的第二GPU;
若判定所述目标主机上存在运行状态为健康状态的第二GPU,则分别计算所述目标虚拟机的繁忙程度;
将繁忙程度最高的所述目标虚拟机的当前使用的GPU由所述第一GPU调整为所述第二GPU。
4.如权利要求3所述的方法,其特征在于,所述方法还包括:
若判定所述目标主机上不存在运行状态为健康状态的第二GPU,则判断其它主机上是否存在运行状态为健康状态的第三GPU;
若判定其它主机上存在运行状态为健康状态的第三GPU,则将繁忙程度最高的所述目标虚拟机迁移至所述其它主机上,并将繁忙程度最高的所述目标虚拟机当前使用的GPU由所述第一GPU调整为所述第三GPU。
5.如权利要求3或4所述的方法,其特征在于,所述方法还包括:
在将任意一个所述目标虚拟机的当前使用的GPU由所述第一GPU调整为其他GPU之后,若监测到所述目标GPU的运行状态仍为非健康状态,则将当前繁忙程度最高的所述目标虚拟机当前使用的GPU由所述第一GPU调整为其它GPU,直至所述目标GPU的运行状态为健康状态。
6.一种GPU资源管理装置,其特征在于,所述装置包括:
监测单元,用于监测各主机的GPU的运行状态;
确定单元,若所述监测单元监测到目标主机的第一GPU的运行状态为非健康状态,则所述确定单元,用于确定出所述目标主机中当前使用所述第一GPU的目标虚拟机;
调整单元,用于将至少一个所述目标虚拟机当前使用的GPU由所述第一GPU调整为运行状态为健康状态的其它GPU。
7.如权利要求6所述的装置,其特征在于,监测各主机的GPU的运行状态时,所述监测单元具体用于:
基于预设的周期获取各主机的各GPU的性能参数;
基于获取到的各GPU的性能参数和预设的各性能参数的权重值,分别计算各GPU的健康值;
其中,若一个GPU的健康值小于预设值,则判定该GPU的运行状态为非健康状态;否则,判定该GPU的运行状态为健康状态。
8.如权利要求6所述的装置,其特征在于,将至少一个所述目标虚拟机当前使用的GPU由所述第一GPU调整为运行状态为健康状态的其它GPU时,所述调整单元具体用于:
判断所述目标主机上是否存在运行状态为健康状态的第二GPU;
若判定所述目标主机上存在运行状态为健康状态的第二GPU,则分别计算所述目标虚拟机的繁忙程度;
将繁忙程度最高的所述目标虚拟机的当前使用的GPU由所述第一GPU调整为所述第二GPU。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新华三大数据技术有限公司,未经新华三大数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110828880.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种资讯信息处理的方法及其终端
- 下一篇:一种虚拟机管理方法及装置





