[发明专利]一种GPU管控方法及相关装置在审
| 申请号: | 201910577579.0 | 申请日: | 2019-06-28 | 
| 公开(公告)号: | CN110362448A | 公开(公告)日: | 2019-10-22 | 
| 发明(设计)人: | 韩增福 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 | 
| 主分类号: | G06F11/30 | 分类号: | G06F11/30;G06F1/20 | 
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 高勇 | 
| 地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 管控 预设 计算机可读存储介质 基板管理控制器 发送控制指令 运行稳定性 管控装置 技术效果 使用寿命 双重保护 相关装置 有效实现 不透明 申请 | ||
本申请公开了一种GPU管控方法,包括获取GPU的运行温度;将所述运行温度与预设温度阈值进行比较,判断所述运行温度是否超出所述预设温度阈值;若所述运行温度超出所述预设温度阈值,则向所述GPU发送控制指令以降低所述GPU的所述运行温度。该GPU管控方法与原有GPU内部保护机制共同作用,可为GPU提供双重保护,尤其在GPU内部保护机制不透明的情况下,该GPU管控方法能够有效实现对GPU的保护,保持GPU的运行稳定性以及延长GPU的使用寿命。本申请还公开了一种GPU管控装置、基板管理控制器以及计算机可读存储介质,均具有上述技术效果。
技术领域
本申请涉及计算机技术领域,特别涉及一种GPU管控方法;还涉及一种GPU管控装置、基板管理控制器以及计算机可读存储介质。
背景技术
GPU即图形处理单元,又名显示核心或显示芯片或视觉处理器,是一种用于图像运算的微处理器。目前,随着智能技术的发展,GPU被越来越多的应用于AI服务器。而作为AI服务器中的重要硬件,GPU的稳定运行及其使用寿命成为影响AI服务器性能的关键,由此,对GPU实施保护日益成为研究重点。
因此,如何提供一种GPU管控方法,实现对GPU的有效保护,保持GPU的运行稳定性以及延长GPU的使用寿命是本领域技术人员亟待解决的技术问题。
发明内容
本申请的目的是提供一种GPU管控方法,能够实现对GPU的有效保护,保持GPU的运行稳定性以及延长GPU的使用寿命;本申请的另一目的是提供一种GPU管控装置、基板管理控制器以及计算机可读存储介质,均具有上述技术效果。
为解决上述技术问题,本申请提供了一种GPU管控方法,包括:
获取GPU的运行温度;
将所述运行温度与预设温度阈值进行比较,判断所述运行温度是否超出所述预设温度阈值;
若所述运行温度超出所述预设温度阈值,则向所述GPU发送控制指令以降低所述GPU的所述运行温度。
可选的,所述获取GPU的运行温度,包括:
依据预设周期向所述GPU发送温度获取指令并接收所述GPU响应所述温度获取指令发送的所述运行温度。
可选的,所述向所述GPU发送控制指令以降低所述GPU的所述运行温度,包括:
向所述GPU发送掉电指令以触发所述GPU掉电。
可选的,所述向所述GPU发送控制指令以降低所述GPU的所述运行温度,包括:
向所述GPU发送降频指令以降低所述GPU的运行频率。
可选的,还包括:
降低所述GPU的运行频率和/或触发所述GPU掉电后记录相应的日志。
为解决上述技术问题,本申请还提供了一种GPU管控装置,包括:
运行温度获取模块,用于获取GPU的运行温度;
判断模块,用于将所述运行温度与预设温度阈值进行比较,判断所述运行温度是否超出所述预设温度阈值;
指令发送模块,若所述运行温度超出所述预设温度阈值,则向所述GPU发送控制指令以降低所述GPU的所述运行温度。
可选的,所述指令发送模块具体用于向所述GPU发送掉电指令以触发所述GPU掉电。
可选的,所述指令发送模块具体用于向所述GPU发送降频指令以降低所述GPU的运行频率。
为解决上述技术问题,本申请还提供了一种基板管理控制器,包括:
存储器,用于存储计算机程序;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910577579.0/2.html,转载请声明来源钻瓜专利网。





