[发明专利]一种GPU服务器散热调控方法及系统在审
申请号: | 201811178785.6 | 申请日: | 2018-10-10 |
公开(公告)号: | CN109002155A | 公开(公告)日: | 2018-12-14 |
发明(设计)人: | 段春焕 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | G06F1/20 | 分类号: | G06F1/20;G06F1/32 |
代理公司: | 济南舜源专利事务所有限公司 37205 | 代理人: | 于晓晓 |
地址: | 450000 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 服务器 散热 风扇转速 整机功耗 显卡 调控 服务器系统 目标操作 散热设计 功耗 加压 满载 | ||
本发明提供一种GPU服务器散热调控方法及系统,属于GPU服务器散热设计领域。具体的,本发明通过加压显卡至不同功耗下,获得对应的GPU服务器整机功耗值,然后调整GPU服务器系统风扇转速,使显卡工作持续在满载且目标操作温度以下;本发明可通过整机功耗来调整风扇转速,进而实现GPU服务器散热调控的目的。
技术领域
本发明属于GPU服务器散热设计领域,涉及一种GPU服务器散热调控方法及系统,用于GPU服务器显卡加压时调控GPU服务器散热。
背景技术
当前高端显卡已广泛用于图像视频计算与深度学习领域,高功耗显卡对整机散热提出较高要求;系统需要掌握显卡在不同负载下的温度来调节整机风扇转速,以满足显卡在高性能负载下能够持续运行;
不同于被动散热GPU卡的情况,GPU服务器可通过SMBUS信号直接读取GPU芯片温度进而调整GPU服务器风扇转速。主动散热的GTX显卡,芯片原厂未开放SMBUS寄存器地址给服务器厂商,所以GPU服务器无法通过SMBUS掌握显卡温度。该类显卡自带风扇,有独立的散热调控策略。对显卡加压显卡功耗超过200W的GTX显卡(GTX显卡较紧密的排列在机箱内)温度升高到某设定值时,显卡本身设计策略是保持在基准频率运行,此时无法达到满载运行;当显卡温度再升高,则会出现降频甚至是宕机问题。
发明内容
鉴于上述问题,本发明提供了一种GPU服务器散热调控方法及系统,该方法基于BMC(基板管理控制器),应用于GPU服务器显卡加压时,具体通过监控GPU服务器整机功耗调整GPU服务器风扇的转速以实现GPU服务器散热调控;本发明使得显卡工作持续在满载且目标操作温度以下。本发明的技术方案如下:
一种GPU服务器散热调控方法,通过监控GPU服务器整机功耗调整GPU服务器风扇转速的方法为:
实时监控GPU服务器整机功耗;
基于实时监控到的GPU服务器整机功耗,依据预先设定的GPU服务器风扇转速与GPU服务器整机功耗的对应关系调整GPU服务器风扇的转速。
进一步的,GPU服务器显卡为主动散热显卡;优选为GTX主动散热显卡。
更进一步的,所述GPU服务器风扇转速与GPU服务器整机功耗的对应关系的获得方法为:
(1)查看显卡功耗和温度;
(2)在显卡正常运行温度范围内,使显卡加压至不同功耗;
(3)对应监控GPU服务器整机功耗,分别调整风扇转速使显卡均持续工作在满载且目标温度以下,记录上述对应监控到的GPU服务器整机功耗及其各自对应的上述调整后的相应GPU服务器风扇转速,即获取到所述的GPU服务器风扇转速与GPU服务器整机功耗的对应关系;所述目标温度的取值范围与所述显卡正常运行温度范围相同。
本发明还包括,一种GPU服务器散热调控系统,该系统基于BMC,应用于GPU服务器显卡加压时,系统包括:
监控模块,用于实时监控GPU服务器整机功耗;
散热调控模块,与所述的监控模块相连,用于依据监控模块实时监控到的GPU服务器整机功耗,依据GPU服务器整机功耗及其对应GPU服务器风扇转速的对应关系调整GPU服务器风扇的转速。
进一步的,GPU服务器显卡为主动散热显卡;优选为GTX主动散热显卡。
基于GPU服务器散热调控系统的,所述GPU服务器风扇转速与GPU服务器整机功耗的对应关系的获得方法为:
(1)查看显卡功耗和温度;
(2)在显卡正常运行温度范围内,使显卡加压至不同功耗;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811178785.6/2.html,转载请声明来源钻瓜专利网。