[发明专利]算力服务器的算力监控方法、装置及存储介质有效
申请号: | 202211701367.7 | 申请日: | 2022-12-28 |
公开(公告)号: | CN115794561B | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 汪福全;刘明 | 申请(专利权)人: | 声龙(新加坡)私人有限公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30;G06F11/34 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 胡艳华;解婷婷 |
地址: | 北京市海淀区北*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 服务器 监控 方法 装置 存储 介质 | ||
本文公开一种算力服务器的算力监控方法、装置及存储介质。所述算力监控方法包括:实时计算算力服务器四个维度的算力并生成算力运行历史数据;其中,所述四个维度分别是:整机级、算力板级、计算芯片级和计算单元级;根据所述算力运行历史数据判断所述算力服务器是否出现四个维度中至少一个维度的算力异常,是则查询对应维度的异常处理策略,根据查询到的异常处理策略进行对应维度的告警处理。本文的方案能够全方位监控算力服务器的算力,降低算力服务器整机运行异常的风险。
技术领域
本申请实施例涉及算力服务器技术领域,尤其涉及一种算力服务器的算力监控方法、装置及存储介质。
背景技术
算力是指数据的处理能力。从处理对象来看,算力处理对象主要为数据,数据包括文本、音频、视频等各种形式的数据。算力服务的应用场景包括:物联网、智能汽车、AI(Artificial Intelligence,人工智能)等。
算力服务器的算力是服务器运行过程中的重要参数。当算力服务器出现计算错误时才进行告警,往往会造成难以挽回的经济损失。
发明内容
本申请实施例提供了一种算力服务器的算力监控方法。如图1所示,一种算力服务器的算力监控方法,包括:
实时计算算力服务器四个维度的算力并生成算力运行历史数据;其中,所述四个维度分别是:整机级、算力板级、计算芯片级和计算单元级;
根据所述算力运行历史数据判断所述算力服务器是否出现四个维度中至少一个维度的算力异常,是则查询对应维度的异常处理策略,根据查询到的异常处理策略进行对应维度的告警处理。
本申请实施例提供了一种算力服务器的算力监控装置,包括:
计算模块,用于实时计算算力服务器四个维度的算力并生成算力运行历史数据;其中,所述四个维度分别是:整机级、算力板级、计算芯片级和计算单元级;
告警模块,用于根据所述算力运行历史数据判断所述算力服务器是否出现四个维度中至少一个维度的算力异常,是则查询对应维度的异常处理策略,根据查询到的异常处理策略进行对应维度的告警处理。
本申请实施例提供了一种算力服务器的算力监控装置,包括:存储器及处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时实现上述算力服务器的算力监控方法的步骤。
本申请实施例提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述算力服务器的算力监控方法的步骤。
本申请实施例提供的算力服务器的算力监控方法及装置,实时计算算力服务器四个维度的算力并生成算力运行历史数据,根据所述算力运行历史数据判断所述算力服务器是否出现四个维度中至少一个维度的算力异常,是则查询对应维度的异常处理策略,根据查询到的异常处理策略进行对应维度的告警处理。上述算力监控方法及装置能够全方位监控算力服务器的算力,精确定位算力异常的计算单元、芯片和算力板并及时告警,降低算力服务器整机运行异常的风险。
在阅读并理解了附图和详细描述后,可以明白其他方面。
附图说明
附图用来提供对本申请技术方案的理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请的技术方案,并不构成对本申请技术方案的限制。
图1为本申请实施例的一种算力服务器的算力监控方法的流程图;
图2为本申请实施例的一种算力服务器的算力监控装置的结构示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于声龙(新加坡)私人有限公司,未经声龙(新加坡)私人有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211701367.7/2.html,转载请声明来源钻瓜专利网。