[发明专利]高性能集群监控方法、设备、装置及存储介质在审
申请号: | 201810867270.0 | 申请日: | 2018-08-01 |
公开(公告)号: | CN109101397A | 公开(公告)日: | 2018-12-28 |
发明(设计)人: | 赵扬;雷鸣 | 申请(专利权)人: | 武汉索雅信息技术有限公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30;G06F11/32 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国;晏波 |
地址: | 430000 湖北省武汉市武汉东湖开发区*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 性能数据 集群 监控节点 特征文件 应用运行 存储介质 集群监控 目标应用软件 离线分析 实时采集 实时监控 性能状态 应用软件 运行状态 采集 保存 监控 分析 | ||
本发明公开了一种高性能集群监控方法、设备、装置及存储介质,所述方法包括:获取高性能集群中的待监控节点;在所述待监控节点运行目标应用软件时,采集所述待监控节点的性能数据;根据所述性能数据生成所述高性能集群的应用运行特征文件;对所述应用运行特征文件进行离线分析。通过实时采集各节点的性能数据,能够实时监控高性能集群中应用软件的运行状态,并且在监控整体集群性能状态的同时,将性能数据保存为应用运行特征文件,可供离线性能分析使用。
技术领域
本发明涉及集群监控技术领域,尤其涉及一种高性能集群监控方法、设备、装置及存储介质。
背景技术
高性能计算集群(HPC,High Performance Computing)是指能够执行一般个人电脑无法处理的大资料量与高速运算的电脑,其基本组成组件与个人电脑的概念无太大差异,但规格与性能则强大许多。
然而,现有的高性能计算集群在面对复杂、大规模的作业管理和调度的时候,无法实时对高性能集群进行监控,了解集群中应用软件的运行状态。
发明内容
本发明的主要目的在于提供一种高性能集群监控方法、设备、装置及存储介质,旨在解决现有技术中无法实时对高性能集群进行监控,了解集群中应用软件的运行状态的技术问题。
为实现上述目的,本发明提供一种高性能集群监控方法,所述方法包括以下步骤:
获取高性能集群中的待监控节点;
在所述待监控节点运行目标应用软件时,采集所述待监控节点的性能数据;
根据所述性能数据生成所述高性能集群的应用运行特征文件;
对所述应用运行特征文件进行离线分析。
优选地,所述在所述待监控节点运行目标应用软件时,采集所述待监控节点的性能数据之后,所述方法还包括:
通过前台节点运行图形窗口界面,所述图形窗口界面包括各待监控节点对应的图形窗口;
根据所述性能数据生成各待监控节点的应用运行特征直方图,并通过各待监控节点对应的图形窗口显示所述应用运行特征直方图。
优选地,所述通过各待监控节点对应的图形窗口显示所述应用运行特征直方图之后,所述方法还包括:
监控所述待监控节点是否处于异常状态;
获取处于异常状态的待监控节点对应的目标图形窗口,通过预设报警颜色闪烁显示所述目标图形窗口。
优选地,所述对所述应用运行特征文件进行离线分析之前,所述方法还包括:
调用与所述高性能集群关联的预设调度系统的应用程序接口,并从所述应用程序接口获取所述预设调度系统的调度数据;
相应地,所述对所述应用运行特征文件进行离线分析,具体包括:
对所述应用运行特征文件与所述调度数据进行离线分析。
优选地,所述对所述应用运行特征文件与所述调度数据进行离线分析,具体包括:
从所述应用运行特征文件中提取所述性能数据,并对所述性能数据与所述调度数据进行显示;
根据所述性能数据与所述调度数据重构所述高性能集群的应用运行过程。
优选地,所述根据所述性能数据与所述调度数据重构所述高性能集群的应用运行过程,具体包括:
根据所述性能数据与所述调度数据生成应用运行特征曲线图,并显示所述应用运行特征曲线图。
优选地,所述根据所述性能数据与所述调度数据生成应用运行特征曲线图,并显示所述应用运行特征曲线图之后,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉索雅信息技术有限公司,未经武汉索雅信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810867270.0/2.html,转载请声明来源钻瓜专利网。