[发明专利]一种用于大数据系统状态监控的方法和装置在审
| 申请号: | 201711310901.0 | 申请日: | 2017-12-11 |
| 公开(公告)号: | CN109905267A | 公开(公告)日: | 2019-06-18 |
| 发明(设计)人: | 王雅文 | 申请(专利权)人: | 镇江共远软件开发有限公司 |
| 主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/26 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 212000 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 大数据 系统状态 系统信息判断 系统状态监控 方法和装置 计算机设备 采集 计算机技术领域 报警过程 报警效率 报警信息 系统信息 用户发送 监控 调用 报警 | ||
本发明涉及计算机技术领域,尤其涉及一种用于大数据系统状态监控的方法和装置。该方法包括调用计算机设备采集大数据系统信息,并根据采集到的大数据系统信息判断大数据系统状态是否出现异常,当根据采集到的大数据系统信息判断出大数据系统状态出现异常时,自动向用户发送报警信息。这样就通过计算机设备实现了对大数据系统状态的监控和报警过程,提高了监控和报警效率以及报警的准确性。
技术领域
本发明涉及计算机技术领域,尤其涉及一种用于大数据系统状态监控的方法和装置。
背景技术
大数据系统(hadoop生态)的服务器集群在统计分析和汇总相关软硬件信息上因服务器较多、部署软件种类较多以及相关信息指标过于复杂,对整个集群的状态进行监控,并当集群的状态出现异常时的报警工作量很繁重,监控和报警效率低下。
针对以上低效情况,目前多数解决方式仍为人工监控集群,通过相关监控软件以及相关命令等对集群信息进行查看和判断,当集群出现异常时人工报警。这种方式步骤繁琐、耗费工时、效率低下,此外,经常会由于人工疏忽而产生误报、漏报等现象。
发明内容
本发明提供了一种用于大数据系统状态监控的方法和装置,通过调用计算机设备采集大数据系统信息,并根据采集到的大数据系统信息判断出大数据系统出现异常时自动向用户发送报警信息,提高了对大数据系统状态监控和报警工作的效率。
第一方面,本发明提供了一种用于大数据系统状态监控的方法,包括调用计算机设备执行:
采集大数据系统信息;
根据采集到的大数据系统信息判断大数据系统状态是否出现异常;
当大数据系统状态出现异常时,向用户发出报警信息。
进一步的,所述向用户发出报警信息,包括:
发送报警邮件给用户,或者调用第三方接口,自动给用户拨打报警电话。
进一步的,所述采集大数据系统信息,包括:
采集多种类型的大数据系统信息;
所述根据采集到的大数据系统信息判断大数据系统状态是否出现异常,包括:
针对每一种类型的大数据系统信息,确定该大数据系统信息对应的异常判断规则,并根据该异常判断规则判断该类型的大数据系统信息是否异常。
进一步的,所述根据采集到的大数据系统信息判断大数据系统状态是否出现异常包括:
将采集到的大数据系统信息处理为预设格式;
根据处理为预设格式的大数据系统信息判断大数据系统状态是否出现异常。
进一步的,所述采集大数据系统信息包括:采集如下参数中的一种或者多种:
HDFS空间占用信息、HDFSBLOCK块计数信息、HDFSBLOCK分布信息、HDFS空间增长信息、HBASE合并队列信息、HBASE刷新队列信息、HBASEmemstore大小信息、flume堆压信息、flume速率信息、kafka堆压信息、集群各进程信息和集群机器负载信息。
进一步的,所述方法,还包括:
获取历史报警信息,并根据历史报警信息分析大数据系统的稳定性指数、存储指数、性能指数和漏洞指数中的一种或者几种生成报警图表;
向用户发送报警图表。
进一步的,所述方法,还包括:
根据历史报警信息,对大数据系统未来的稳定性指数、存储指数、性能指数和漏洞指数中的一种或者几种生成预测图表;
向用户发送预测图表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于镇江共远软件开发有限公司,未经镇江共远软件开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711310901.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种网络信息管理方法
- 下一篇:网络运维的方法及装置





