[发明专利]一种基于国产CPU和操作系统的软硬件故障告警系统及方法在审
申请号: | 201710015718.1 | 申请日: | 2017-01-10 |
公开(公告)号: | CN106649055A | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 朱宪;李超;孙元田 | 申请(专利权)人: | 山东浪潮云服务信息科技有限公司 |
主分类号: | G06F11/32 | 分类号: | G06F11/32;G06F11/30 |
代理公司: | 济南信达专利事务所有限公司37100 | 代理人: | 孟峣 |
地址: | 250100 山东省济南市高*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 国产 cpu 操作系统 软硬件 故障 告警 系统 方法 | ||
技术领域
本发明涉及计算机技术领域,具体地说是一种实用性强、基于国产CPU和操作系统的软硬件故障告警系统及方法。
背景技术
随着国内企业信息化和政府电子政务的发展,大中型企业以及政府机构越来越依赖于信息系统展开其业务运作,信息系统运营维护工作的重要性也随之凸显。而主机软硬件信息的监控是信息系统运维中的一个重要组成部分。
目前基于国产CPU、操作系统的服务器和客户端在某些关键领域已经形成规模化应用,但是相比主流的X86环境,其软硬件的稳定性方面仍处于不断的完善过程中,这就对基于国产CPU和操作系统的主机软硬件故障信息监控提出了更高的要求,而且目前安全可靠环境中目前还没有一种成熟、高效的软硬件故障问题信息告警系统及方法。针对这一情况,现提供一种基于国产CPU和操作系统的软硬件故障告警系统及方法。
发明内容
本发明的技术任务是针对以上不足之处,提供一种实用性强、基于国产CPU和操作系统的软硬件故障告警系统及方法。
一种基于国产CPU和操作系统的软硬件故障告警系统,包括故障检测平台,运行在安装国产CPU和操作系统的主机上,用于屏蔽国产CPU和操作系统的差异性,完成对主机各软硬件信息的故障检测,并将相应故障信息发送给告警服务平台;
告警服务平台,接收到故障检测平台发送来的告警信息后,进行故障信息的展示,并发出警报。
所述故障检测平台由核心调度模块、信息采集模块、故障分析模块、配置模块、通讯模块、三方故障信息接入模块、预处理模块组成,其中核心调度模块负责整体的流程调度和处理;配置模块负责相关策略配置,接收通讯模块传递的包括故障检测策略、故障预处理机制、故障索引表的配置信息,并及时更新生效,与告警服务平台配置信息保持同步;信息采集模块实时采集主机的软硬件信息;故障分析模块实现对故障信息的即时检测、分析及过滤;三方故障接入模块即时接收第三方应用故障信息;预处理模块,对满足预处理机制的故障信息,执行预设的Shell脚本或者处理程序第一时间解决故障问题,处理完成后对该故障信息进行持续跟踪,若仍存在该故障信息则将该故障信息及处理信息发送到告警服务平台;通讯模块按照{key,value}的对应关系将检测到的故障信息打包,通过socket通讯方式将故障信息发送给告警服务平台。
所述信息采集模块采集的主机软硬件信息包括:对主机的文件系统信息、CPU负载信息、内存负载信息、SWAP负载信息、磁盘IO负载信息、网口流量信息、进程信息、服务信息数据进行实时监测;通过IPMI实时获取主机的硬件状态,包括机器温度状态、风扇状态;通过JMX协议监控主机上安装的中间件;通过数据库连接插件访问主机上的数据库,获取数据库运行信息。
所述故障分析模块用于对信息采集模块获取的主机软硬件信息进行实时分析,针对不同种类的软硬件信息设置初始的多级别门限阈值,并且对主机的软硬件信息进行分类统计分析,动态调整门限阈值,具体为:当故障分析模块检测到某类软硬件信息监测值超过其设置的门限阈值,对该类软硬件信息在短时间内持续监测,若仍存在监测值超过其设置的门限阈值则产生故障信息,否则视为误报信息;该故障分析模块根据故障信息严重程度、重要性和紧迫性,将故障信息分为四个级别:轻微故障、次要故障、重要故障、致命故障,故障分析模块针对故障信息的类别重要性以及超过的阈值级别,设定该故障信息对应的故障级别;相对应的,告警服务平台设定四种不同的告警级别:提示告警、次要告警、重要告警、紧急告警。
所述预处理模块处理满足预处理机制的故障信息,具体为:首先对满足预处理机制条件的故障信息进行分类,对每个类别支持预先设置对应的shell脚本或者处理程序;当故障分析模块检测到故障信息之后,核心调度模块首先检测该故障信息是否存在对应预处理机制:若存在预处理机制则将该故障信息传递给预处理模块处理,否则则将该故障信息传递给通讯模块。
所述三方故障接入模块通过两种方式接入第三方应用故障信息,第一种方式是将故障信息通过加密xml方式导出并放置到指定目录下,该三方故障接入模块定时扫描该指定目录,解析其中的xml加密文件获取故障信息,三方故障接入模块接收故障信息后,将故障信息传递给通讯模块,由该通讯模块传递给告警服务平台;第二个方式是通过socket通讯直接与告警服务平台通讯模块交互,将故障信息数据按照制定的标准规范,以按照xml或json格式的进行打包传递。
所述告警服务平台由核心调度模块、通讯模块、配置模块、前台展示模块、告警模块、联动模块组成,其中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东浪潮云服务信息科技有限公司,未经山东浪潮云服务信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710015718.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:发动机启动装置及其发动机
- 下一篇:发动机启动动力传动组件