[发明专利]一种机器故障自动化处理方法有效
| 申请号: | 201510973293.6 | 申请日: | 2015-12-23 |
| 公开(公告)号: | CN105630620B | 公开(公告)日: | 2019-04-16 |
| 发明(设计)人: | 常现超 | 申请(专利权)人: | 浪潮集团有限公司 |
| 主分类号: | G06F11/07 | 分类号: | G06F11/07 |
| 代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 张靖 |
| 地址: | 250100 山东*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 机器 故障 自动化 处理 方法 | ||
本发明公开了一种机器故障自动化处理方法,所述方法通过在操作系统的内核中打入故障补丁模块,用于收集机器故障信息,将故障的详细信息封装好通过内核态和用户态的传输通道模块,将收集的故障信息传送到用户态,供故障统计分析模块使用,列出故障分布图表,然后将故障分析结果传送给故障处理模块进行处理。本发明方法使用内核热补丁的方式,将内核产生的故障信息传输得到用户态,并将这些信息集中管理、统计、分析,以及自动化处理,大大减少了故障管理的工作,实现故障管理的自动化,能及时有效的发现并解决故障,保证系统及关键服务的安全、可靠的运行,均具有很高的技术价值。
技术领域
本发明涉及计算机故障处理技术领域,具体涉及一种机器故障自动化处理方法。
背景技术
随着计算机技术以及集成电路技术的飞速发展,不论从软件还是硬件,计算机都得到了飞速提升。由于计算机硬件的增加,同时也提高了计算机硬件的故障率,给管理员带来很大的挑战,需要经常的关注机器的健康状态,即便如此也很难做到及时发现故障。机器产生故障时,需要管理员查看大量的系统日志并分析,花费很长时间去修复故障的设备,而且现在有些服务数据量巨大,服务器的集群也是相当大,维护起来相当的费时费力,而且可能严重影响服务的质量。
发明内容
本发明要解决的技术问题是:本发明提供一种机器故障自动化处理方法,能够解决上述问题。
本发明所采用的技术方案为:
一种机器故障自动化处理方法,所述方法通过在操作系统的内核中打入故障补丁模块,用于收集机器故障信息,将故障的详细信息封装好通过内核态和用户态的传输通道模块,将收集的故障信息传送到用户态,供故障统计分析模块使用,列出故障分布图表,然后将故障分析结果传送给故障处理模块进行处理。
所述故障补丁模块,负责收集内核中产生的机器故障信息,以故障补丁模块的方式向内核中添加代码,不用修改已安装的内核(如使用kpatch工具就可以实现该功能),很方便在各个机器上使用该方法处理故障。
所述内核态和用户态传输通道模块,通过创建一个用户态和内核态通信的通道,将故障信息安全高效的传输到用户态。
所述故障处理模块,根据故障分析的结果,对该故障自动做合理的处理,如自动修复故障,若修复不成功,还可以隔离该故障,以免该故障对系统或者关键服务造成严重的影响,产生严重的后果,同时把故障的处理结果及详细的信息发送给管理员,以确保故障处理是否合理。
所述方法当前使用的机器的Linux操作系统支持kpatch,kpatch是内核热补丁(kernel patch)工具,热补丁就是操作系统在运行过程中打入内核补丁。
所述方法操作过程如下:
首先将收集故障的补丁模块加载到内核中;
然后利用kpatch工具产生故障补丁模块并加载到操作系统中;
当机器产生故障后补丁模块就会收集到相关故障信息,然后将该信息放入到netlink的通道中,发送到用户态;Netlink是Linux系统中内核态和用户态通信的方式;
当故障信息被传送到用户态,对这些信息做统计,制作图表或曲线更直观的观察故障,根据故障的类型及原因做相应的故障处理,如内存错误,可以将故障的内存做离线,避免了故障内存再次被使用,使系统不稳定。
本发明的有益效果为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮集团有限公司,未经浪潮集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510973293.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于为磁盘阵列分配缓存的设备和方法
- 下一篇:JAVA容器的同步化方法及系统





