[发明专利]一种基于系统重构的故障自愈系统及其实现方法有效
申请号: | 201510926572.7 | 申请日: | 2015-12-11 |
公开(公告)号: | CN105550056B | 公开(公告)日: | 2019-08-06 |
发明(设计)人: | 王乐;郭鹏;孙允明;谢建春;邸海涛;黄英兰 | 申请(专利权)人: | 中国航空工业集团公司西安航空计算技术研究所 |
主分类号: | G06F11/07 | 分类号: | G06F11/07 |
代理公司: | 西安智邦专利商标代理有限公司 61211 | 代理人: | 胡乐 |
地址: | 710065 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 系统 故障 自愈 及其 实现 方法 | ||
本发明提出一种基于系统重构的故障自愈方法,所应用的计算机系统在硬件上由多个功能模块和备份模块组成,在软件上包括故障管理、配置管理、系统蓝图等模块组成,其步骤依次为系统启动、配置加载、故障检测、故障记录、故障滤波、策略选择、配置更新、系统关闭。系统蓝图系统故障自愈的关键设计。它包括多个系统运行的配置项,每个配置项都描述了计算机系统的软件、硬件、网络等各种配置,计算机系统能够按照配置项的描述运行;这些配置项还包括对所有故障处理策略的描述。备份模块是系统自愈的必要条件,它能够在系统中某个模块发生不可恢复故障时,代替该模块的工作。本发明具有自愈策略简单、自愈过程可控、自愈结果确定的优点。
技术领域
本发明属于计算机领域,提供一种故障自愈方法。
背景技术
在一些频繁使用但维护困难的复杂计算机系统,如民用飞机机载电子系统、卫星星载电子系统中,设计者希望通过系统自愈的设计,达到提高系统的可用性,降低系统的维护周期和成本的目的。
当前所采用的自愈技术,主要通过针对故障位置的软件、硬件的重恢复,达到系统功能自愈的目的,一些常见的技术措施有:
(1)在可能发生故障的位置设计多个通道,故障发生后选择无故障的通道旁路故障通道,实现系统的自愈;
(2)当存储在永久性存储器中的软件代码、FPGA逻辑遭到破化后,使用正确的代码或逻辑覆写故障代码或逻辑,实现系统的自愈;
上述自愈技术主要针对系统局部功能的恢复设计,尽管具有较好的效果,但许多硬件故障仍然无法实现功能的自愈。
发明内容
本发明面向频繁使用的复杂计算机系统,通过在系统中设置备份模块,利用故障管理、配置管理、系统蓝图等功能模块,实现系统的故障自愈,从而提高系统的可用性,降低系统的维护周期和成本。
本发明的具体技术解决方案如下:
一种基于系统重构的故障自愈系统,其特征在于:包括
系统蓝图软件模块,包含一个无故障配置项和多个故障配置项,其中某一个配置项被设置为当前配置项;每个配置项都完整描述了计算机系统运行所需的各种配置(计算机系统按照配置项的描述运行),并包含故障处理策略;所述故障处理策略包括系统关闭、系统自愈和继续运行;
配置管理软件模块,用于在系统初始化后加载所述系统蓝图中的当前配置项到计算机系统中,使计算机系统按照当前配置项的描述正常运行或关闭系统;
故障管理软件模块,对计算机系统定期进行故障检测,对发生的故障实施甄别,滤去偶发的可恢复的故障,确定不可恢复故障的位置和类型,然后查询系统蓝图,确定故障处理策略,如果要求系统自愈,则更新当前配置项为能够旁路故障的故障配置项;以及
硬件备份模块,用以替代计算机系统中相应硬件功能模块以支持旁路故障。
本发明实现故障自愈的方法,包括以下步骤:
1]系统启动:在系统启动过程中完成系统各模块软硬件的初始化;
2]配置加载:加载系统蓝图中所描述的当前配置项到计算机系统中;
3]系统运行:计算机系统按照当前配置项的描述正常运行或关闭系统;
4]故障检测:在正常运行过程中,对组成计算机系统的各软硬件模块定期进行故障检测;
5]故障记录:当发现计算机系统发生故障后,对发生的故障进行初步判断,记录故障信息;
6]故障滤波:根据记录的故障信息,进一步对故障进行甄别,滤去偶发的可恢复的故障,确定不可恢复故障的位置和类型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国航空工业集团公司西安航空计算技术研究所,未经中国航空工业集团公司西安航空计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510926572.7/2.html,转载请声明来源钻瓜专利网。