[发明专利]一种基于软硬件协同的计算机系统故障处理方法在审
申请号: | 201710020286.3 | 申请日: | 2017-01-12 |
公开(公告)号: | CN106815114A | 公开(公告)日: | 2017-06-09 |
发明(设计)人: | 温乃宁;史晓楠;贾鹏涛;李占利 | 申请(专利权)人: | 西安科技大学 |
主分类号: | G06F11/30 | 分类号: | G06F11/30;G06F11/34 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 710054*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 软硬件 协同 计算机 系统故障 处理 方法 | ||
技术领域
本发明涉及计算机系统故障处理技术领域,具体为一种基于软硬件协同的计算机系统故障处理方法。
背景技术
计算机系统由计算机硬件和软件两部分组成。硬件包括中央处理机、存储器和外部设备等;软件是计算机的运行程序和相应的文档。计算机系统具有接收和存储信息、按程序快速计算和判断并输出处理结果等功能;计算机系统的特点是能进行精确、快速的计算和判断,而且通用性好,使用容易,还能联成网络。①计算:一切复杂的计算,几乎都可用计算机通过算术运算和逻辑运算来实现。②判断:计算机有判别不同情况、选择作不同处理的能力,故可用于管理、控制、对抗、决策、推理等领域。③存储:计算机能存储巨量信息。④精确:只要字长足够,计算精度理论上不受限制。⑤快速:计算机一次操作所需时间已小到以纳秒计。⑥通用:计算机是可编程的,不同程序可实现不同的应用。⑦易用:丰富的高性能软件及智能化的人-机接口,大大方便了使用。⑧联网:多个计算机系统能超越地理界限,借助通信网络,共享远程信息与软件资源。
计算机系统的可用性是评价一个计算机系统稳定可靠的指标,其通常通过平均无故障时间来进行度量。平均无故障时间越长,则该计算机系统的可用性就越高。影响计算机系统可用性的因素既有软件方面也有硬件方面。软件故障通常指计算机系统的程序或软件因为某种因素破坏导致无法正常工作或影响正常使用,软件故障的影响域一般为软件自身以及依赖于此软件的其它软件或程序。硬件故障通常指计算机系统的物理硬件因为某种因素破坏导致无法正常工作或影响正常使用,硬件故障对计算机系统影响较大,严重时会导致系统宕机。
现有技术的计算机系统对于硬件故障的检测依赖于硬件驱动程序,而对于软件故障,通常采用定时轮询机制完成服务状态检测。完成故障检测后,立即按照驱动或程序默认策略进行故障处理,并记录各自的处理日志,现有的计算机系统故障处理缺乏软硬件故障统一管理,处理效率低。
发明内容
本发明的目的在于提供一种基于软硬件协同的计算机系统故障处理方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于软硬件协同的计算机系统故障处理方法,包括以下步骤:
A、选取计算机系统中至少两个节点作为计算机系统的管理节点,其中一个作为主节点,其余作为备用节点;
B、主节点实时检测系统服务故障和应用服务故障并生成故障报告口志,并通过故障报告接口输出故障报告;
C、备用节点实时检测系统硬件故障并生成故障报告日志,并通过故障报告接口输出故障报告;
D、对故障进行识别和恢复。
优选的,所述步骤D中故障识别和恢复方法包括以下步骤:采用控制流、数据流的同步状态反馈方式,以总线访问的等待信号、错误信号以及中断信号三种触发方式中断处理器当前运行流程,并根据事件驱动源、反馈信息进行故障识别和恢复。
优选的,所述步骤B中系统服务故障和应用服务故障检测方法包括以下步骤:
A、创建至少一组故障计数器,并设置故障计数器的计数增加值、减少值、门限值;
B、同一故障在一个检测周期内每出现一次,故障计数器即进行一次计数,当故障计数器的累积值达到门限值时,确认故障并记录。。
优选的,所述步骤C中系统硬件故障检测方法包括以下步骤:通过预先分布在故障注入接口、故障中断处理例程和硬件驱动中的多个硬件状态监测点检测对应的硬件状态信息,如果任意硬件状态监测点检测的硬件状态发生异常,则所述硬件状态监测点根据预设的规则收集对应硬件的现场数据作为硬件故障数据;将硬件故障数据进行封装生成故障报告并存入预设的故障消息队列;对故障消息队列进行调度分发并输出。
与现有技术相比,本发明的有益效果是:本发明的计算机系统故障处理方法简单,能够对计算机系统故障进行快速检测,处理效率高,故障处理规则扩展方便、能够保证计算机系统在软件故障或硬件故障下高可用性。
附图说明
图1为本发明的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明提供一种技术方案:一种基于软硬件协同的计算机系统故障处理方法,包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安科技大学,未经西安科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710020286.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于智能终端续航自动化测试的方法
- 下一篇:一种服务器运行状态监控系统