[发明专利]一种基于还原程序的硬件故障检测方法有效
| 申请号: | 200910226770.7 | 申请日: | 2009-12-30 |
| 公开(公告)号: | CN101751334A | 公开(公告)日: | 2010-06-23 |
| 发明(设计)人: | 谭庆平;李建立;宁洪;徐锡山;徐建军;周会平;谭兰芳 | 申请(专利权)人: | 中国人民解放军国防科学技术大学 |
| 主分类号: | G06F11/36 | 分类号: | G06F11/36 |
| 代理公司: | 国防科技大学专利服务中心 43202 | 代理人: | 郭敏 |
| 地址: | 410073 *** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 还原 程序 硬件 故障 检测 方法 | ||
技术领域
本发明涉及一种硬件故障检测的方法,尤其是在空间辐射环境下对由于单粒子效应 引起的电子器件的故障进行检测的方法。
背景技术
空间探测活动投入大、风险高,对可靠性有着极高的要求。太空中影响空间探测器 安全的主要因素是宇宙射线的辐射,因为这些宇宙射线中的高能带电粒子流会使电子器 件出现硬件故障。空间辐射环境对电子器件的影响主要表现为单粒子效应。
普通计算机所使用的芯片一般是商用微处理器COTS(Commercial Off-the-Shelf), 在空间环境中,为了防止空间辐射的影响,一般使用经过特殊工艺设计与加工的微处理 器芯片,即抗辐照器件。抗辐照器件主要通过硬件冗余实现容错,具有很高的可靠性。 但是由于其设计非常复杂,研制周期很长,产业规模和产量都很小,价格非常昂贵。由 于硬件的冗余,抗辐照器件的芯片面积通常成倍增加,这不仅使芯片成品率下降,也带 来了功耗的迅速增长。而且按照这种方式生产出来的抗辐照器件的性能通常落后于同时 代的COTS很多代。COTS由于产量很大且使用广泛、经过充分的市场竞争,所以一般 性能很高,价格相对较低,且任何国家都无法对其进行封锁和禁运。其缺点是对空间环 境比较敏感,容易产生单粒子效应。
计算机发展的历史表明,很多原本用硬件实现的技术同样可以用软件来实现,在 COTS上进行面向硬件故障的软件容错可以弥补COTS在容错能力方面的不足。国内外 已开展很多实验探讨在空间环境中能否使用以及如何使用COTS。实验结果表明:在 COTS上面向硬件故障的软件容错方法所实现的性能,可以比基于抗辐照器件的空间计 算机高一个数量级;面向硬件故障的软件容错方法可以有效提高基于COTS的空间计算 机的可靠性,能够很好地应对空间辐射的影响,同时还能够使成本降低。
通过与采用抗辐照器件的硬件容错方法比较可以发现,基于COTS的软件容错方法 除可靠性方面比硬件容错方法略低之外,在性能、成本、功耗和灵活性方面都拥有巨大 的优势。软件容错方法包括故障检测、定位、恢复等过程,其中,故障检测是故障定位 及恢复的基础。空间辐射环境中的单粒子效应可能导致星载计算机上的寄存器、存储器、 缓存等存储部位出现故障,也可能导致总线、算术逻辑运算单元、指令译码器等功能部 件出现故障。这些故障可能致使计算机中的指令序列出现执行顺序错误或者数据错误, 前者又称控制流错误。针对数据错误和控制流错误,现有的软件容错方法一般采用不同 的故障检测策略分别对其检测。其中针对数据错误的故障检测策略又可分为两类:(1) 基于程序简单复算的方法;(2)基于数据差异性变换的方法。软件实现的故障检测策略 作用的对象一般是程序编译后得到的汇编语言程序(简称源程序),实现的方法一般是在源 程序中插入容错需要的指令,这些插入的容错指令合称为冗余程序。
1.基于程序简单复算的方法是将源程序的指令复制得到冗余程序,程序执行时在预 设的检测点比较源程序和冗余程序的执行结果,如果二者一致则认为源程序执行正确, 否则认为系统存在故障。同时为了提高故障检测率,冗余程序的执行要基于冗余的存储 空间。这种方法的关键在于设置检测点。一般检测点设置越多,则程序运行时的错误延 迟越小,系统可靠性越高,但检测指令一般耗时较多,所以检测点的增加必定导致程序 性能开销的增加。
单粒子效应具体又可分为单粒子翻转、单粒子闩锁和单粒子烧毁三种。其中,单粒 子翻转是瞬时故障,通过重写可以恢复原来的状态。单粒子闩锁在重新加电后一般可以 恢复,但如果电路状态被锁定时间太长,则可能成为永久性故障。单粒子烧毁是永久性 故障。基于程序简单复算的方法可有效检测出系统发生的瞬时故障,但是很难检测出发 生在总线、算术逻辑运算单元、指令译码器等部件上的永久性故障。这种方法还存在存 储开销较大的不足。
2.基于数据差异性变换的方法
这种方法是对基于程序简单复算方法的改进。它是将源程序复制得到冗余程序,但 冗余程序的执行基于不同的输入数据,冗余程序的输入数据D和源程序的输入数据d之 间存在函数关系f,即D=f(d),程序执行时,在预设的检测点比较冗余程序和源程序的执 行结果,如果二者之间也保持函数关系f,则认为源程序运行正确,否则说明系统发生故 障。这种方法的难点在于如何设计函数关系f,通常的做法是将f设计为倍乘关系,即 D=k*d,整数k称为差异化因子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910226770.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:帘片编织机的图案自动编织机构
- 下一篇:吸发器





