[发明专利]多核处理器软错误压力测试程序生成系统及方法在审
| 申请号: | 201210584290.X | 申请日: | 2012-12-28 |
| 公开(公告)号: | CN103902448A | 公开(公告)日: | 2014-07-02 |
| 发明(设计)人: | 喻之斌;须成忠;卓文伟 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
| 主分类号: | G06F11/36 | 分类号: | G06F11/36 |
| 代理公司: | 深圳市科进知识产权代理事务所(普通合伙) 44316 | 代理人: | 宋鹰武 |
| 地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 多核 处理器 错误 压力 测试 程序 生成 系统 方法 | ||
技术领域
本发明属于处理器技术领域,尤其涉及一种多核处理器软错误压力测试程序生成系统及方法。
背景技术
摩尔定律指出,当价格不变时,集成电路上可容纳的晶体管数目,约每隔18个月便会增加一倍,性能也将提升一倍。但每种新技术的产生,都会带来新的技术问题,阻碍新兴技术的推广与应用。“软错误”就是在制造工艺尺寸不断缩小的情况下产生的一种“瞬时错误”。这种错误使处理器的发展面临严峻的挑战,使处理器变得脆弱,更易受到环境的影响。
这种“瞬时错误”是由数字电路中的某一位的翻转所引起的,而翻转的发生则归咎于空间中存在的微小粒子,如宇宙射线的中子和包装材料中产生的α粒子。当这些粒子穿过半导体设备的时候会产生电子空洞,当产生的电子空洞达到一定数量后就会导致逻辑设备的状态发生翻转。这些逻辑设备包括寄存器,静态存储单元,逻辑门等。这种错误并不会导致设备的永久性失效,因此我们称之为“瞬时错误”,或者叫“软错误”(soft error)。
研究表明“软错误”的发生与宇宙粒子的流通密度和物理设备的几何尺寸相关。在不同的环境中宇宙粒子的流通密度不同从而会导致硬件设备的错误率出现差异,进而影响到软错误的发生率。与此同时,单个芯片上单位面积的晶体管数量的增加,虽然增加了设备的性能,但一定程度上增加了软错误的发生率。因为更小尺寸的晶体管更容易在上述粒子的轰击下翻转,在16纳米的工艺上,软错误的发生率是180纳米工艺上的100倍。
为了详细的研究、检测软错误产生的原因,使得处理器的能耗和性能达到一个合理的平衡,Shubhendu S.Mukherjee等人提出一种ArchitectedVulnerability Factor(AVF,体系结构弱点因子)模型分析方法。AVF指的是某个结构单元受宇宙射线影响出现错误,这种错误对程序的输出结果产生影响的可能性。
在微处理器的结构体单元中,并不是每一个软错误都会对程序的输出结果产生影响。因此,针对处理器的结构单元,我们称那些导致程序的输出结果产生错误的软错误发生的可能性为Architected Vulnerability Factor(AVF)。显然,不同的结构单元的中的AVF的大小不一样,基本范围是在0%-100%之间。
在AVF值的计算中,引入Architecturally Correct Execution(ACE,体系结构正确执行)概念,跟踪处理器所有结构中的状态位来计算AVF的值。其中ACE bits指的是处理器的结构单元中的某些数据位,当该存储单元发生软错误致使数据位发生改变时,会对程序的输出结果产生错误影响。而其他的数据位虽然会因为软错误的影响出现改变,但是不会对程序的输出结果产生影响,称之为un-ACE bits。对于AVF的值进行计算时,假定晶体管受宇宙射线影响发生翻转的概率一定,处理器结构单元的AVF值指的是具体某个时刻该存储单元中ACE bits所占有的比例大小。
由于确定某个数据位是否为ACE bits困难性很大,所以在计算某个结构单元的AVF值时,首先假定结构单元中所有的数据位均为ACE bits,然后通过分析得出的un-ACE bits所占有的比例,然后算得ACE bits所占有的比例值,也就是AVF的值。
在单核处理器领域,基于AVF的软错误的检测模型中,能准确的检测出某个具体测试程序发生软错误概率值的大小。但是,要想知道处理器发生软错误的概率范围值,必须检测多组测试程序,增加了测试的困难。而且,不同的处理器结构,所选择的测试程序也会不同。
从Christopher Weaver等人提出的减小软错误发生率的方法中,我们知道处理器结构中影响软错误发生率的因素,了解如何消除软错误检测机制中对软错误的误判。但是,该方法虽然实现对软错误率最大值的检测,但是其只是针对某个具体的结构单元而言,如指令队列、存储队列等。对于整个处理器的软错误的发生率,它只是简单的将所有单个单元测试的软错误发生率的值累加,这样得出的软错误发生率的最大值就会很片面,而且不能真实的反映某个时刻处理器软错误发生率的最大值。
为了能够高效的测出处理器出现软错误概率的上限值,Arun Arvind Nair利用一种新的技术自动生成能够检测出处理器最大软错误发生率的测试程序。该方法结合Christopher Weaver等人提出的影响软错误发生的影响因子,利用了AVF模型中软错误的检测方法,产生软错误的极限测试程序。然而,该方法仅限于在单核处理器结构上使用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210584290.X/2.html,转载请声明来源钻瓜专利网。





