[发明专利]镜像数据存储系统中的增强错误检测有效
申请号: | 201110352224.5 | 申请日: | 2011-11-09 |
公开(公告)号: | CN102708021A | 公开(公告)日: | 2012-10-03 |
发明(设计)人: | D·A·吉尔伯特 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F11/08 | 分类号: | G06F11/08 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 金晓 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 存储系统 中的 增强 错误 检测 | ||
技术领域
本发明涉及的领域是镜像数据存储系统。具体地,本发明涉及镜像数据存储系统中的错误检测。
背景技术
在存储系统(例如计算机中的磁盘系统或存储器子系统)中经常要复制或镜像存储内容以在故障之后继续操作;在存储器子系统中这被称作存储器镜像,而在磁盘存储系统中则被称作RAID 1。
已经意识到磁盘是计算机系统中与生俱来的不可靠部件。镜像是一种允许系统自动保留多份数据拷贝的技术,以使得在磁盘硬件故障的情况下,系统能够继续处理或者快速恢复数据。镜像可以在本地完成,此时镜像专门用于应对磁盘的不可靠性;或者镜像可以远程完成,此时镜像构成更加复杂的灾难恢复方案的一部分;或者镜像可以既在本地完成又远程地完成,特别是对于高可靠性系统。通常数据被镜像到物理相同的驱动器上,但是该过程也可以被应用于逻辑驱动器,其中下层的物理格式被隐含在镜像过程中。通常镜像被设置为硬件解决方案(例如磁盘阵列)或者被设置为操作系统中的软件。
在运行的存储系统中,从存储器中读回的值中发现少量错误并不罕见。在随机存取存储器(RAM)中,会因为由阿尔法粒子或宇宙射线在RAM内的相互作用造成的故障单元和临时性故障而出现错误。为了处理这些偶尔出现的错误,系统包括有错误校验码(ECC)。
ECC存储了一些附加的数据位作为存储块的摘要。在重新载入数据时,根据载入数据(Dr)重新计算ECC(Ec)并将其与从存储器中读取的ECC摘要信息(E)相比较。如果它们不相同,那么(对于某些错误)ECC就能够指示要针对哪一位以恢复初始值。
任何特定的ECC系统对于在给定的存储块内能够检测出的错误数量以及能够校正多少错误都有限制。例如,ECC系统可以确保能够保留足够的信息以校正单个位的错误或检测成对的错误。在这样的系统中,如果块内有3个位损坏,那么ECC可能可以检测到错误或者也可能检测不到,并且如果没有检测到,那么系统就无法在错误值和正确值之间加以区分。
在既有镜像又有ECC的系统中,两者通常是独立的-意思就是说镜像的每一侧都有ECC,并且如果ECC检测到无法校正的错误,那么唯一的选择就是使用来自其他镜像的数据。
参照图1,示意图示出的镜像数据系统100包括第一镜像110和第二镜像120。
第一镜像110包括存储在存储介质中的数据集合D1 111(英文有误)。将ECC算法130应用于数据集合D1 111以生成ECC值E1 112。
类似地,第二镜像120包括存储在存储介质中的数据集合D2 121。将相同的ECC算法130应用于数据集合D2 121以生成ECC值E2 122。
第一镜像110中的恢复数据151包括从存储介质中读取的并且应该与数据集合D1 111相同的恢复数据集合Dr1 113(以虚线指示)。恢复数据集合Dr1 113将ECC算法130应用于自身以生成期望的ECC值Ec1 114。ECC恢复值Er1 115也是从存储介质中读取的并且应该与ECC值E1 112相同(以虚线指示)。
第二镜像120中的恢复数据152包括从存储介质中读取的并且应该与数据集合D2 121相同的恢复数据集合Dr2 123。恢复数据集合Dr2 123将ECC算法130应用于自身以生成期望的ECC值Ec2 124。ECC恢复值Er2 125也是从存储介质中读取的并且应该与ECC值E2 122相同(以虚线指示)。
每一个镜像都具有数据集合(D1、D2)和ECC值集合(E1、E2)。相同的算法被用于两个镜像以使E1=ECC(D1)和E2=ECC(D2)。在读取时,恢复数据(Dr1、Dr2)被用于计算期望的ECC值Ec1=ECC(Dr1),Ec2=ECC(Dr2)。如果Ec1=E1,那么D1正确,如果Ec2=E2,那么D2正确。不匹配就表明数据或ECC数据损坏。如果有任意一项匹配,那该数据就被假定为正确。如果两项都匹配,那就可以随意选择。ECC无法检测的错误将允许读取已损坏的数据。
也可以比较Dr1和Dr2来检测错误。如果Dr1和Dr2不匹配(即使是通过了错误校验),那么ECC未检测到的错误已被检测出来但是不能被校正,原因在于无法获知Dr1和Dr2中哪一个才是正确的。
随着计算集群规模的增长和存储容量的增大,整个系统内的错误数量也会增加。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110352224.5/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置