[发明专利]并行文件系统发生故障后的恢复方法有效
| 申请号: | 200910085483.9 | 申请日: | 2009-05-22 |
| 公开(公告)号: | CN101567805A | 公开(公告)日: | 2009-10-28 |
| 发明(设计)人: | 舒继武;刘洋;易乐天;薛巍 | 申请(专利权)人: | 清华大学 |
| 主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L29/08;H04L29/06;G06F11/14 |
| 代理公司: | 北京众合诚成知识产权代理有限公司 | 代理人: | 朱 琨 |
| 地址: | 100084北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 并行 文件系统 发生 故障 恢复 方法 | ||
技术领域
并行文件系统发生故障后的恢复方法属于文件系统领域,尤其涉及其中的可靠性保护领域。
背景技术
存储区域网络(Storage Area Network,SAN)是目前被广泛采用的一种连接外接存储设备与服务器的架构,它采用光纤通道、磁盘阵列等技术,提供了良好扩展性,并被广泛应用于高性能计算等各个领域。这种架构的特点是,通过专门的网络连接各个存储设备,而对前端提供块级别的访问接口;前端将其视为直接连接的存储设备。
SAN环境并行文件系统是一种基于存储区域网络技术的并行文件系统,多个客户端可以并行地访问存储在SAN存储设备中的文件,这种访问对用户来说与访问本地文件相同。目前,并行文件系统广泛应用于高性能计算领域,而基于SAN环境的并行文件系统则进一步提高了并行文件系统整体资源利用率与性能。
发明内容
本发明的目的在于当SAN环境并行文件系统在发生故障并重启后,系统能够迅速恢复其状态的一致性。本项发明主要针对SAN环境并行文件系统可靠性的需求,设计并实现了一套在客户机和元数据服务器发生故障并重启后对系统状态进行恢复的方法。使用本方法可以在系统的机器发生故障后对其进行快速有效的恢复,并尽可能减少因发生故障而重启对文件系统造成的影响,保证文件系统的持续运行,提高整个系统的可靠性和可用性。
本发明的特征在于:本发明的核心是元数据服务器通过状态有效期维护客户机对所获得锁资源的状态,客户机和元数据服务器各自通过对方标识及状态有效期判断对方发生了由故障导致的重启,元数据服务器通过日志方法确保对在自身发生故障后重启时元数据一致性的快速恢复。
所述方法是在存储区域网络SAN环境并行文件系统中依次按照以下步骤实现的:
步骤(1).构造一个包括客户机、元数据服务器和磁盘阵列在内的所述SAN环境并行文件系统,其中:
客户机,至少一台,实现各种文件操作以及从所述元数据服务器获取相关文件的元数据,
元数据服务器,至少一台,通过以太网与所述客户机相连,同时通过光纤交换机访问磁盘阵列,把分布在磁盘阵列上的文件数据组织成统一的并行文件系统视图,并为所述客户机提供元数据操作服务,在所述并行文件系统中包括不同类型的锁和文件布局,不同类型的锁包括:字节锁byte-range lock、共享保留锁share reservation、文件授权锁file delegation、目录授权锁directory delegation,其中:
字节锁,用于对文件提供字节级别的访问控制,
共享保留锁,用于控制对文件访问的机制,由OPEN操作建立,说明所需的访问类型以及拒绝的访问类型,
文件授权锁,是可撤销的锁,其确保对所述文件授权锁的持有者不会发生不一致的OPEN操作和文件变更,以便在多个客户机之间没有对文件的冲突请求时,减少不断向所述元数据服务器发送请求所造成的开销,只有当有其它客户机对该文件提出访问请求时,才把该文件授权锁撤销,另外,即使当前不存在对该文件的相互冲突的访问请求,该元数据服务器也可以在任何时候撤销该文件授权锁,
目录授权锁,是可撤销的锁,其确保对所述目录授权锁的持有者不会发生不一致的目录修改,以便在多个客户机之间没有对目录的冲突请求时,减少不断向所述元数据服务器发送请求所造成的开销,只有当有其它客户机对该目录提出访问请求时,才把该目录授权锁撤销,另外,即使当前不存在对该目录的相互冲突的访问请求,该元数据服务器也可以在任何时候撤销该目录授权锁,
文件布局,描述文件数据到保存该数据的磁盘阵列之间的对应关系,确保作为所述布局持有者的客户机可以对文件数据进行访问,并且在访问过程中不会发生对数据的不一致变更,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910085483.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:对网络攻击进行检测的方法和装置
- 下一篇:PCC规则更新的方法、装置及系统





