[发明专利]一种元数据集群中负载转移方法及系统有效
申请号: | 201410114579.4 | 申请日: | 2014-03-25 |
公开(公告)号: | CN103916467B | 公开(公告)日: | 2017-02-08 |
发明(设计)人: | 王洋;郑彩平;张军伟;邵冰清;王利虎;张浩 | 申请(专利权)人: | 中国科学院计算技术研究所;天津中科蓝鲸信息技术有限公司 |
主分类号: | H04L29/08 | 分类号: | H04L29/08;G06F9/50 |
代理公司: | 北京律诚同业知识产权代理有限公司11006 | 代理人: | 祁建国,梁挥 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 集群 负载 转移 方法 系统 | ||
技术领域
本发明涉及集群文件系统的元数据负载分布技术,特别涉及一种元数据集群中多个服务器之间元数据负载转移方法。
背景技术
在大规模集群文件系统中,元数据与数据服务分离已经成为了一种趋势。一方面,数据访问不必通过元数据服务器,而是采用带外方式直接访问存储设备,从而获取较高的数据访问性能;另一方面,元数据服务器专门提供元数据服务,卸载了数据访问负载,从而单台元数据服务器可以支持更高的客户端访问性能,管理更多的存储设备,支持更大的系统规模扩展。然而,随着系统规模的不断扩大,单台元数据服务器逐渐成为制约系统扩展的瓶颈。为了进一步提升集群文件系统的扩展能力,通常采用多台元数据服务器构成元数据服务器集群,以分散元数据负载,支持通过增加元数据服务器数量达到集群文件系统的横向扩展。
以目录为粒度、把一些子目录的负载转移到其他元数据服务器是元数据负载分散的一种常用方法,被Lustre、BWFS等集群文件系统所采用。元数据负载的分布是在子目录的创建过程中,以创建远程子目录的方式将子目录元数据负载转移到其他的元数据服务器,即选择父目录所在的元数据服务器之外的元数据服务器进行子目录创建,该子目录称为远程子目录。远程子目录的创建和删除过程涉及到多个元数据服务器,需要多次的网络交互开销和一致性维护开销,增加了系统实现复杂度,对元数据服务性能,尤其对远程子目录创建、删除延迟性能产生了较大影响。
以典型的Lustre文件系统中基于子目录的负载转移方法为例,分析其远程子目录的创建和删除过程的开销。
Lustre文件系统远程子目录创建步骤:
步骤1,客户端首先选择一个负载转移目标元数据服务器RMDS(Remote MDS),为待创建的子目录分配FID,FID唯一标识Lustre文件系统中的一个文件或目录对象;然后发送远程子目录创建请求MKDIR到父目录所在的元数据服务器MMDS(Master MDS),请求参数中包含客户端已分配的子目录FID。
步骤2,父目录所在的元数据服务器MMDS创建一个分布式事务,在所述事务中完成负载转移目标元数据服务器RMDS根据FID创建子目录对象、设置相应对象属性并同步磁盘、父目录所在的元数据服务器MMDS在父目录中添加子目录项并同步磁盘的操作。所述分布式事务涉及到多个元数据服务器,为保证一致性需要多次的网络交互和磁盘同步开销。
Lustre文件系统远程子目录删除步骤:
步骤1,客户端发送远程子目录删除请求RMDIR到父目录所在的元数据服务器MMDS。
步骤2,父目录所在的元数据服务器MMDS创建一个分布式事务,在所述事务中完成父目录所在元数据服务器MMDS在父目录中删除子目录项并同步、负载转移目标元数据服务器RMDS释放子目录对象并同步的操作。所述分布式事务涉及到多个元数据服务器,为保证一致性需要多次的网络交互和磁盘同步开销。
可见,Lustre采用分布式事务日志记录和磁盘同步写的方式保证涉及到多个元数据服务器的远程子目录创建、删除操作的一致性。然而,分布式事务需要多次的网络交互和磁盘同步开销,对操作延迟影响较大。
发明专利“分布式文件系统虚拟目录组织及命名空间管理的方法”公开了一种分布式文件系统虚拟目录组织及命名空间管理的方法,包括以下步骤:根据用户查询请求和上下文,利用文件系统中文件元数据,以关系代数的方式按需计算和动态生成虚拟目录,以虚拟文件视图的层现形式为用户提供满足当前上下文的文件服务;在虚拟目录命名空间中进行文件创建、删除、移动、重命名、打开、关闭、读、写、截断的文件操作,以及进行上下文目录的创建、删除和重命名的操作。该专利的有益效果为,在大规模海量文件存储系统中引入按需计算和动态生成的虚拟目录,克服了传统层次目录结构无法提供按需服务的缺点,提供了一种高效的文件检索和组织形式。在虚拟目录的组织过程中引入了包含文件属性和上下文的文件元数据,能根据上下文的变化为用户主动提供文件服务。但是该专利引入一种新的分布式文件系统虚拟目录组织和命名空间管理方法,在虚拟目录中进行文件创建、删除、重命名等操作,力求能根据上下文的变化为用户主动提供文件服务。不涉及元数据负载在多元数据服务器之间的分布。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所;天津中科蓝鲸信息技术有限公司,未经中国科学院计算技术研究所;天津中科蓝鲸信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410114579.4/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置