[发明专利]文件系统及数据布局方法有效
| 申请号: | 201811547400.9 | 申请日: | 2018-12-18 |
| 公开(公告)号: | CN109840247B | 公开(公告)日: | 2020-12-18 |
| 发明(设计)人: | 王洋;夏明辉;须成忠 | 申请(专利权)人: | 深圳先进技术研究院 |
| 主分类号: | G06F16/18 | 分类号: | G06F16/18;G06F16/13 |
| 代理公司: | 深圳市科进知识产权代理事务所(普通合伙) 44316 | 代理人: | 吴乃壮 |
| 地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文件系统 数据 布局 方法 | ||
本发明提供一种文件系统,文件系统包括成本计算模块和区域划分模块,成本计算模块用于计算或预估文件系统中文件请求的访问成本,成本计算模块能够向区域划分模块输出成本模型;区域划分模块用于将文件划分到的不同区域,以使得给定访问的总成本最小化;区域划分模块还用于获得区域对应的条带大小。本发明还提供一种数据布局方法。现有技术相比本发明的有益效果是:该文件系统通过将文件划分为一组最优区域的方式来支持区域级的数据布局,而且通过该文件系统能够确定最优区域及对应条带大小,故此,该文件系统能够优化混合型存储系统的数据布局,进一步该文件系统能够灵活地适应工作负载的变化和存储系统的异构性,能够显著加快I/O系统性能。
技术领域
本发明属于数据布局技术领域,尤其涉及一种文件系统和一种数据布局方法。
背景技术
随着大规模数据密集型应用在各个应用领域不断增加,I/O(输入/输出)性能正成为存储系统的瓶颈。为了解决这个问题,本领域技术人员相继将诸多并行文件系统(Parallel File System,简称PFS)引入高性能存储系统当中。上述的并行文件系统包括OrangeFS、Lustre、GPFS、PanFS和PLFS等,各并行文件系统的简介如下:
1、OrangeFS是虚拟并行文件系统(PVFS)的一个分支,其与PVFS类似,是一个针对高性能计算以及高性能数据访问所提出的一种并行文件系统。与传统的PVFS相比,Ora-ngeFS致力于提高小文件处理的性能、增加服务器的交叉容错及提供安全访问控制。
2、Lustre是HP、Intel、Cluster File System公司联合美国能源部开发的Linux集群并行文件系统,Lustre采用分布式的锁管理机制来实现并发控制,元数据和文件数据的通讯链路分开管理。
3、GPFS是General Parallel File System的缩写。源自IBM公司的GPFS是一个可扩展、高性能、基于共享磁盘的通用并行文件系统,GPFS能为存储系统中的所有节点提供并行、高速、安全、可靠的数据存取。
4、PanFS是由Panasas公司研发的并行文件系统,PanFS是通用的并行文件系统,目前其主要的应用领域和luster类似,PanFS可扩展行,其能够通过分布式锁提供的强一致性。
5、PLFS是一款开源的并行检查点存储文件系统。
综上,基于这些并行文件系统就能够执行跨多个服务器分发数据文件的操作,因此,并行文件系统(PFS)可以允许并行应用的多个任务以聚合的I/O带宽形式同步访问数据文件。
但是现有的并行文件系统(PFS)也并不是没有缺陷的,其缺陷在于,现有的并行文件系统(PFS)与基于新型存储技术的混合型存储系统不匹配。在逐步展开描述不适配问题之前,首先需要阐明的是基于新型存储技术的混合型存储系统的情况,随着新型存储技术的发展,基于闪存的固态驱动器(Solid State Disk,简称SSD)应用越发广泛,较硬盘驱动器(Hard Disk Drive,简称HDD)而言,固态驱动器具有存储效率高、响应快和成本高的特点,所以,综合考虑,一个合理的存储系统不适合全部由硬盘驱动器组成,因为读写和响应速度偏慢,合理的存储系统也不适宜全部由造价很高的固态驱动器组成,换言之,固态驱动器在一个大型集群中并不会完全取代硬盘驱动器。因此,使用同时包括基于固态驱动器的服务器和基于硬盘驱动器的服务器的混合型存储系统是一种优选策略。这种策略对于有限成本预算下的HPC系统更加实用。HPC是高性能计算(High Performance Computing)机群的简称。
另一方面,并行文件系统(PFS)的效率取决于有效的数据文件布局,即数据文件如何在可用节点上分布,大多数现有的布局方案使用固定大小的条带分割成多个服务器上分布数据文件,还利用固定大小的条带提供来自多个服务器的并发数据访问,这甚至使得每个服务器上都有数据放置。虽然现有的布局方案实现简单,易被广泛使用,但这样的布局方案显然是适用于使用了同质服务器的存储系统,不适用于混合型存储系统。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳先进技术研究院,未经深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811547400.9/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





