[发明专利]海量元数据分片分布的方法及装置在审
申请号: | 201710005810.X | 申请日: | 2017-01-05 |
公开(公告)号: | CN107066503A | 公开(公告)日: | 2017-08-18 |
发明(设计)人: | 李雪生 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F3/06 |
代理公司: | 郑州大通专利商标代理有限公司41111 | 代理人: | 陈勇 |
地址: | 450000 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 海量 数据 分片 分布 方法 装置 | ||
技术领域
本发明属于文件系统海量元数据分布技术领域,特别是涉及一种海量元数据分片分布的方法及装置。
背景技术
任何文件系统中的数据分为数据和元数据。数据是指普通文件中的实际数据,而元数据指用来描述一个文件的特征的系统数据,诸如访问权限、文件拥有者以及文件数据块的分布信息(inode…)等等。在分布式文件系统中,分布信息包括文件在磁盘上的位置以及磁盘在集群中的位置。用户需要操作一个文件必须首先得到它的元数据,才能定位到文件的位置并且得到文件的内容或相关属性。用户使用文件系统过程中,文件系统元数据请求占据了所有请求50%以上的比例,诸如(readdir、getattr、open、close、setattr…)文件系统元数据对整个文件系统有着重要的影响。
大数据时代非结构化的数据成爆炸式的增长,采用文件系统管理海量数据的方式越来越广泛,但是文件数目巨大,例如,大规模传感器会产生海量的数据片段,形成数量庞大的小数据文件。通常的元数据都要加载到内存缓存,才能完成文件系统的基本功能,但是数据量巨大的元数据加载到内存缓存过程慢、冲突检测困难。传统的文件系统元数据管理方法已经不能满足数据增长的需要。例如:单目录文件个数为 N,那么一个目录在存储设备的空间大小M:M = 4KB * N(假设单元数据大小4KB), 当N为1亿的时候, 元数据数据块M大概0.4TB,以单盘性能100MB/s计算, 单是加载元数据到元数据的缓存就需要1个多小时,再加上超大的缓存问题,直接导致单目录无法支持海量数量的文件。
发明内容
本发明目的是提供一种海量元数据分片分布的方法及装置,本发明解决了单目录海量数目的文件,文件系统元数据管理效率低的问题。
为了实现上述目的,本发明采用以下的技术方案:
一种海量元数据分片分布的方法,包括以下步骤:
将单目录的元数据数据块划分为多个元数据分片;
元数据数据块依据预定规则分布在不同的元数据分片上;
将不同的元数据分片分别存储在多个存储设备上。
优选地,元数据数据块依据预定规则分布在不同的元数据分片上,进一步包括:
元数据数据块依据名称哈希到不同的元数据分片上;
同一个元数据分片对应具有相同哈希值的元数据数据块。
优选地,依据名称的哈希值,获得存储在不同存储设备上的元数据分片。
本发明还提供一种海量元数据分片分布的装置,包括:
单目录元数据数据块划分模块,用于将单目录的元数据数据块划分为多个元数据分片;
第一元数据数据块分布模块,用于元数据数据块依据预定规则分布在不同的元数据分片上;
元数据分片存储模块,用于将不同的元数据分片分别存储在多个存储设备上。
优选地,还包括:第二元数据数据块分布模块,用于元数据数据块依据名称哈希到不同的元数据分片上。
优选地,还包括:元数据分片对应模块,用于同一个元数据分片对应具有相同哈希值的元数据数据块。
优选地,还包括:元数据分片获取模块,用于依据名称的哈希值,获得存储在不同存储设备上的元数据分片。
与现有技术相比,本发明具有以下优点:
1.本发明将单目录的元数据数据块划分为多个元数据分片,元数据分片大小的减小,能够实现元数据缓存的加载、同步。
2.不同的元数据分片分别存储在多个存储设备上,能够实现元数据数据块的并发读写,大大提升元数据数据块的读写速度。
3. 同一个元数据分片对应具有相同哈希值的元数据数据块,所有元数据分片组成整个目录的命名空间,方便元数据数据块的管理和维护。
附图说明
图1是本发明一种海量元数据分片分布的方法的流程示意图;
图2是本发明单目录的元数据数据块划分和存储元数据分片的结构示意图;
图3是本发明一种海量元数据分片分布的装置的结构示意图。
具体实施方式
为了便于理解,对本发明中出现的部分名词作以下解释说明:
哈希值,哈希算法将任意长度的二进制值映射为固定长度的较小二进制值,这个小的二进制值成为哈希值。哈希值是一段数据唯一且极其紧凑的数值表示形式。如果散列一段明文而且哪怕只更改该段落的一个字母,随后的哈希都将产生不同的值。
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述:
本实施例提供一种海量元数据分片分布的方法,包括:
将单目录的元数据数据块划分为多个元数据分片;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710005810.X/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置