[发明专利]一种分布式文件系统的数据存储方法及装置在审
申请号: | 201710817132.7 | 申请日: | 2017-09-12 |
公开(公告)号: | CN107562913A | 公开(公告)日: | 2018-01-09 |
发明(设计)人: | 吴蜀魏 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F3/06 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 罗满 |
地址: | 450018 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分布式 文件系统 数据 存储 方法 装置 | ||
技术领域
本发明涉及分布式集群领域,特别是涉及一种分布式文件系统的数据存储方法及装置。
背景技术
随着互联网的发展以及互联网用户的不断增加,互联网中所产生的数据也在急剧膨胀,每天都有数以亿计的新数据产生。
单独的计算机受内存、CPU等硬件的限制,已无法满足对于海量数据存储和计算的要求。针对海量数据的处理的分布式文件系统应运而生,分布式文件系统技术将数据存储在集群中物理分散的多个存储节点中,对于集群中节点的资源进行统一的分配与管理,并且提供用户访问文件的接口。由于分布式文件系统具有分布式的优秀特性,可以将数据拆分成较小的数据分别存储到不同的集群节点,通过多个节点共同对数据进行处理,进而能够轻松实现PB级数据的存储以及计算。传统的分布式文件系统采用伪随机值产生哈希函数,哈希函数根据集群节点的剩余空间情况生成数据的分配策略,但是当进行某些小文件的存储时,由于小文件仅占用节点较少的空间,通过哈希函数所生成的分配策略仅会将小文件存储至集群中的某一个节点中,当小文件的数量很大时,频繁的写入以及读取小文件时会造成该节点的IO繁忙,因此相对会降低该节点的IO性能,进而造成集群整体可用性下降。
由此可见,提供一种分布式文件系统的数据存储方法以保证集群节点的IO性能,进而确保集群的高可用性,是本领域技术人员亟待解决的问题。
发明内容
本发明的目的是提供一种分布式文件系统的数据存储方法及装置,保证节点的IO性能,进而确保集群的高可用性。
为解决上述技术问题,本发明提供一种分布式文件系统的数据存储方法,包括:
统计分布式文件系统集群中的数据节点的预设参数;其中预设参数至少包括数据读写频率;
以预设参数为依据在数据节点中选取读写频率最低的数据节点作为目标节点;
获取数据,并将数据存储至目标节点。
优选的,预设参数还包括数据节点的剩余容量;
相应的,该方法进一步包括:
设置数据的数据量阈值;
判断数据的总量是否满足数据量阈值;
如果是,则以预设参数为依据在数据节点中选取读写频率最低的数据节点作为目标节点具体为:
以预设参数为依据在剩余容量最大的数据节点中选取读写频率最低的数据节点作为目标节点。
优选的,该方法进一步包括:
设定执行周期并记录在执行周期中目标节点的数据读写频率的变化。
优选的,该方法进一步包括:
设置频率阈值,并判断数据读写频率的变化是否超过阈值;
如果是,则进行错误提示。
优选的,以预设参数为依据在数据节点中选取读写频率最低的数据节点作为目标节点具体为:
通过哈希函数在数据节点中选取读写频率最低的数据节点作为目标节点。
优选的,该方法进一步包括:
获取目标节点的IO状态,并将IO状态进行记录。
此外,本发明还提供一种分布式文件系统的数据存储装置,包括:
统计模块,用于统计分布式文件系统集群中的数据节点的预设参数;
节点选取模块,用于以预设参数为依据在数据节点中选取读写频率最低的数据节点作为目标节点;
数据存储模块,用于获取数据,并将数据存储至目标节点。
优选的,该装置进一步包括:
阈值设定模块,用于设置数据的数据量阈值;
判断模块,用于判断数据的总量是否满足数据量阈值,
如果是,则执行节点选取模块。
优选的,该装置进一步包括:
频率记录模块,用于设定执行周期并记录在执行周期中目标节点的数据读写频率的变化。
优选的,该装置进一步包括:
状态记录模块,用于获取目标节点的IO状态,并将IO状态进行记录。
本发明所提供的分布式文件系统的数据存储方法,将数据节点的读写频率作为选取数据节点的依据。可以理解的是,读写频率较低的数据节点在集群中不经常被使用,因此可以认为该数据节点相比于被频繁使用的其它数据节点具有更高的IO性能,因此选取读写频率低的数据节点进行数据的存储能够均衡集群对于数据的整体处理性能。此外,在存储小文件时,本方法避免小文件频繁的写入同一节点的情况,进而避免当小文件数量较大而造成节点IO繁忙,保证了节点的IO性能,进而确保集群的高可用性。此外,本发明还提供一种分布式文件系统的数据存储装置,有益效果如上所述。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710817132.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:新浪微博事件推荐方法
- 下一篇:基于资源掩码的需求响应资源快速定位方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置