[发明专利]一种避免Hbase数据热点的方法及系统有效
申请号: | 201610024940.3 | 申请日: | 2016-01-14 |
公开(公告)号: | CN105681414B | 公开(公告)日: | 2019-01-01 |
发明(设计)人: | 雷果;叶春生;车新奕;程涛木;王敏;刘军徽 | 申请(专利权)人: | 深圳市博瑞得科技有限公司 |
主分类号: | H04L29/08 | 分类号: | H04L29/08 |
代理公司: | 深圳市恒申知识产权事务所(普通合伙) 44312 | 代理人: | 王利彬 |
地址: | 518057 广东省深圳市南山区高新*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 避免 hbase 数据 热点 方法 系统 | ||
本发明适用于数据存储,提供了一种避免Hbase数据热点的方法,步骤包括:A,读取待存储数据,根据需要选取字段内容作为初始主键,然后用散列算法对初始主键进行处理得到主键值,对主键值进行均匀分段得到若干主键段;B,根据若干主键段确定用于分配主键段的若干区域,然后将若干主键段均匀分配至若干区域中;C,将得到的若干区域均匀分配至每一区域服务器中。本发明将Hbase的整个存储模式综合考虑,不仅仅要考虑Region的数量,更需要综合考虑Region的大小,相比现有的其他基于Hbase的避免热点的方法,本发明效果更为显著,对于Hbase的使用性能提升较大,大大提升了Hbase对大数据的处理存储能力,从根本上避免了Hbase数据热点的问题。
技术领域
本发明属于数据存储领域,尤其涉及一种新型的避免Hbase数据热点的方法及系统。
背景技术
随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。大数据时代网民和消费者的界限正在消弭,企业的疆界变得模糊,数据成为核心的资产,并将深刻影响企业的业务模式,甚至重构其文化和组织。因此,大数据对国家治理模式、对企业的决策、组织和业务流程、对个人生活方式都将产生巨大的影响。如何利用大数据更加贴近消费者、深刻理解需求、高效分析信息并作出预判,是决定我们能否有效利用大数据这座“金矿”的重要基础。然而面对这种海量数据、高并发访问的情况,数据库能提供稳定、可靠的性能则是至关重要的。但传统的数据库的处理能力以及处理效率已经远远不能满足这种大数据的处理需求。
在这种技术背景下,面向大数据分析分布式的数据库应运而生。Hbase是Hadoop上的一个NoSQL数据库的实现,同时也是一个分布式的、面向列的开源数据库。它提供了强大的可扩展性和数据操作性能。
在Hbase中,仅能通过主键(rowkey)和主键的range(范围)来检索数据,仅支持单行事务,主要用来存储非结构化和半结构化的松散数据。
Hbase的数据存储模式如下:
1、Table(表)中的所有行都按照rowkey的字典序排列。
2、Table在行的方向上将rowkey分割为多段,每个Region(区域)即承载多段rowkey数据。
3、Region按大小分割的,每个表一开始只有一个Region,随着数据不断插入表,Region不断增大,当增大到一个阀值的时候,Region就会等分为两个新的Region。当table中的行不断增多,就会有越来越多的Region。
4、Region是Hbase中分布式存储和负载均衡的最小单元。最小单元就表示不同的Region可以分布在不同的Region Server(区域服务器)上。但同一个Region是不会拆分到多个server(服务器)上的。在Hbase中由Master(主机)负责分配Region到各个不同的Region Server上,Region Server负责存储实际的数据。但如果Region Server上的负载不均衡或者每个Region Server中的服务请求数量不均衡,这些都将影响HBase的服务性能。
因此,如何避免Hbase数据热点策略不仅仅与Region Server的负载均衡有关,还与rowkey合理分段有关。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市博瑞得科技有限公司,未经深圳市博瑞得科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610024940.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置