[发明专利]数据索引构建方法及装置有效
申请号: | 201610515000.4 | 申请日: | 2016-07-01 |
公开(公告)号: | CN107562762B | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 刘颖慧 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 杨文娟;刘芳 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 索引 构建 方法 装置 | ||
本发明实施例提供一种数据索引构建方法及装置,其中,该方法包括:获取各修饰符在历史查询请求中出现的次数;遍历HBase数据表,确定所述次数超过预设阈值的各修饰符所在的数据行;为各所述数据行建立索引,形成索引表。本发明实施例提供的数据索引构建方法及装置,能够降低索引列表的内存占用率,提高数据查询效率。
技术领域
本发明实施例涉及数据库技术领域,尤其涉及一种数据索引构建方法及装置。
背景技术
HBase数据库是一种非关系型的分布式数据库模型,它基于Hadoop的分布式文件系统运行,采用列式存储数据。HBase数据表中每行有唯一的行键,也就是Rowkey,列数据通过列簇(Column Family)和其下的修饰符qualifier定义保存。所以,在HBase数据库中只有行键有索引,其他列并无索引。
目前的索引方案,都是针对数据的所有行数据,针对不同列簇,建立索引。HBase数据库是针对大数据服务的数据库,一般数据量都是百千万级、甚至上亿级,所以对所有数据行建立索引表,会耗费极大的存储空间,数据查询的速度较低。
发明内容
本发明实施例提供一种数据索引构建方法及装置,用以降低索引列表的内存占用率,提高数据查询的效率。
本发明实施例第一方面提供一种数据索引构建方法,该方法包括:
获取各修饰符在历史查询请求中出现的次数;
遍历HBase数据表,确定所述次数超过预设阈值的各修饰符所在的数据行;
为各所述数据行建立索引,形成索引表。
本发明实施例第二方面提供一种数据索引构建装置,该装置包括:
第一获取模块,用于获取各修饰符在历史查询请求中出现的次数;
第一确定模块,用于遍历HBase数据表,确定所述次数超过预设阈值的各修饰符所在的数据行;
构建模块,用于为各所述数据行建立索引,形成索引表。
本发明实施例,通过获取HBase数据表中各修饰符在历史查询请求中出现的次数,并为出现次数超过预设阈值的修饰符所在的数据行建立索引,形成索引表,从而降低了索引列表的内存占用率,提高了数据查询的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的数据索引构建方法的流程示意图;
图2为本发明实施例二提供的数据索引构建方法的流程示意图;
图3为本发明实施例三提供的数据索引构建装置的结构示意图;
图4为本发明实施例四提供的数据索引构建装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤的过程或结构的装置不必限于清楚地列出的那些结构或步骤而是可包括没有清楚地列出的或对于这些过程或装置固有的其它步骤或结构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610515000.4/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置