[发明专利]一种支持多条件检索和实时分析的大数据处理方法有效

专利信息
申请号: 201710258652.9 申请日: 2017-04-19
公开(公告)号: CN107122437B 公开(公告)日: 2020-08-04
发明(设计)人: 陈志明;毛亮;黄仝宇;汪刚;宋一兵;侯玉清;刘双广 申请(专利权)人: 高新兴科技集团股份有限公司
主分类号: G06F16/2458 分类号: G06F16/2458;G06F16/27;G06F16/22;G06F16/2453
代理公司: 广州国鹏知识产权代理事务所(普通合伙) 44511 代理人: 葛红
地址: 510530 广东省广州*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 支持 条件 检索 实时 分析 数据处理 方法
【权利要求书】:

1.一种支持多条件检索和实时分析的大数据处理方法,其特征在于,包括对数据进行多条件检索过程和实时分析过程,其中所述多条件检索过程包括步骤如下:

S11.随机把用户的查询请求发送到任意一检索索引服务器节点,解析查询,生成查询树;

S12.启动分布式查询,基于检索索引的存储空间数,把查询请求转为多个子查询,并把每个子查询定位到对应的检索索引服务器;

S13.每个子查询把查询结果返回到S11步骤的索引服务器节点;

S14.把各个子查询的查询结果进行合并,最终返回给用户;

所述实时分析过程步骤包括:

S31.通过语法分析器对SQL字符串进行解析生成可执行的Statement实例,然后根据SQL的特征来生成查询计划;

S32.调用优化器检查是否能使用索引表优化查询,根据S31中的查询计划获取索引表中的目标数据,如果有命中索引,则返回命中的经过优化的查询计划,否则返回原查询计划;

S33.从步骤S32返回的查询计划中获取迭代器,且迭代器采用装饰设计模式进行识别,根据识别出的修饰词对迭代器作进一步的封装;

S34.用S33生成的迭代器来获取结果集,结果集中包含了Hbase数据库的扫描器,扫描器会通过RPC协议并行在各个Hbase数据库服务器的索引桶中进行扫描,同时结合协处理器以及自定义的过滤器来完成对数据的分析以及过滤;

S35.将S34中扫描到的数据汇聚到客户端供用户使用。

2.根据权利要求1所述的支持多条件检索和实时分析的大数据处理方法,其特征在于,步骤S11中涉及的检索索引是根据查询条件生成,其步骤包括:

S21.基于Hbase数据库实现WAL机制以及开启复制功能,利用中间件监听所有操作并获得对应的预写日志;

S22.利用自定义的特定的应用规则来从S21中获取到的预写日志中提取、转换和加载需要进行检索索引的数据;

S23.通过哈希算法对检索索引的唯一标识进行计算,从而获得索引所属的储存索引空间,最后把检索索引数据持久化到对应的索引空间中。

3.根据权利要求1所述的支持多条件检索和实时分析的大数据处理方法,其特征在于,实时分析过程中索引桶中分析索引数据是根据分析条件生成,具体包括步骤如下:

S41.Hbase数据库协处理器截取所有写操作,然后把写操作信息写入到主表的WAL中;

S42.为主表创建A、B、C顺序的分析索引,则索引表的行键INDEX_RK=A+B+C,最终索引表的结构为:INDEX_RK,RK;其中A,B,C为主表的3个列,而RK为主表的行键,INDEX_RK为索引表的行键;在索引表中A,B,C的值按顺序被合成为索引表的行键INDEX_RK;

S43.将分析索引数据分为N个桶进行存储,用一个前缀对S42中合成的INDEX_RK进行加盐,使得分析索引数据平均落到各个索引桶中,做到均衡负载,映射关系为:

FINAL_INDEX_RK=(index/N)+INDEX_RK;

其中,FINAL_INDEX_RK为最终经过加盐的行键,index为一个全局标记的数字,每次计算完一个FINAL_INDEX_RK后index会递增1,N为索引分桶数;

S44.根据FINAL_INDEX_RK将索引数据路由到相应的索引桶Ni并保存,其中Ni为第i个索引桶。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高新兴科技集团股份有限公司,未经高新兴科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710258652.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top