[发明专利]一种分布式newSQL数据库系统及方法有效
申请号: | 201710585103.2 | 申请日: | 2017-07-17 |
公开(公告)号: | CN107402995B | 公开(公告)日: | 2020-06-09 |
发明(设计)人: | 张中弦;谭恒亮 | 申请(专利权)人: | 云润大数据服务有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/25 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 梁顺宜;郝传鑫 |
地址: | 510000 广东省广州市天*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分布式 newsql 数据库 系统 方法 | ||
1.一种分布式newSQL数据库系统,其特征在于,包括:
数据库接口,用于用户向Master发送请求,并接收master返回的结果;
Master,用于负责以JDBC、ODBC的方式接入用户请求并且协调多个处理器之间的数据通讯以及管理整体流程,并将所述用户请求优先发送给SQLPlaner;所述master连接一监视器,用于负责元数据管理以及用于监控底层hbase Region的负载,避免特定的region负载过高,以及利用hbase coprocessor重新分配Region;
SQLPlaner,用于解析所述用户请求,编译以及定制执行计划;
分布式事务管理器,用于协调所述计划中多方完成分布式事务管理;
并行任务执行器,用于负责所述计划的任务并行地执行,以及将从数据库获得的数据进行归并汇总以返回给master。
2.如权利要求1所述的分布式newSQL数据库系统,其特征在于,所述并行任务执行器通过hbase和搜索引擎服务器向所述数据库获取数据。
3.如权利要求1所述的分布式newSQL数据库系统,其特征在于,所述定制执行计划包括:
通过所述数据库接口输入SQL语句;
判断共享缓存池中是否已经存在该SQL,如若存在,输出该SQL对应的执行计划;
否则,对SQL语句进行语法检查和进行语义检查,语法检查和语义检查通过后,对SQL语句进行视图以及表达式转换;
根据转换结果进行优化器选择;
根据所述优化器的选择结果选择数据连接方式以及连接顺序;
根据所述连接方式和所述连接顺序选择搜索路径;
根据所述搜索路径生成执行计划并输出。
4.如权利要求2所述的分布式newSQL数据库系统,其特征在于,所述Master还用于建立和查询多个二级索引,包括:
利用所述hbase的Coprocessor和Filter生成针对数据的索引表:所述Coprocessor根据索引定义将以倒排索引的方式将索引数据并行写入所述索引表,从而建立多个二级索引;
所述Master根据查询条件动态计算使用索引的代价:所述Coprocessor会根据索引定义以及查询条件优先查询所述索引表,并行地通过所述索引表查询结果再次查询数据表。
5.如权利要求2所述的分布式newSQL数据库系统,其特征在于,所述并行任务执行器还用于实现半结构化数据存取,包括
所述并行任务执行器将JSON数据作为普通字符串类型整体作为一个字段写入到所述hbase的数据表中;所述hbase中的coprocessor根据字段描述,提取JSON中的数据,以倒排索引的方式将索引数据写入到另外的hbase索引表中,完成半结构化数据的存储;
所述并行任务执行器根据查询条件,利用coprocessor并行地查询索引表;所述hbase中的索引coprocessor将索引表的索引ID返回给所述并行任务执行器;所述并行任务执行器根据所述索引ID,利用hbase的API查询数据表,返回结果,完成半结构化数据的获取。
6.如权利要求2所述的分布式newSQL数据库系统,其特征在于,所述并行任务执行器还用于实现图片数据存取,包括
所述并行任务执行器将图片数据生成信息摘要算法加密后的图像数据格式,将加密后的图片数据写入到原始数据表;所述并行任务执行器将加密后的所述图片数据写入到图片数据表中进行独立存储;
并行任务执行器根据查询条件,查询原始数据表,得到信息摘要算法加密后的图像数据;并行任务执行器根据加密后的所述图像数据,利用所述hbase的API查询图片数据表,获取图片数据。
7.如权利要求6所述的分布式newSQL数据库系统,其特征在于,所述实现图片数据存取,还包括
所述hbase底层增加LOB类型,针对LOB类型建立另类索引,将大对象图片数据存储为所述数据库中的一个位图,图片数据以位图存储在独立的数据表中,原始数据表仅仅存储索引ID。
8.如权利要求2所述的分布式newSQL数据库系统,其特征在于,所述并行任务执行器通过hbase和搜索引擎服务器向所述数据库获取数据,包括
所述并行任务执行器将需要全文检索的字段作为普通字符串类型写入到所述hbase的数据表中进行存储,所述hbase中的coprocessor根据字段描述,将数据写入到搜索引擎服务器中进行索引;
所述并行任务执行器根据查询条件,到所述搜索引擎服务器中查询具体的索引ID,所述搜索引擎服务器根据查询条件返回索引ID,所述并行任务执行器根据索引ID,利用所述hbase的API查询数据表,获取查询数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云润大数据服务有限公司,未经云润大数据服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710585103.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多元组层次划分的分类方法及装置
- 下一篇:基于云控的界面生成方法