[发明专利]一种医疗大数据存储中Hbase行键的编码及压缩方法有效
申请号: | 201611232111.0 | 申请日: | 2016-12-28 |
公开(公告)号: | CN106777258B | 公开(公告)日: | 2020-01-03 |
发明(设计)人: | 于海龙;李建元;温晓岳 | 申请(专利权)人: | 银江股份有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/27 |
代理公司: | 33241 杭州斯可睿专利事务所有限公司 | 代理人: | 王利强 |
地址: | 310012 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 医疗 数据 存储 hbase 编码 压缩 方法 | ||
1.一种医疗大数据存储中Hbase行键的编码及压缩方法,其特征在于:所述方法包括:
第一,对查询条件的编码压缩,过程如下:
步骤1.1、根据用到的查询条件,判断查询条件用到的值域是否固定,如果是固定值域,执行步骤1.2,否则执行步骤1.3和1.4;
步骤1.2、公共字典表中查找对应的编码是否存在,如果存在则返回对应的ID压缩码,否则将字典类别发给ID生成服务,将ID生成服务返回的ID编码生成ID压缩码,存入公共字典,返回ID压缩码;公共字典在Hbase中的结构为4位的字典类别代码、字典压缩包和描述;
步骤1.3、将值域拆分为前缀+后缀的形式,根据拆分后的前缀和业务编码到域表中查找对应的记录,如果存在则返回该前缀的ID压缩码,否则将业务编码发给ID生成服务,将ID生成服务返回的ID编码生成ID压缩码,存入域表中,返回前缀ID压缩码;域表的结构为编码前缀、固定宽度的业务编码、压缩码列和前缀ID压缩码;
步骤1.4、根据后缀和业务编码到码表中检索对应的记录,如果存在则返回压缩码,否则将业务编码发给ID生成服务,将ID生成服务返回的ID编码生成ID压缩码,存入码表中,返回后缀ID压缩码;码表的结构为编码后缀、固定宽度的业务编码、压缩码列和后缀ID压缩码;
步骤1.5、重复执行步骤1.1至步骤1.4,直至所有的查询条件编码完成,将所有输出的压缩码拼接成新的字符,作为业务数据的行键将业务数据存放到Hbase表中;
所述步骤1.3和1.4中,将业务编码发给ID生成服务,将ID生成服务返回的ID编码生成ID压缩码中,将前缀编码和业务编码作为行键放到域表中,使用ID生成服务根据业务编码生成编码序列——编码ID,再对编码ID生成前缀ID压缩码;
同样,将后缀编码和业务编码作为行键放到码表中,使用ID生成服务根据业务编码生成编码序列——编码ID,再对编码ID生成后缀ID压缩码;
最终,将原始编码转换的结果为:前缀ID压缩码+后缀ID压缩码;
所述步骤1.2、1.3和1.4中,将ID生成服务返回的ID编码生成ID压缩码中,使用长整型对行键中的信息进行编码,编码字符选择ASCII码中的可打印字符,并将数值型字串转换为字符型字串进行压缩。
2.如权利要求1所述的医疗大数据存储中Hbase行键的编码及压缩方法,其特征在于:所述方法还包括:第二、查询过程,如下:
步骤2.1、根据用到的查询条件,判断查询条件用到的值域是否固定,如果是固定值域,执行步骤2.2,否则执行步骤2.3和步骤2.4;
步骤2.2、根据字典类别和查询条件到公共字典表中查找对应的记录,返回压缩码;
步骤2.3、将值域拆分为前缀+后缀的形式,根据拆分后的前缀和业务编码到域表中查找对应的记录,返回前缀ID压缩码;
步骤2.4、根据拆分后的后缀和业务编码到码表中查找对应的记录,返回后缀ID压缩码;
步骤2.5、根据步骤2.2、步骤2.3、步骤2.4返回的压缩码到Hbase中查询业务数据,如果是多条件查询,重复步骤2.1至步骤2.4,将所有查询条件转换后到Hbase中查询业务数据。
3.如权利要求1或2所述的医疗大数据存储中Hbase行键的编码及压缩方法,其特征在于:所述步骤1.1和2.1中,判断值域是否固定,判断的依据是(1)、其值是否可枚举;(2)、该信息编码跨系统、跨机构是否统一;
对于固定值域,使用公共字典对其编码,编码从1开始依次递增;不同类别的信息各自编码;
对于不固定的值域使用域码表对其进行编码,编码也是从1开始依次递增,不同域的字典各自编码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于银江股份有限公司,未经银江股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611232111.0/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置