[发明专利]一种医疗大数据存储中Hbase行键的编码及压缩方法有效

专利信息
申请号: 201611232111.0 申请日: 2016-12-28
公开(公告)号: CN106777258B 公开(公告)日: 2020-01-03
发明(设计)人: 于海龙;李建元;温晓岳 申请(专利权)人: 银江股份有限公司
主分类号: G06F16/22 分类号: G06F16/22;G06F16/27
代理公司: 33241 杭州斯可睿专利事务所有限公司 代理人: 王利强
地址: 310012 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 医疗 数据 存储 hbase 编码 压缩 方法
【权利要求书】:

1.一种医疗大数据存储中Hbase行键的编码及压缩方法,其特征在于:所述方法包括:

第一,对查询条件的编码压缩,过程如下:

步骤1.1、根据用到的查询条件,判断查询条件用到的值域是否固定,如果是固定值域,执行步骤1.2,否则执行步骤1.3和1.4;

步骤1.2、公共字典表中查找对应的编码是否存在,如果存在则返回对应的ID压缩码,否则将字典类别发给ID生成服务,将ID生成服务返回的ID编码生成ID压缩码,存入公共字典,返回ID压缩码;公共字典在Hbase中的结构为4位的字典类别代码、字典压缩包和描述;

步骤1.3、将值域拆分为前缀+后缀的形式,根据拆分后的前缀和业务编码到域表中查找对应的记录,如果存在则返回该前缀的ID压缩码,否则将业务编码发给ID生成服务,将ID生成服务返回的ID编码生成ID压缩码,存入域表中,返回前缀ID压缩码;域表的结构为编码前缀、固定宽度的业务编码、压缩码列和前缀ID压缩码;

步骤1.4、根据后缀和业务编码到码表中检索对应的记录,如果存在则返回压缩码,否则将业务编码发给ID生成服务,将ID生成服务返回的ID编码生成ID压缩码,存入码表中,返回后缀ID压缩码;码表的结构为编码后缀、固定宽度的业务编码、压缩码列和后缀ID压缩码;

步骤1.5、重复执行步骤1.1至步骤1.4,直至所有的查询条件编码完成,将所有输出的压缩码拼接成新的字符,作为业务数据的行键将业务数据存放到Hbase表中;

所述步骤1.3和1.4中,将业务编码发给ID生成服务,将ID生成服务返回的ID编码生成ID压缩码中,将前缀编码和业务编码作为行键放到域表中,使用ID生成服务根据业务编码生成编码序列——编码ID,再对编码ID生成前缀ID压缩码;

同样,将后缀编码和业务编码作为行键放到码表中,使用ID生成服务根据业务编码生成编码序列——编码ID,再对编码ID生成后缀ID压缩码;

最终,将原始编码转换的结果为:前缀ID压缩码+后缀ID压缩码;

所述步骤1.2、1.3和1.4中,将ID生成服务返回的ID编码生成ID压缩码中,使用长整型对行键中的信息进行编码,编码字符选择ASCII码中的可打印字符,并将数值型字串转换为字符型字串进行压缩。

2.如权利要求1所述的医疗大数据存储中Hbase行键的编码及压缩方法,其特征在于:所述方法还包括:第二、查询过程,如下:

步骤2.1、根据用到的查询条件,判断查询条件用到的值域是否固定,如果是固定值域,执行步骤2.2,否则执行步骤2.3和步骤2.4;

步骤2.2、根据字典类别和查询条件到公共字典表中查找对应的记录,返回压缩码;

步骤2.3、将值域拆分为前缀+后缀的形式,根据拆分后的前缀和业务编码到域表中查找对应的记录,返回前缀ID压缩码;

步骤2.4、根据拆分后的后缀和业务编码到码表中查找对应的记录,返回后缀ID压缩码;

步骤2.5、根据步骤2.2、步骤2.3、步骤2.4返回的压缩码到Hbase中查询业务数据,如果是多条件查询,重复步骤2.1至步骤2.4,将所有查询条件转换后到Hbase中查询业务数据。

3.如权利要求1或2所述的医疗大数据存储中Hbase行键的编码及压缩方法,其特征在于:所述步骤1.1和2.1中,判断值域是否固定,判断的依据是(1)、其值是否可枚举;(2)、该信息编码跨系统、跨机构是否统一;

对于固定值域,使用公共字典对其编码,编码从1开始依次递增;不同类别的信息各自编码;

对于不固定的值域使用域码表对其进行编码,编码也是从1开始依次递增,不同域的字典各自编码。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于银江股份有限公司,未经银江股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201611232111.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top