[发明专利]一种分布式处理数据的系统及方法无效

专利信息
申请号: 201210013801.2 申请日: 2012-01-17
公开(公告)号: CN102542071A 公开(公告)日: 2012-07-04
发明(设计)人: 李海军 申请(专利权)人: 深圳市同洲视讯传媒有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京德琦知识产权代理有限公司 11018 代理人: 王一斌;王琦
地址: 518057 广东省深圳市南山*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 分布式 处理 数据 系统 方法
【权利要求书】:

1.一种分布式处理数据的系统,其特征在于,该系统包含:

数据获取模块,根据预设的抽取条件,从分布的数据源中抽取获得第一数据,根据预设的清洗转换规则,对第一数据进行数据清洗和转换,将数据清洗和转换后的第一数据装载到表格中,并加载到数据仓库模块;

数据仓库模块,按照预设的分表规则,对表格进行拆分,从拆分后的表格中提取第一数据,获得表格数据和第一数据,保存表格数据,按照预设的分区规则,对第一数据进行分类,并保存在相应的分区中;

数据访问模块,根据输入的指令,从数据仓库模块中读取表格数据和第一数据,将第一数据装载到表格数据对应的表格中,并输出包含第一数据的表格。

2.根据权利要求1所述的系统,其特征在于,所述数据获取模块包含:

数据抽取单元,根据预设的抽取条件,从分布的数据源中抽取获得第一数据,并输出至数据处理单元;

数据处理单元,根据预设的清洗转换规则,对第一数据进行数据清洗和转换,并输出至数据装载单元;

数据装载单元,对第一数据进行整理,将第一数据装载到表格中,加载包含第一数据的表格至数据仓库模块。

3.根据权利要求1所述的系统,其特征在于,所述数据仓库模块包含:

管理节点,根据外部输入的指令,启动或关闭SQL节点和数据节点,管理配置文件和日志文件,将数据节点上报的关键信息写入日志文件;

至少一个SQL节点,每一个SQL节点根据其保存的表格数据,与保存在表格中的第一数据的数据节点建立一对一的连接关系,SQL节点按照预设的分表规则,对表格进行拆分,从拆分后的表格中提取第一数据,获得表格数据和第一数据,输出第一数据至数据节点,保存拆分后的表格数据;

至少一个数据节点,从管理节点获取配置文件,检索获得配置数据,完成节点的配置,按照预设的分区规则,对第一数据进行分类并保存在相应的分区中。

4.根据权利要求3所述的系统,其特征在于,所述SQL节点还为表格数据建立与其对应的表索引,还为每一个拆分后的表格保存用以存放表结构的第一文件、用以存放表数据的第二文件及用以存表索引的第三文件。

5.根据权利要求3或4所述的系统,其特征在于,预设的分表规则为垂直分表规则或水平分表规则;

所述垂直分表规则为将一个(N1+N2)个字段的表Tab拆分成N1字段的第一子表Tab1和(N2+1)字段的第二子表Tab2;所述第二子表Tab2记载有与第一子表Tab2间的关联关系的主键信息;

所述水平分表规则为将表格中的第一数据按照预设的哈希Hash算法进行计算,根据计算结果对表格进行拆分。

6.根据权利要求3或4所述的系统,其特征在于,所述预设的分区规则为按范围分区、按列表list分区、按哈希HASH分区或按关键词KEY分区;

所述按范围分区为以字段中记载的数据为基础,将设定的连续数值范围作为与分区对应的分区文件中的数据的选择条件;

所述按列表list分区为以字段中记载的数据为基础,将设定的属性值作为与分区对应的分区文件中的数据的选择条件;

所述按哈希HASH分区为根据预设的分区数量对字段记载的数据进行哈希计算,将哈希计算结果作为与分区对应的分区文件中的数据的选择条件;

所述按关键词KEY分区为根据预设的表达式对字段记载的数据进行计算,将计算结果作为与分区对应的分区文件中的数据的选择条件。

7.根据权利要求4所述的系统,其特征在于,所述数据访问模块包含:

数据检索单元,根据输入的指令,从SQL节点中查找第三文件包含的表索引,获得第一文件及第二文件,将第一文件及第二文件输出至表格生成单元,读取与SQL节点建立连接关系的数据节点中保存的第一数据,并输出至表格生成单元;

表格生成单元,根据第一文件和第二文件,生成表格,将第一数据填入表格中并输出。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市同洲视讯传媒有限公司,未经深圳市同洲视讯传媒有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210013801.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top