[发明专利]一种实现大数据处理的方法及装置有效

专利信息
申请号: 201310646544.0 申请日: 2013-12-04
公开(公告)号: CN103617268B 公开(公告)日: 2017-01-18
发明(设计)人: 王志军;廖慧 申请(专利权)人: 中国联合网络通信集团有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京安信方达知识产权代理有限公司11262 代理人: 栗若木,白莹
地址: 100033 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 实现 数据处理 方法 装置
【权利要求书】:

1.一种实现大数据处理的方法,其特征在于,包括:

在分布式系统基础架构hadoop外部环境,利用预先设置的拆分策略拆分hadoop总查询任务;

按照拆分的hadoop查询任务,在hadoop的分布式存储系统中分别进行hadoop内部查询;

将各内部查询结果按照预先设置的存储策略存储在hadoop外部环境;

通过hadoop外部查询方式对存储信息进行统计并显示。

2.根据权利要求1所述的方法,其特征在于,所述拆分策略包括:根据时间分布、和/或,查询用户流量使用类型进行查询拆分。

3.根据权利要求1所述的方法,其特征在于,所述进行统计的方法包括:

对各拆分任务的内部查询结果的每一页进行查询统计,并将各拆分任务每一页内部查询结果的查询统计信息进行合并,得到相应拆分任务的统计信息;

将相应拆分任务的统计信息进行合并,得到总查询任务的统计结果。

4.根据权利要求1所述的方法,其特征在于,所述按照存储策略存储在hadoop外部环境包括:

将内部查询结果按照存储策略分为:常态数据和非常态数据;

按照常态数据和非常态数据进行分级存储,

当内部查询结果是常态数据,当常态数据量大于hadoop外部环境的内存容量时,根据内存容量,首先,曾经访问过的查询页面保存在内存中,再将内部查询结果部分存入内存;剩余常态数据存入hadoop外部环境的硬盘中;当常态数据量小于hadoop外部环境的内存容量时,将所有内部查询结果存储在内存中;

当内部查询结果为非常态数据,将内部查询结果全部存储在外部环境的硬盘中。

5.根据权利要求4所述的方法,其特征在于,该方法还包括:按照查询频率,设定删除周期以删除内部查询结果中的常态数据。

6.一种实现大数据处理的装置,其特征在于,设置于hadoop外部环境,包括:控制单元、任务拆分单元、分级存储单元、统计显示单元;其中,

控制单元,用于在接收到查询任务时,控制任务拆分单元进行任务拆分;控制分级存储单元对内部查询结果进行存储;控制统计显示单元对存储的内部查询结果进行统计及显示;

任务拆分单元,用于预先设置的拆分策略拆分hadoop总查询任务,发往hadoop内部进行数据查询;

分级存储单元,用于设置接收hadoop内部查询结果,按照存储策略存储在hadoop外部环境;

统计显示单元,用于通过查询指令对分级存储信息进行统计和显示。

7.根据权利要求6所述的装置,其特征在于,所述的拆分策略包括:根据时间分布、和/或,查询用户流量使用类型进行查询拆分。

8.根据权利要求6所述的装置,其特征在于,所述进行统计包括:

对各拆分任务的内部查询结果的每一页进行查询统计,并将各拆分任务每一页查询统计信息进行合并,得到相应拆分任务的统计信息;

将相应拆分任务的统计信息进行合并,得到总查询任务的统计结果。

9.根据权利要求6所述的装置,其特征在于,所述按照存储策略存储在hadoop外部环境包括:

将内部查询结果按照存储策略分为:常态数据和非常态数据;

按照常态数据和非常态数据进行分级存储,

当内部查询结果是常态数据,当常态数据量大于hadoop外部环境的内存容量时,根据内存容量,首先,曾经访问过的查询页面保存在内存中,再将内部查询结果部分存入内存;剩余常态数据存入hadoop外部环境的硬盘中;当常态数据量小于hadoop外部环境的内存容量时,将所有内部查询结果存储在内存中;

当内部查询结果为非常态数据,将内部查询结果全部存储在外部环境的硬盘中。

10.根据权利要求9所述的装置,其特征在于,该装置还包括删除单元,用于按照查询频率,设置删除周期以删除内部查询结果中的常态数据。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310646544.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top