[发明专利]基于HADOOP的数据处理方法、访问代理装置和系统在审

专利信息
申请号: 201811440934.1 申请日: 2018-11-29
公开(公告)号: CN109302497A 公开(公告)日: 2019-02-01
发明(设计)人: 吴维伟;王志远;毛宝龙;刘洪通 申请(专利权)人: 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司
主分类号: H04L29/08 分类号: H04L29/08
代理公司: 中国国际贸易促进委员会专利商标事务所 11038 代理人: 曹蓓;方亮
地址: 100086 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 访问请求 访问代理装置 数据处理 客户端标识 客户 集群处理 选择位置 大数据 客户端 分配 机房 平行 转发 场景 优化
【说明书】:

本公开提出一种基于HADOOP的数据处理方法、访问代理装置和系统,涉及大数据技术领域。本公开的一种基于HADOOP的数据处理方法包括:接收来自客户端的访问请求,访问请求包括客户端标识;根据客户端标识选择位置与客户端的位置相当的NameNode;将访问请求转发给选择的NameNode。通过这样的方法,能够为客户端的访问请求就近分配NameNode,实现了利用单个访问代理装置为不同位置的多个NameNode分配访问请求,也避免客户端与NameNode距离远造成的平行流量大、影响集群处理性能的问题,优化了多机房场景下的HADOOP集群性能。

技术领域

本公开涉及大数据技术领域,特别是一种基于HADOOP的数据处理方法、访问代理装置和系统。

背景技术

随着HADOOP(海杜普)成为大数据处理的一个基础组件,各大公司纷纷使用HADOOP作为大数据平台的底层。但是随着集群规模的增长与业务量的激增,HADOOP集群会遇到很多瓶颈,其中最显著的缺点是NameNode(名称节点)的性能会限制集群存储规模的扩展。

HADOOP 3.0基线引入了RBF(Router-Based Federation,基于路由的联盟方案)来解决存储扩展问题。

发明内容

发明人发现,RBF适用于单机房的环境下,而在多机房场景时,无法满足性能要求。

本公开的一个目的在于优化多机房场景下HADOOP集群性能。

根据本公开的一些实施例的一个方面,提出一种基于HADOOP的数据处理方法,包括:接收来自客户端的访问请求,访问请求包括客户端标识;根据客户端标识选择位置与客户端的位置相当的NameNode;将访问请求转发给选择的NameNode。

在一些实施例中,选择位置与客户端的位置相当的NameNode包括:确定与客户端的位置最接近的NameNode和NameNode的运行资源占用率;将NameNode的运行资源占用率与预定门限相比较:若NameNode的运行资源占用率大于等于预定门限,则确定下一优先级的NameNode的运行资源占用率,并与预定门限相比较,若NameNode的运行资源占用率大于等于预定门限,则,确定下一优先级的NameNode的运行资源占用率并与预定门限相比较,直至NameNode的运行资源占用率小于预定门限NameNode,确定选择的NameNode;其中,NameNode与客户端之间的距离越短优先级越高。

在一些实施例中,客户端标识为客户端地址信息;选择位置与客户端的位置相当的NameNode包括:根据客户端地址信息和NameNode的地址信息确定客户端与NameNode间的路径;根据客户端与NameNode之间的路径长度选择位置与客户端的位置相当的NameNode。

在一些实施例中,客户端标识为客户端位置信息;选择位置与客户端的位置相当的NameNode包括:根据客户端位置信息和NameNode的位置信息选择与客户端位于同一机房的NameNode。

在一些实施例中,根据客户端标识选择NameNode包括:根据预存的客户端标识的位置信息确定客户端位于的机房;根据预存的NameNode的位置信息确定与客户端位于相同机房的NameNode;选择与客户端位于同一机房的NameNode。

在一些实施例中,选择与客户端位于同一机房的NameNode包括:在存在多个NameNode与客户端位于相同机房的情况下,则从与客户端位于相同机房的NameNode中:随机选择一个NameNode,或根据NameNode的运行资源占用率选择NameNode,或根据NameNode的预定优先级选择NameNode。

在一些实施例中,基于HADOOP的数据处理方法还包括:接收来自NameNode的访问结果并转发给客户端。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811440934.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top