[发明专利]一种基于MapReduce的数据处理方法、装置、设备及介质在审
申请号: | 201911337908.0 | 申请日: | 2019-12-23 |
公开(公告)号: | CN111104225A | 公开(公告)日: | 2020-05-05 |
发明(设计)人: | 王吉伟;范渊 | 申请(专利权)人: | 杭州安恒信息技术股份有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 巴翠昆 |
地址: | 310000 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种基于MapReduce的数据处理方法、装置、设备及介质,包括:对待处理数据进行抽样,得到样本数据;利用所述样本数据中key的频次以及Reduce节点的数量确定出目标均值;利用所述目标均值、所述key的频次以及所述Reduce节点的当前负载确定出所述key与所述Reduce节点的分配对应关系;利用所述分配对应关系将所述key对应的所述待处理数据分配至对应的所述Reduce节点,以便所述Reduce节点进行相应的数据处理。这样,利用抽样数据中的key的频次与对应的Reduce节点建立分配对应关系,然后利用所述分配对应关系将key对应的待处理数据分配至对应的Reduce节点,能够降低数据倾斜程度,从而提升数据处理效率。 | ||
搜索关键词: | 一种 基于 mapreduce 数据处理 方法 装置 设备 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州安恒信息技术股份有限公司,未经杭州安恒信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911337908.0/,转载请声明来源钻瓜专利网。