[发明专利]分布式数据处理方法在审

申请号：	201710440374.9	申请日：	2017-06-03
公开（公告）号：	CN107135272A	公开（公告）日：	2017-09-05
发明（设计）人：	吴征天;郑灿辉;张扬	申请（专利权）人：	苏州科技大学
主分类号：	H04L29/08	分类号：	H04L29/08
代理公司：	暂无信息	代理人：	暂无信息
地址：	215000 ***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	分布式数据处理方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及一种分布式数据处理方法，尤其是一种针对大数据的分布式数据处理方法。

背景技术

数据处理一般分为集中式数据处理和分布式数据处理。集中式数据处理存在的最大问题是数据处理速度较慢，同时，对计算机的性能要求也比较高。

由于个人计算机的性能得到极大的提高及其使用的普及，使处理能力分布到网络上的所有计算机成为可能。分布式计算是和集中式计算相对立的概念，分布式计算的数据可以分布在很大区域。

分布式网络中，由于每台计算机都能够处理数据，所以不要求计算机功能十分强大，其价格也就不必过于昂贵。这种类型的计算机可以适应用户的各种需要，同时允许他们共享网络的数据、资源和服务。在分布式网络中使用的计算机既能够作为独立的系统使用，也可以把它们连接在一起得到更强的网络功能。但是，目前的分布式数据处理存在这样一个问题，由于多台子计算机在数据处理时，当子计算机完成任务后，其则停止工作，而其他未完成任务的子计算机还有继续工作，这样造成了资源的浪费。

发明内容

本发明的目的是提供一种计算速度快、可充分利用子计算机的分布式数据处理方法。

根据本发明的一个方面，提供一种分布式数据处理方法，其包括：

S1，主计算机根据子计算机的数量把数据分成相应的段数，每台子计算机分配一个子数据；

S2，子计算机收到主计算机发来的子数据，每台计算机独立求解分配到的子数据；

S3，子计算机内部自我调节，先完成任务的子计算机分担未完成任务的子计算机任务；

S4，把计算结果发给主计算机；

S5，主计算机接收每个子计算机的计算结果；

S6，主计算机将结果汇总输出。

优选地，根据所述子计算机的计算能力给所述子计算机设置不同的权重，所述主计算机根据每台子计算机的权重给子计算机分配相应的子数据，所有子计算机的权重加在一起为1。

优选地，给子计算机按顺序编号，先完成任务的子计算机优先分担其后面的最靠近的未完成任务的子计算机任务。

优选地，所述先完成任务的子计算机分担未完成任务的子计算机剩余任务的50％。