[发明专利]一种云数据迁移方法在审
申请号: | 201510586212.7 | 申请日: | 2015-09-15 |
公开(公告)号: | CN105227645A | 公开(公告)日: | 2016-01-06 |
发明(设计)人: | 赵晶;姜雪松;袁家恒 | 申请(专利权)人: | 齐鲁工业大学 |
主分类号: | H04L29/08 | 分类号: | H04L29/08 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 孟峣 |
地址: | 250353 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 迁移 方法 | ||
技术领域
本发明涉及数据存储技术领域,具体地说是一种实用性强的云数据迁移方法。
背景技术
具备高可靠性及可扩展性的海量数据存储对互联网公司来说是一个巨大的挑战,传统的数据库往往很难满足该需求,并且很多时候对于特定的系统绝大部分的检索都是基于主键的的查询,在这种情况下使用关系型数据库将使得效率低下,并且扩展也将成为未来很大的难题。在这样的情况下,使用存储将会是一个很好的选择。对部署在云环境的存储系统而言,数据迁移是实现节点动态扩展与弹性负载均衡的关键技术,主要包括迁移计划(migrationplan)制定、路由信息同步、用户请求转发及数据一致性管理等核心内容。数据迁移过程中伴随的大量状态同步会给系统性能带来一定影响,因此,如何有效降低迁移开销是云服务提供商需着力解决的问题。然而,存储系统的有状态性、新的虚拟化环境、用户严格的低延迟要求以及访问负载的不可预知性和时变性给数据迁移带来了新的挑战。
现有的很多算法为了解决数据迁移的时间和系统资源消耗问题,有以下几种方法:1)针对存储服务数据迁移过程中的QoS保障问题,作者提出了一种基于反馈控制的方法,周期性地求解满足QoS约束的最优迁移速率,主要关注迁移带宽的控制问题。2)基于贪心法的数据迁移策略,主要针对Key/Value存储系统的数据迁移问题,基本思想是,采用统计方法在线监测热点分区,优先将热点分区的部分数据迁移至负载较轻的邻居节点.为简化迁移操作的复杂度,哈希算法会保持Key值间的先后顺序.这两部分工作的主要不足在于未考虑迁移开销。
对云存储系统而言,数据迁移是实现节点动态扩展与弹性负载均衡的关键技术。如何降低系统开销是云服务提供商需着力解决的问题。虽然已有研究工作大多针对非虚拟化环境下的数据迁移问题,但是这些方法对于云存储系统而言往往并不适用。为应对上述挑战,将数据迁移问题纳入负载均衡场景解决。提出一种降低系统开销保持系统性能的数据迁移策略,该发明基于均衡度制订数据迁移策略,选取最优的数据迁移操作,以达到系统的负载均衡。
发明内容
本发明的技术任务是针对以上不足之处,提供一种实用性强、云数据迁移方法。
一种云数据迁移方法,其具体实现过程为:
将一个文件分为一个或数个块来存储,每个块是独立的存储单位,以块为单位在集群服务器上分配存储;将每个块作为一个分区,并将分区作为是数据迁移和负载监测的基本单位;
将所有存储节点按照标准化后的负载值与系统总节点数的关系分别归入迁入节点集合In_set和迁出节点集合Out_set;
在云环境中各节点之间通过数据迁移算法达到系统负载的均衡,即将Out_set中各节点中的部分数据迁移到In_set中各节点上,该迁移过程通过数据迁移算法计算每个数据分区在节点间迁移的最小资源消耗来控制全局和局部搜索最终实现系统的资源最优化。
所述数据迁移算法具体为:
首先对所有迁入节点进行初始化,在该初始阶段,存储系统依据所有存储节点标准化后的负载值与1/n的关系初始化N个迁入节点,即N侦查报文发现N个食物源;此时,N侦察报文变为引领报文,一个引领报文对应一个迁入节点;
所有引领报文将相关信息发送给迁出节点,这里的相关信息包括:迁出节点的位置信息、带宽、待迁入节点可迁入数据量;
迁出节点根据所有迁入节点的收益率,以一定的概率选择某个迁入节点,即选择收益率高的迁入节点;当引领报文发现的迁入节点在连续若干次迭代后,没有得到更新时,就放弃该迁入节点,对应的引领报文成为侦查报文,继续去寻找新的迁入节点。
所述数据迁移前,存储系统检测负载均衡度,该负载均衡度设有阈值,当达到设置的阈值时,触发数据迁移动作。
所述负载均衡度的具体检测过程为:
1)节点i的实际负载值为bi,首先根据以下公式对各节点进行无量纲化处理,其中Bi为节点i可承受最大负载:
li=bi/Bi;
2)根据以下公式对各节点负载作标准化处理:
p={p1,p2,p3,…,pn}为标准化后的节点负载,n为集群节点数;
3)采用信息熵表表征集群的负载分布情况,其计算方式见以下公式,熵值越高,表明负载分布越趋于均匀;而熵值越低,则表明负载分布越不均:
当pi=1/n(i=1,2,3,…,n),即各节点负载相等时,系统取得最大熵值H(P)max=log(n);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于齐鲁工业大学,未经齐鲁工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510586212.7/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置