[发明专利]一种云环境下的网络优化方法和装置有效
申请号: | 201910068142.4 | 申请日: | 2019-01-24 |
公开(公告)号: | CN111475250B | 公开(公告)日: | 2023-05-26 |
发明(设计)人: | 龚志刚;游亮 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F9/455 | 分类号: | G06F9/455 |
代理公司: | 上海知锦知识产权代理事务所(特殊普通合伙) 31327 | 代理人: | 汤陈龙;李丽 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 环境 网络 优化 方法 装置 | ||
本发明涉及云计算技术领域,尤其涉及一种云环境下的网络优化方法和装置,该方法包括:根据N个节点之间的延迟,将N个节点划分为M类;根据M类节点中待测试节点之间的延迟,确定至少一个第一环,每个第一环中各相邻节点之间的延迟小于预设延迟;对至少一个第一环中的节点进行优化网络的归约操作。通过本申请的技术方案,在现有网络环境下,通过充分考虑各个节点之间的延迟,将相邻节点间延迟满足要求的节点归类并基于归类后的节点创建自适应延迟,动态优化的环形网络,从而可以有效的改善分布式以及单机人工智能训练的扩展性。
技术领域
本发明涉及云计算技术领域,尤其涉及一种云环境下的网络优化方法和装置。
背景技术
在云环境下可扩展图形处理器(Graphics Processing Unit,GPU)集群使用的是虚拟专用网络((Virtual Private Cloud,VPC),也就是虚拟化的25Gb或者10Gb的以太网链路,这些资源被虚拟化并被多个虚拟机(Virtual Machine,VM)所共享。对于一个可扩展GPU集群来说,并不能保证分配出来的所有节点都位于同一个虚拟交换机下,也不能保证一个可靠的延迟上限。且对于云上最普通的VPC网络资源,相比较于线下的IB网络,延迟产生的影响会很大,尤其是在跨虚拟交换机的情况下,节点数过多的情况下,延迟的影响会更加的严重,甚至会让整个分布式训练失去扩展性。
然而,现有方案均是直接在硬件层面采用昂贵的IB硬件,降低所有节点之间的延迟,这种方案导致成本大幅增加。
发明内容
本说明书实施例的目的是提供一种云环境下的网络优化方法和装置,通过在现有网络环境下,创建自适应延迟,动态优化的环形网络,有效改善分布式以及单机人工智能训练的扩展性。
为了实现上述目的,本申请实施例采用下述技术方案:
第一方面,提供一种云环境下的网络优化方法,包括:
根据N个节点之间的延迟,将所述N个节点划分为M类,其中,N和M均为正整数,且N远大于M;
根据M类节点中待测试节点之间的延迟,确定至少一个第一环,每个所述第一环中各相邻节点之间的延迟小于预设延迟;
对至少一个所述第一环中的节点进行优化网络的归约操作。
第二方面,提供一种云环境下的网络优化装置,包括:
划分模块,用于根据N个节点之间的延迟,将所述N个节点划分为M类,其中,N和M均为正整数,且N远大于M;
确定模块,用于根据所述划分模块得到的M类节点中待测试节点之间的延迟,确定至少一个第一环,每个所述第一环中各相邻节点之间的延迟小于预设延迟;
处理模块,用于对所述确定模块确定的至少一个所述第一环中的节点优化网络的进行归约操作。
第三方面,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,
所述处理器,用于执行所述计算机指令实现如第一方面提供的云环境下的网络优化方法的步骤。
由以上本说明书实施例提供的技术方案可见,本说明书实施例中,在现有网络环境下,通过充分考虑各个节点之间的延迟,将相邻节点间延迟满足要求的节点归类并基于归类后的节点创建自适应延迟,动态优化的环形网络,从而可以有效的改善分布式以及单机人工智能训练的扩展性。
附图说明
为了更清楚地说明本说明书实施例的技术方案,下面将对本说明书实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面所描述的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910068142.4/2.html,转载请声明来源钻瓜专利网。