[发明专利]Pod间通信的方法和分布式计算系统有效
| 申请号: | 202110121360.7 | 申请日: | 2021-01-28 | 
| 公开(公告)号: | CN112835695B | 公开(公告)日: | 2022-12-23 | 
| 发明(设计)人: | 叶志晟;吴保东;孙鹏;颜深根 | 申请(专利权)人: | 北京市商汤科技开发有限公司 | 
| 主分类号: | G06F9/48 | 分类号: | G06F9/48;G06F9/50;G06F9/445;G06T1/20;H04L67/104 | 
| 代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 靳玫 | 
| 地址: | 100080 北京市海淀区北*** | 国省代码: | 北京;11 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | pod 通信 方法 分布式 计算 系统 | ||
1.一种Pod间通信的方法,其特征在于,所述方法应用于分布式计算系统,所述分布式计算系统包括:主机和多个节点;每个所述节点上包括多个GPU,待处理的目标任务对应的多个容器集Pod用于运行在所述多个节点中的目标节点的GPU上;所述目标任务对应的多个Pod包括第一Pod和第二Pod;
所述方法包括:
所述第一Pod获取任务资源信息,包括:所述第一Pod接收所述目标节点上的插件发送的所述任务资源信息;所述任务资源信息包括:所述第一Pod所属的所述目标任务对应占用的GPU集合;其中,所述GPU集合包括:所述第一Pod运行所在的第一GPU以及第二Pod运行所在的第二GPU;
所述第一Pod根据所述GPU集合,通过所述第一GPU与所述第二GPU之间建立P2P连接,以实现所述第一Pod与第二Pod间的通信。
2.根据权利要求1所述的方法,其特征在于,所述GPU集合位于所述目标节点上;所述目标节点上运行有:代理控制器和插件;其中,所述代理控制器用于负责所述目标节点与主机间的通信;
所述第一Pod获取任务资源信息,包括:
所述第一Pod接收所述目标节点上的插件发送的所述任务资源信息,其中,所述任务资源信息由所述代理控制器发送至所述插件。
3.根据权利要求1所述的方法,其特征在于,所述主机上包括:调度器;所述第一Pod获取任务资源信息之前,所述方法还包括:
所述调度器根据所述目标任务与多个Pod间的对应关系,为所述目标任务对应的每个Pod设置标注信息,所述标注信息包括:所述目标任务的任务标识;
所述调度器将所述多个Pod发送至目标节点,以使得所述目标节点根据所述标注信息将Pod调度到GPU上。
4.根据权利要求3所述的方法,其特征在于,所述目标节点上运行有:代理控制器和插件;所述调度器将所述多个Pod发送至目标节点之后,所述方法还包括:
所述目标节点上的代理控制器根据所述Pod标注的目标任务的任务标识,得到属于同一所述目标任务的多个Pod对应分配的GPU集合;
所述代理控制器将所述多个Pod中每个Pod对应分配的GPU、以及所述目标任务对应的所述GPU集合发送至所述插件。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:所述调度器根据所述每个Pod运行所需的GPU数量,统计得到整个所述目标任务对应所需的任务GPU数量,并将所述任务GPU数量设置在所述标注信息中;
所述调度器将所述多个Pod发送至目标节点,包括:
所述调度器选择所述多个节点中的其中一个节点,作为用于运行所述目标任务的目标节点,所述目标节点中可使用的GPU数量不低于所述任务GPU数量;
所述调度器将所述目标任务对应的多个Pod发送至所述目标节点。
6.根据权利要求5所述的方法,其特征在于,所述目标节点上运行有:代理控制器;所述调度器将所述目标任务对应的多个Pod发送至所述目标节点之后,所述方法还包括:
所述代理控制器在获取待分配的Pod时,根据所述Pod的标注信息中包括的任务标识,判断所述目标节点上是否已存在与所述任务标识对应的GPU集合;
若判断结果是不存在,则所述代理控制器根据所述待分配的Pod标注的所述任务GPU数量,由所述目标节点上选择所述任务GPU数量对应的多个GPU确定为所述GPU集合,并标注所述GPU集合中的各GPU的状态为已占用且与所述目标任务对应;
根据所述待分配的Pod所需数量的GPU,将所述Pod调度到所述GPU集合中的GPU上。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
若判断结果是存在,则所述代理控制器由所述GPU集合中选择所述待分配的Pod所需数量的GPU分配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110121360.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种金属自动化轧制方法
 - 下一篇:一种数控机床
 





