[发明专利]用于共同训练模型的训练参与端的网络连接方法、装置、系统和服务器有效
| 申请号: | 202010270128.5 | 申请日: | 2020-04-08 |
| 公开(公告)号: | CN111510327B | 公开(公告)日: | 2022-01-21 |
| 发明(设计)人: | 李龙一佳;陈程;吴迪;方晨廖晖;赵鹏;解浚源;陈逸翔;吴良超;常龙;刘小兵 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
| 主分类号: | H04L41/0654 | 分类号: | H04L41/0654;H04L41/0659;H04L41/16;H04L67/1042 |
| 代理公司: | 北京信远达知识产权代理有限公司 11304 | 代理人: | 魏晓波 |
| 地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 共同 训练 模型 参与 网络 连接 方法 装置 系统 服务器 | ||
1.一种用于共同训练模型的训练参与端的网络连接方法,应用于包括多个服务器集群的系统,所述多个服务器集群通过网络连接,训练参与端采用主从模式,所述多个服务器集群包括作为训练参与端的主节点和从节点,所述主节点和从节点利用各自的训练样本共同训练模型,所述方法包括:
获取所述从节点的通信状态信息,其中,所述通信状态信息用于指示节点所处于的通信连接阶段;
获取目标从节点的通信状态信息作为目标通信状态信息,其中,所述目标从节点包括与所述从节点对应的对等节点,所述对等节点分属于所述共同训练模型的不同训练参与端;
响应于确定所述目标通信状态信息与所述从节点的通信状态信息不匹配,重置所述从节点所处于的通信连接阶段。
2.根据权利要求1所述的方法,其中,所述方法还包括:
响应于确定所述从节点所处于的通信连接阶段发生改变,生成用于指示所述从节点处于改变后的通信连接阶段的新通信状态信息。
3.根据权利要求1所述的方法,其中,所述响应于确定所述目标通信状态与所述从节点的通信状态信息不匹配,重置所述从节点所处于的通信连接阶段,包括:
响应于确定所述目标通信状态信息用于指示所述目标从节点处于通信连接阶段前的连接建立阶段且所述从节点的通信状态信息用于指示所述从节点处于通信连接阶段,重置所述从节点的通信连接阶段为通信连接阶段前的连接建立阶段。
4.一种用于共同训练模型的训练参与端的网络连接装置,应用于包括多个服务器集群的系统,所述多个服务器集群通过网络连接,训练参与端采用主从模式,所述多个服务器集群包括作为训练参与端的主节点和从节点,所述主节点和从节点利用各自的训练样本共同训练模型,所述装置包括:
第一获取单元,被配置成获取所述从节点的通信状态信息,其中,所述通信状态信息用于指示节点所处于的通信连接阶段;
第二获取单元,被配置成获取目标从节点的通信状态信息作为目标通信状态信息,其中,所述目标从节点包括与所述从节点对应的对等节点,所述对等节点分属于所述共同训练模型的不同训练参与端;
重置单元,被配置成响应于确定所述目标通信状态信息与所述从节点的通信状态信息不匹配,重置所述从节点所处于的通信连接阶段。
5.根据权利要求4所述的装置,其中,所述重置单元进一步被配置成:
响应于确定所述目标通信状态信息用于指示所述目标从节点处于通信连接阶段前的连接建立阶段且所述从节点的通信状态信息用于指示所述从节点处于通信连接阶段,重置所述从节点的通信连接阶段为通信连接阶段前的连接建立阶段。
6.一种用于共同训练模型的训练参与端的网络连接系统,所述系统包括:
从节点,被配置成获取节点本地的通信状态信息,其中,所述通信状态信息用于指示节点所处于的通信连接阶段;获取目标从节点的通信状态信息作为目标通信状态信息,其中,所述目标从节点包括与所述从节点对应的对等节点,所述对等节点分属于所述共同训练模型的不同训练参与端;响应于确定所述目标通信状态信息与所述节点本地的通信状态信息不匹配,结束进程;响应于接收到所述从节点对应的主节点发送的指示重新启动的信息,将节点本地的通信连接阶段设置为预设阶段,以及更新节点本地的通信状态信息;
主节点,被配置成响应于确定存在主动结束进程的从节点,向所述主动结束进程的从节点发送指示重新启动的信息;
其中:
所述从节点和所述主节点为服务器集群,所述主节点和从节点利用各自的训练样本共同训练模型。
7.根据权利要求6所述的系统,其中,所述系统还包括:
参数服务器,被配置成响应于检测到运行故障,生成指示参数服务器故障的故障提示信息;以及
所述主节点还被配置成:响应于检测到存在所述指示参数服务器故障的故障提示信息,向所述共同训练模型的训练参与端的主节点发送通信终止请求;
响应于接收到所述通信终止请求对应的确认信息,断开所述通信终止请求对应的通信连接。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010270128.5/1.html,转载请声明来源钻瓜专利网。





