[发明专利]用于训练机器学习模型的方法、装置、设备和介质在审
| 申请号: | 202211341102.0 | 申请日: | 2022-10-30 |
| 公开(公告)号: | CN115618966A | 公开(公告)日: | 2023-01-17 |
| 发明(设计)人: | 江逸敏;刘俊材;朱亦博 | 申请(专利权)人: | 抖音视界有限公司;脸萌有限公司 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00 |
| 代理公司: | 北京世辉律师事务所 16093 | 代理人: | 李峥宇 |
| 地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 训练 机器 学习 模型 方法 装置 设备 介质 | ||
1.一种用于训练机器学习模型的方法,所述机器学习模型包括第一子模型和第二子模型,所述第一子模型位于计算系统中的第一计算节点,并且所述第二子模型位于所述计算系统中的第二计算节点,所述方法包括:在所述第一计算节点处,
接收用于训练所述机器学习模型的第一组训练数据;
从所述第二计算节点获取所述第二子模型;
分别向所述第一子模型和获取的所述第二子模型输入所述第一组训练数据,以确定用于更新所述第一子模型的第一更新参数和用于更新所述第二子模型的第二更新参数;以及
向所述第二计算节点传输所述第二更新参数。
2.根据权利要求1的所述方法,其中获取所述第二子模型包括:在用于训练所述机器学习模型的训练阶段的开始时间点,从所述第二计算节点获取所述第二子模型。
3.根据权利要求1的所述方法,其中获取所述第二子模型包括:
响应于确定所述第一计算节点和所述第二计算节点两者位于所述计算系统中的第一计算设备,从所述第二计算节点的存储器向所述第一计算节点的存储器写入所述第二子模型。
4.根据权利要求3的所述方法,其中向所述第一计算节点的所述存储器写入所述第二子模型包括:
基于所述第一计算节点的所述存储器的存储器容量和所述第二子模型的大小,确定所述第一计算节点的所述存储器可容纳的子模型的阈值数量;以及
响应于确定所述第一计算节点的所述存储器中的子模型的数量低于所述阈值数量,向所述第一计算节点的所述存储器写入所述第二子模型。
5.根据权利要求4的所述方法,其中所述第一计算节点的所述存储器包括所述机器学习模型的第三子模型,所述方法进一步包括:响应于确定所述第一计算节点的所述存储器中的子模型的所述数量等于所述阈值数量,
响应于确定所述第一计算节点的所述存储器中的所述第三子模型的第三更新参数已经被传输,从所述第一计算节点的所述存储器释放所述第三子模型;以及
向所述第一计算节点的所述存储器写入所述第二子模型。
6.根据权利要求4的所述方法,其中所述第一计算设备进一步包括第三计算节点,以及向第一计算节点的所述存储器写入所述第二子模型进一步包括:
响应于接收到来自所述第三计算节点的读取所述第二子模型的请求,确定分别由所述第一计算节点和所述第三计算节点读取所述第二子模型的顺序;以及
基于所述顺序来分别由所述第一计算节点和所述第三计算节点读取所述第二子模型,以便向所述第一计算节点的所述存储器和所述第三计算节点的所述存储器的写入所述第二子模型。
7.根据权利要求3的所述方法,其中获取所述第二子模型进一步包括:响应于确定所述第一计算节点和所述第二计算节点分别位于所述计算系统中的所述第一计算设备和第二计算设备,
经由所述第一计算设备和所述第二计算设备之间的第一类型的通信链路,从所述第二计算设备的存储器向所述第一计算设备的存储器写入所述第二子模型;以及
经由所述第一计算设备和所述第一计算节点之间的第二类型的通信链路,从所述第一计算设备的所述存储器向所述第一计算节点的所述存储器写入所述第二子模型。
8.根据权利要求7的所述方法,其中所述第一计算设备进一步包括第三计算节点,以及所述方法进一步包括:
响应于来自所述第三计算节点的请求,经由所述第一计算设备和所述第三计算节点之间的第二类型的通信链路,从所述第一计算设备的所述存储器向所述第三计算节点的所述存储器写入所述第二子模型;以及
经由所述第一计算节点和所述第三计算节点之间的第三类型的通信链路,从所述第三计算节点的所述存储器向所述第一计算节点的所述存储器写入所述第二子模型。
9.根据权利要求8的所述方法,其中所述第一计算节点、所述第二计算节点和所述第三计算节点是图形处理单元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于抖音视界有限公司;脸萌有限公司,未经抖音视界有限公司;脸萌有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211341102.0/1.html,转载请声明来源钻瓜专利网。





