[发明专利]一种任务执行的方法、装置、存储介质及电子设备在审
| 申请号: | 202310429448.4 | 申请日: | 2023-04-11 |
| 公开(公告)号: | CN116340004A | 公开(公告)日: | 2023-06-27 |
| 发明(设计)人: | 段钧文;张吴越;刘鹏;张丽娜;唐雪飞;赖彦名;朱春节 | 申请(专利权)人: | 之江实验室 |
| 主分类号: | G06F9/50 | 分类号: | G06F9/50;H04L67/10;G06N3/098 |
| 代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 张相钦 |
| 地址: | 311121 浙江省杭*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 任务 执行 方法 装置 存储 介质 电子设备 | ||
本说明书公开了一种任务执行的方法、装置、存储介质及电子设备。所述任务执行的方法包括:获取目标模型的模型数据,针对每个计算单元,确定该计算单元在每个时间节点之前允许进行针对各微训练批次的反向传播的最大次数,并确定反向传播次数的最大值所对应的时间节点,作为前向传播节点,在至少位于所述前向传播节点之前的各时间节点中确定该计算单元执行针对每个微训练批次的反向传播的时间节点,作为反向传播节点,根据每个计算单元对应的前向传播节点以及每个计算单元对应的反向传播节点,确定针对所述目标模型的训练策略,并基于所述训练策略,执行针对所述目标模型的任务执行任务。
技术领域
本说明书涉及计算机技术领域,尤其涉及一种任务执行的方法、装置、存储介质及电子设备。
背景技术
随着深度学习技术的发展,一些超大规模的模型也随之出现,这些模型所需计算的参数量达到了千亿乃至万亿级,因此一些可以用于多机多卡集群环境的流水线并行算法被提出,以通过多个计算单元(如图形处理器(Central Process Unit,GPU))并行执行模型所涉及的运算。
在流水线并行算法中,通常会将一个训练批次划分为多个微训练批次(Microbatch),进而通过不同的计算单元完成对多个微批次的前向传播以及反向传播。
然而,目前在通过流水线并行算法进行任务执行过程中,对各微批次的前向传播过程和反向传播过程的时间及次序设置的并不合理,导致任务执行时存储在计算单元缓存中的激活值无法得到及时释放,模型收敛率较低,进一步影响模型的训练效率。
因此,如何对任务执行过程中产生的激活值进行有效释放,提高模型的收敛率以及训练效率,是一个亟待解决的问题。
发明内容
本说明书提供一种任务执行的方法、装置、存储介质及电子设备,以部分的解决现有技术存在的上述问题。
本说明书采用下述技术方案:
本说明书提供了一种任务执行的方法,包括:
获取目标模型的模型数据;
根据所述模型数据,对所述目标模型进行拆分,得到各子模型,每个子模型包含有所述目标模型的部分网络层;
将各子模型部署在不同的计算单元中;
针对每个计算单元,确定该计算单元在每个时间节点之前允许进行针对各微训练批次的反向传播的最大次数,并确定反向传播次数的最大值所对应的时间节点,作为该计算单元执行针对各微训练批次的前向传播的前向传播节点;
在至少位于所述前向传播节点之前的各时间节点中确定该计算单元执行针对每个微训练批次的反向传播的时间节点,作为该计算单元执行针对各微训练批次的反向传播的反向传播节点;
根据每个计算单元对应的前向传播节点以及每个计算单元对应的反向传播节点,确定针对所述目标模型的训练策略,并基于所述训练策略,执行针对所述目标模型的任务执行任务。
可选地,确定该计算单元在每个时间节点之前允许进行针对各微训练批次的反向传播的最大次数,具体包括:
将所述目标模型当前的训练批次划分为至少两个微批次;
确定该计算单元在每个时间节点之前允许进行针对所述至少两个微训练批次的反向传播的最大次数。
可选地,针对每个时间节点,当该计算单元不在该时间节点进行其中任意一个微训练批次的前向传播时,该时间节点后的剩余训练时长足够完成该微训练批次的前向传播和反向传播以及该微训练批次后的其他微训练批次的前向传播和反向传播。
可选地,针对每个计算单元,针对每个计算单元,确定该计算单元在每个时间节点之前允许进行针对各微训练批次的反向传播的最大次数,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310429448.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种猕猴桃保鲜剂及保鲜方法
- 下一篇:多功能泵盖旋盖装置





