[发明专利]一种对任务规划模型并行训练的资源分配方法在审
申请号: | 202210295158.0 | 申请日: | 2022-03-24 |
公开(公告)号: | CN114610501A | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 曹扬;吴京辉;彭渊;吕乃冰;赵思聪;贾帅楠;黄练兵 | 申请(专利权)人: | 北京航天晨信科技有限责任公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06N20/00 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 102308 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 任务 规划 模型 并行 训练 资源 分配 方法 | ||
1.一种对任务规划模型并行训练的资源分配方法,其特征在于,所述任务规划模型为用于环境问题监测的模型,所述方法包括:
获取仿真训练环境单次运行时占用硬件资源的环境资源占用参数和任务规划模型单次更新时占用硬件资源的模型更新占用参数;所述仿真训练环境为训练所述任务规划模型的软硬件环境;
基于所述环境资源占用参数和模型更新占用参数,在当前硬件上生成主节点并为所述主节点分配当前硬件上配置的部分资源;所述主节点用于更新所述任务规划模型;
获取控制参数,所述控制参数用于生成训练所述任务规划模型的子节点;
基于所述控制参数和所述当前硬件上剩余的硬件资源,生成多个子节点,所述当前硬件上剩余的硬件资源,包括剩余CPU的数量、剩余GPU的数量、每个CPU的剩余资源和每个GPU的剩余资源;
将剩余的硬件资源分配给所述多个子节点;其中,所述子节点用于训练所述任务规划模型。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于所述控制参数,分别生成所述主节点对应的第一程序包和多个所述子节点对应的第二程序包;所述第一程序包为所述主节点更新所述任务规划模型的更新步骤,所述第二程序包为所述子节点训练所述任务规划模型的训练资料;
将所述第一程序包发送到主节点,以使所述主节点基于所述第一程序包对所述任务规划模型进行训练;
将所述第二程序包发送到各个子节点,以使所述子节点基于所述第二程序包对所述任务规划模型进行训练。
3.根据权利要求1所述的一种方法,其特征在于,所述获取仿真训练环境单次运行时占用硬件资源的环境资源占用参数和任务规划模型单次更新时占用硬件资源的模型更新占用参数,包括:
在所述当前硬件资源上运行所述仿真训练环境,并记录仿真训练环境运行时的第一硬件资源占用参数;
多次运行所述仿真训练环境,计算多次记录的第一硬件资源占用参数的第一平均值,所述第一平均值即为所述环境资源占用参数;
在所述仿真训练环境上更新所述任务规划模型,并记录任务规划模型更新时的第二硬件资源占用参数;
多次更新所述任务规划模型,计算多次记录的第二硬件资源占用参数的第二平均值,所述第二平均值即为所述模型更新占用参数。
4.根据权利要求1所述的一种方法,其特征在于,所述控制参数包括并行策略参数和资源分配策略参数;
所述并行策略参数包括梯度共享策略的参数和样本共享策略的参数;
所述资源分配策略参数包括子节点数量最多策略和子节点资源最优策略;
基于所述控制参数和所述当前硬件上剩余的硬件资源,生成多个子节点,包括:
基于所述控制参数对应的资源分配策略参数以及并行训练策略参数,和所述当前硬件上剩余的硬件资源,生成多个子节点,并确定所述多个子节点的数量和所述每个子节点的硬件资源。
5.根据权利要求4所述的一种方法,其特征在于,所述模型更新占用参数包括GPU资源占用参数和CPU资源占用参数;所述硬件资源包括CPU资源和GPU资源;
所述基于所述环境资源占用参数和模型更新占用参数,在当前硬件上生成主节点并为所述主节点分配当前硬件上配置的部分资源,包括:
为所述主节点分配大于所述CPU资源占用参数的CPU资源;
为所述主节点分配大于所述GPU资源占用参数的GPU资源。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航天晨信科技有限责任公司,未经北京航天晨信科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210295158.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种含有内部冷却通道的微磨棒
- 下一篇:一种咔啉衍生物及其应用