[发明专利]基于DCU的资源调度方法、装置和计算机设备在审
| 申请号: | 202011381447.X | 申请日: | 2020-12-01 |
| 公开(公告)号: | CN112612600A | 公开(公告)日: | 2021-04-06 |
| 发明(设计)人: | 王建敏;原帅;吕灼恒;南亚;苏垚;余彬;于洁;郭珂 | 申请(专利权)人: | 曙光信息产业(北京)有限公司;曙光信息产业股份有限公司 |
| 主分类号: | G06F9/50 | 分类号: | G06F9/50 |
| 代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 贾旭 |
| 地址: | 100193 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 dcu 资源 调度 方法 装置 计算机 设备 | ||
1.一种基于DCU的资源调度方法,其特征在于,包括:
接收多个深度学习应用作业任务,所述作业任务包括资源需求信息和作业任务类型;
获取深度学习加速器DCU开发环境下的可用资源使用状态信息;
根据所述资源需求信息、所述作业任务类型和所述可用资源使用状态信息,确定所述作业任务的执行顺序和执行节点;
按照所述执行顺序,将所述作业任务调度至对应的执行节点,以使所述执行节点执行相应类型的作业任务。
2.如权利要求1所述的方法,其特征在于,根据所述资源需求信息、所述作业任务类型和所述可用资源使用状态信息,确定所述作业任务的执行顺序和执行节点,包括:
所述作业任务还包括用户作业优先级,所述作业任务类型具有相应的调度类型优先级;
根据所述用户作业优先级、所述资源需求信息、所述调度类型优先级确定所述作业任务对应的实际作业优先级;
根据所述实际作业优先级确定所述作业任务的执行顺序;以及
确定与所述作业任务类型相同的执行节点。
3.如权利要求1所述的方法,其特征在于,在所述执行节点执行所述作业任务时,还包括:
创建与所述作业任务对应的资源信息,并将所述资源信息记录至资源记录表。
4.如权利要求1所述的方法,其特征在于,还包括:
在所述执行节点执行所述作业任务过程中,接收取消所述作业任务的取消命令;
根据所述取消命令确定所述作业任务的资源使用信息;
根据所述资源使用信息更新资源记录表。
5.如权利要求1所述的方法,其特征在于,还包括:
判断所述作业任务是否执行完成;
如果执行完成,则将所述作业任务保存至历史任务表中。
6.如权利要求1所述的方法,其特征在于,所述深度学习应用包括Caffe、TensorFlow、Pytorth、Keras中的一种或多种。
7.如权利要求1所述的方法,其特征在于,所述资源需求信息包括CPU数量、内存大小、DCU数量中的一种或多种。
8.一种基于DCU的资源调度装置,其特征在于,包括:
接收模块,用于接收多个深度学习应用作业任务,所述作业任务包括资源需求信息和作业任务类型;
获取模块,用于获取深度学习加速器DCU开发环境下的可用资源使用状态信息;
确定模块,用于根据所述资源需求信息、所述作业任务类型和所述可用资源使用状态信息,确定所述作业任务的执行顺序和执行节点;
调度模块,用于按照所述执行顺序,将所述作业任务调度至对应的执行节点,以使所述执行节点执行相应类型的作业任务。
9.一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-7任一所述的基于DCU的资源调度方法。
10.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7任一所述的基于DCU的资源调度方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于曙光信息产业(北京)有限公司;曙光信息产业股份有限公司,未经曙光信息产业(北京)有限公司;曙光信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011381447.X/1.html,转载请声明来源钻瓜专利网。





