[发明专利]异构资源调度方法、装置、设备和计算机可读存储介质有效
| 申请号: | 202110313443.6 | 申请日: | 2021-03-24 |
| 公开(公告)号: | CN113051053B | 公开(公告)日: | 2023-09-08 |
| 发明(设计)人: | 齐文;李劲;郭玮;苏力强 | 申请(专利权)人: | 博瀚智能(深圳)有限公司 |
| 主分类号: | G06F9/48 | 分类号: | G06F9/48;G06F9/50;G06N20/00 |
| 代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 谢岳鹏 |
| 地址: | 518000 广东省深圳市南山区粤海*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 资源 调度 方法 装置 设备 计算机 可读 存储 介质 | ||
1.一种异构资源调度方法,其特征在于,所述方法包括:
通过深度学习框架统一接口接收总体通用任务,所述深度学习框架统一接口向用户提供一个统一且经过精简的访问方式,所述总体通用任务均通过预设的规则或统一的格式进行描述;
基于异构硬件架构中各异构硬件单元的资源特征,确定执行所述总体通用任务的调度策略;
基于所述调度策略,将所述总体通用任务所包含的各个子任务通过由硬件抽象层提供的统一的硬件抽象与应用编程接口分发至适配的异构硬件单元执行,所述硬件抽象层对所述异构硬件单元进行统一抽象,并通过通信层与所述异构硬件单元进行交互,所述硬件抽象层支持通过标准的软件 shell和硬件 shell实现的以下标准特性:异构硬件单元多任务进程并发支持、异构硬件单元之间远程直接数据存取RDMA以及异构硬件单元计算和传输并发;
所述基于异构硬件架构中各异构硬件单元的资源特征,确定执行所述总体通用任务的调度策略,包括:根据所述总体通用任务的标识信息,遍历经验信息数据库中所述总体通用任务对应的多组历史运行信息,所述历史运行信息包括历史执行成本和所述历史执行成本对应的算法标识信息;计算各异构硬件单元按照其资源特征执行总体通用任务时对应的多组历史执行成本的方差值,将方差值最小的历史执行成本对应的调度策略确定为执行所述总体通用任务的调度策略;
所述确定为执行所述总体通用任务的调度策略包括通过对异构硬件架构中各异构硬件单元的优先级别进行排序来构造一个调度列表,从所述调度列表中顺序取出一个硬件单元,并将该硬件单元分配到使它的启动时间最早的处理机器上,或者是计算出每个总体通用任务在可用资源中能完成的时间,使用最贴近的资源优先调度给最小执行时间的总体通用任务,或者是计算出每个总体通用任务在可用资源中能完成的时间,使用最贴近的资源优先调度给最大执行时间的总体通用任务,或者是优先将资源调度给备选资源运行时间与首选资源运行时间相差很大的任务。
2.如权利要求1所述异构资源调度方法,其特征在于,所述方法还包括:
通过对所述各异构硬件单元的资源的封装,提供管理所述各异构硬件单元的应用编程接口;
通过对所述异构硬件架构中存储资源进行资源封装,实现统一的数据存储资源封装。
3.一种异构资源调度装置,其特征在于,所述装置包括:
接收模块,用于通过深度学习框架统一接口接收总体通用任务,所述深度学习框架统一接口向用户提供一个统一且经过精简的访问方式,所述总体通用任务均通过预设的规则或统一的格式进行描述;
确定模块,用于基于异构硬件架构中各异构硬件单元的资源特征,确定执行所述总体通用任务的调度策略;
分发模块,用于基于所述调度策略,将所述总体通用任务所包含的各个子任务通过由硬件抽象层提供的统一的硬件抽象与应用编程接口分发至适配的异构硬件单元执行,所述硬件抽象层对所述异构硬件单元进行统一抽象,并通过通信层与所述异构硬件单元进行交互,所述硬件抽象层支持通过标准的软件 shell和硬件 shell实现的以下标准特性:异构硬件单元多任务进程并发支持、异构硬件单元之间远程直接数据存取RDMA以及异构硬件单元计算和传输并发;
所述基于异构硬件架构中各异构硬件单元的资源特征,确定执行所述总体通用任务的调度策略,包括:根据所述总体通用任务的标识信息,遍历经验信息数据库中所述总体通用任务对应的多组历史运行信息,所述历史运行信息包括历史执行成本和所述历史执行成本对应的算法标识信息;计算各异构硬件单元按照其资源特征执行总体通用任务时对应的多组历史执行成本的方差值,将方差值最小的历史执行成本对应的调度策略确定为执行所述总体通用任务的调度策略;
所述确定为执行所述总体通用任务的调度策略包括通过对异构硬件架构中各异构硬件单元的优先级别进行排序来构造一个调度列表,从所述调度列表中顺序取出一个硬件单元,并将该硬件单元分配到使它的启动时间最早的处理机器上,或者是计算出每个总体通用任务在可用资源中能完成的时间,使用最贴近的资源优先调度给最小执行时间的总体通用任务,或者是计算出每个总体通用任务在可用资源中能完成的时间,使用最贴近的资源优先调度给最大执行时间的总体通用任务,或者是优先将资源调度给备选资源运行时间与首选资源运行时间相差很大的任务。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于博瀚智能(深圳)有限公司,未经博瀚智能(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110313443.6/1.html,转载请声明来源钻瓜专利网。





