[发明专利]一种任务调度方法及其装置在审
申请号: | 202010407594.3 | 申请日: | 2020-05-14 |
公开(公告)号: | CN111738488A | 公开(公告)日: | 2020-10-02 |
发明(设计)人: | 甄慧玲;李隆康;陆佳文;袁明轩 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/06;G06Q50/04;G06N3/04;G06N3/08;G06N20/00 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 聂秀娜 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 任务 调度 方法 及其 装置 | ||
1.一种任务调度方法,其特征在于,所述方法包括:
获取多个待调度任务以及多个可调度资源组;其中,所述多个可调度资源组中的每个可调度资源组包括多个可调度资源;
通过第一强化学习模型处理所述多个待调度任务以及所述多个可调度资源组,以得到第一分配关系,所述第一分配关系包括所述多个待调度任务与所述多个可调度资源组之间的对应关系;
至少基于所述第一分配关系,通过第二强化学习模型处理所述多个待调度任务和所述多个可调度资源,以得到第二分配关系,所述第二分配关系包括所述多个待调度任务与所述多个可调度资源之间的对应关系;其中,在所述第二分配关系中,部分或全部所述多个待调度任务中的每个待调度任务与对应的可调度资源所属的可调度资源组满足所述第一分配关系。
2.根据权利要求1所述的方法,其特征在于,所述多个可调度资源组中的每个可调度资源组为生产线,所述多个可调度资源中的每个可调度资源为所述生产线中的生产设备;或,
所述多个可调度资源组中的每个可调度资源组为时间段,所述多个可调度资源中的每个可调度资源为所述时间段中的子时间段。
3.根据权利要求1或2所述的方法,其特征在于,所述基于所述第一分配关系,通过第二强化学习模型处理所述多个待调度任务和所述多个可调度资源,包括:
至少基于所述第一分配关系,通过第二强化学习模型处理所述多个待调度任务中的部分待调度任务和所述多个可调度资源,以得到子分配关系,所述子分配关系表示所述部分待调度任务与所述多个可调度资源之间的对应关系。
4.根据权利要求1或2所述的方法,其特征在于,所述多个待调度任务包括多个目标待调度任务,所述多个可调度资源组包括目标可调度资源组,所述目标可调度资源组包括多个目标可调度资源,在所述第一分配关系中,所述多个目标待调度任务对应于所述目标可调度资源组;所述方法还包括:
在所述多个目标可调度资源中少于预设数量的目标可调度资源可被分配至所述至少一个目标待调度任务的情况下,确定目标约束,所述目标约束表示所述至少一个目标待调度任务不对应于所述目标可调度资源组。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
至少基于所述目标约束和所述第二分配关系,通过第一强化学习模型处理所述多个待调度任务以及所述多个可调度资源组,以得到更新后的第一分配关系,所述更新后的第一分配关系表示所述多个待调度任务与所述多个可调度资源组之间的对应关系;其中,在所述更新后的第一分配关系中,所述至少一个目标待调度任务对应于所述多个可调度资源组中除所述目标可调度资源组之外的可调度资源组;
至少基于所述更新后的第一分配关系,通过所述第二强化学习模型处理所述多个待调度任务和所述多个可调度资源,以得到更新后的第二分配关系,所述更新后的第二分配关系表示所述多个待调度任务与所述多个可调度资源之间的对应关系;其中,在所述更新后的第二分配关系中,所述多个待调度任务中的每个待调度任务与对应的可调度资源所属的可调度资源组满足所述更新后的第一分配关系。
6.根据权利要求1至5任一所述的方法,其特征在于,对所述第一强化学习模型和所述第二强化学习模型分别进行训练。
7.根据权利要求1至6任一所述的方法,其特征在于,所述第一强化学习模型包括第一奖励函数;所述第二强化学习模型包括第二奖励函数。
8.根据权利要求1至6任一所述的方法,其特征在于,所述方法还包括:
生成第一共享向量,所述第一共享向量包括多个状态变量;其中每个状态变量可以表示一个待调度任务的分配状态或一个可调度资源组的被占用状态;
所述至少基于所述第一分配关系,通过第二强化学习模型处理所述多个待调度任务和所述多个可调度资源,包括:
至少基于所述第一共享向量以及所述第一分配关系,通过第二强化学习模型处理所述多个待调度任务和所述多个可调度资源。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010407594.3/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理