[发明专利]车间调度方法、装置、电子设备及存储介质在审
申请号: | 202110909606.7 | 申请日: | 2021-08-09 |
公开(公告)号: | CN113657742A | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 张利平;胡一凡;张子凯;唐秋华 | 申请(专利权)人: | 武汉科技大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q10/04;G06N3/04;G06N3/08;G06Q50/04 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 郭金梅 |
地址: | 430081 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 车间 调度 方法 装置 电子设备 存储 介质 | ||
本发明提供一种车间调度方法、装置、电子设备及存储介质,车间调度方法包括:获取车间的生产状态参数,并基于所述生产状态参数,得到状态特征矩阵;将所述状态特征矩阵输入至在线策略网络,得到当前时刻的状态动作价值;基于所述当前时刻的状态动作价值,以及目标调度规则库,得到当前时刻的最优调度规则;基于所述当前时刻的最优调度规则,执行车间调度指令。本发明提供的车间调度方法可以解决现有技术中单一调度规则的缺陷,实现利用多个调度规则执行车间调度,以适应调度场景的变化,满足多调度场景的优化。
技术领域
本发明涉及车间作业技术领域,尤其涉及一种车间调度方法、装置、电子设备及存储介质。
背景技术
当前,智能机加工车间实时调度方法大多是基于调度规则和元启发式算法。元启发式算法包括遗传算法,模拟退火算法等,将实时调度问题划分为多个静态子问题进行求解,算法性能较好,但存在求解时间较长、结果可解释性和稳定性较差、难以满足实时响应等缺点。调度规则包括最短加工时间优先、最大剩余时间优先等,具有计算速度快,稳定性好,快速响应等优点。根据无免费午餐理论,调度规则往往适应特定的环境,若环境发生改变,调度规则不能适应调度环境的变化,其响应速度、稳定性和优良性能会降低。因此,需要提供一种车间调度方法,使其调度规则能够适应调度场景的变化,满足多调度场景的性能优化。
发明内容
本发明提供一种车间调度方法、装置、电子设备及存储介质,用以解决现有技术中单一调度规则的缺陷,实现利用多个调度规则执行车间调度指令,以适应调度场景的变化,满足多调度场景的性能优化。
本发明提供一种车间调度方法,包括:
获取车间的生产状态参数,并基于所述生产状态参数,得到状态特征矩阵;
将当前时刻的状态特征矩阵输入至在线策略网络,得到当前时刻的状态动作价值;
基于所述当前时刻的状态动作价值,以及目标调度规则库,得到当前时刻的最优调度规则;
基于所述当前时刻的最优调度规则,执行车间调度指令。
根据本发明提供的车间调度方法,还包括:
基于上一时刻的总拖期,以及当前时刻的总拖期,得到当前时刻的即时回报值;
将所述当前时刻的状态特征矩阵、所述当前时刻的最优调度规则、所述当前时刻的即时回报值,以及下一时刻的状态特征矩阵,作为当前时刻的经验样本,存入经验池;
从所述经验池中选取经验样本,并基于选取的经验样本训练在线策略网络。
根据本发明提供的车间调度方法,所述将所述当前时刻的状态特征矩阵、所述当前时刻的最优调度规则、所述当前时刻的即时回报值,以及下一时刻的状态特征矩阵,作为当前时刻的经验样本,存入经验池,包括:
将所述当前时刻的状态特征矩阵、所述当前时刻的最优调度规则、所述当前时刻的即时回报值,以及下一时刻的状态特征矩阵,作为当前时刻的经验样本,存入第一经验池;
在所述当前时刻的经验样本的即时回报值高于目标回报值的情况下,还将所述当前时刻的经验样本存入第二经验池;
所述从所述经验池中选取经验样本,并基于选取的经验样本训练在线策略网络,包括:
基于第一目标比例从所述第一经验池中选取第一部分样本,以及基于第二目标比例从所述第二经验池中选取第二部分样本;
基于所述第一部分样本和所述第二部分样本,训练所述在线策略网络。
根据本发明提供的车间调度方法,所述在所述当前时刻的经验样本的即时回报值高于目标回报值的情况下,还将所述当前时刻的经验样本存入第二经验池,包括:
将所述第二经验池中经验样本的最低即时回报值作为所述目标回报值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉科技大学,未经武汉科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110909606.7/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理