[发明专利]一种基于DDQN的自动化集装箱码头AGV调度方法在审
申请号: | 202210556595.3 | 申请日: | 2022-05-18 |
公开(公告)号: | CN114912809A | 公开(公告)日: | 2022-08-16 |
发明(设计)人: | 路小凡;阚海斌 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q10/04;G06Q10/08;G06N3/08 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 张磊 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 ddqn 自动化 集装箱码头 agv 调度 方法 | ||
1.一种基于DDQN的自动化集装箱码头AGV调度方法,其特征在于,具体步骤如下:
(1):针对自动化集装箱码头实际情况进行数据转化,综合任务信息、AGV信息及AGV充电站信息,利用数学建模方法,构建自动化集装箱码头水平运输环节AGV任务分配调度问题模型;其中:自动化集装箱码头水平运输环节AGV任务分配调度问题模型包括任务信息、AGV信息及AGV充电站信息,任务信息包括:任务编号,任务类型(LOAD、UNLOAD、NOTASK),任务起始位置,任务目的位置和任务完成时间;AGV信息包括:AGV编号,AGV运行状态(0代表空闲、1代表因故障或调度任务而锁死),AGV工作状态(Green代表正常工作、Orange与Red代表故障),AGV当前电量,AGV当前位置和AGV当前任务;AGV充电站信息包括:充电站编号,充电站位置和充电站完成充电时间;
(2):利用马尔可夫决策过程MDP,设定码头AGV调度系统环境状态集S与AGV调度动作集A,以最小化任务完成时间以及最优化AGV调度过程为目标,设定奖励反馈R,将AGV任务分配调度问题模型转变为强化学习DDQN模型;
(3):使用python语言keras库编程将强化学习DDQN模型构建成DDQN深度强化学习神经网络模型,结合环境状态集S、动作集A与奖励反馈R构建DDQN模型中的Q网络;
(4):使用python语言openai.gym库编程仿真DDQN模型中的外部环境变化,用于产生模拟数据,对步骤(3)的DDQN模型中的Q网络模型进行训练;
(5):将步骤(4)训练好的Q网络模型包装为自动化集装箱码头水平运输AGV的实时在线调度系统,对码头AGV进行实时、高效任务调度。
2.根据权利要求1所述的基于DDQN的自动化集装箱码头AGV调度方法,其特征在于,步骤(1)中,一关集装箱作业可以视作一个任务,任务可分为装(LOAD)与卸(UNLOAD)两种,任务数量为岸桥数量乘以每岸桥可同时服务AGV数量,即码头可同时作业的AGV数量的最大值,抽象岸桥与箱区轨道吊之间的水平运输需求信息为任务信息,通过更新任务信息接收岸桥下的新任务;
自动化集装箱码头AGV调度问题模型根据设备岸桥与箱区的布局给出码头水平运输环节的区域划分,整个码头被划分为多个区域,区域数量等于岸桥数量加上箱区数量,每一区域内有一岸桥或一箱区,通过时间矩阵的形式,给出AGV从每区域到其他区域所需花费的行驶时间,同时根据码头布局给出充电站所属区域。
3.根据权利要求1所述的基于DDQN的自动化集装箱码头AGV调度方法,其特征在于,步骤(2)中,环境状态集S表征任务状态信息、AGV状态信息与AGV充电站状态信息;任务状态信息包括:任务是否已开始(1已开始、0未开始),任务是否已完成(1已完成、0未完成),任务起始位置(NAREA维比特向量,任务起始位置所在区域对应维度为1,其他维度为0)以及任务目的位置(NAREA维比特向量,任务目的位置所在区域对应维度为1,其他维度为0);AGV状态信息包括:AGV工作状态(0代表空闲、1代表锁死),AGV电量状态(0代表电量不足、1代表电量充足)以及AGV当前位置(NAREA维比特向量,AGV当前位置所在区域对应维度为1,其他维度为0);AGV充电站状态信息:充电站是否正在使用(1代表正在使用、0代表充电站空闲);动作A表征AGV调度动作(TASKi,AGVj),代表将第j个AGV调度去完成第i个任务(或去第i个充电站充电);以最小化任务完成时间为目标设定奖励R:若当前调度结束后运输效率提升,则奖励+5;否则奖励为0;以最优化AGV调度过程为目标设定奖励R:若调度工作状态为锁死的AGV去完成任务,则奖励为-10;若调度AGV去完成已开始的任务,则奖励为-10;若调度电量不足的AGV去充电,则奖励为+5;若调度电量充足的AGV去充电,则奖励为-5。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210556595.3/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理