[发明专利]一种基于深度强化学习的全自动停车场调度方法在审
| 申请号: | 202010877257.0 | 申请日: | 2020-08-27 | 
| 公开(公告)号: | CN112068515A | 公开(公告)日: | 2020-12-11 | 
| 发明(设计)人: | 孙洁 | 申请(专利权)人: | 宁波工程学院 | 
| 主分类号: | G05B19/418 | 分类号: | G05B19/418;G06N3/08;G06N3/04;G08G1/01;G08G1/0968;G08G1/14;G08G1/16 | 
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 | 
| 地址: | 315211 浙*** | 国省代码: | 浙江;33 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 强化 学习 全自动 停车场 调度 方法 | ||
1.一种基于深度强化学习的全自动停车场调度方法,称为带全局环境模型的深度确定性策略梯度算法GDDPG(Global-model based Deep Deterministic Policy Gradient),其特征在于:所述方法包括如下步骤:步骤1:建立全自动停车场的环境模型;步骤2:建立智能体的模型,包括状态、动作和回报函数;步骤3:为每个智能体搭建网络模型;步骤4:初始化经验池;步骤5:根据算法进行训练,直到模型精度达到预设阈值,得到多智能体协同路径规划的最优方案;步骤6:模型收敛后,停止训练。
2.根据权利要求1所述的全自动停车场的环境模型,其特征在于,包括以下步骤:将停车场的功能区域进行栅格化,其中,每个出口和入口占据一个栅格,每个车位一个栅格;车道按照车位大小划分为不同数量的栅格,白色栅格表示可行区域,黑色栅格表示障碍物;从地图左上角栅格开始,依次对栅格进行编号,以
3.根据权利要求1所述的智能体模型,其特征在于:智能体状态定义为:,其中 为智能体
4.根据权利要求1所述的智能体模型,其特征在于:每个智能体可执行的动作定义为线速度和角速度的控制指令,即 。
5.根据权利要求1所述的智能体模型,其特征在于:智能体
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波工程学院,未经宁波工程学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010877257.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于制作抗氧化金属化膜的油管
 - 下一篇:一种锁止块和安全带锁扣
 





