[发明专利]基于Actor-Critic框架深度强化学习算法的交通灯信号控制方法在审
| 申请号: | 202011538113.9 | 申请日: | 2020-12-23 |
| 公开(公告)号: | CN112632858A | 公开(公告)日: | 2021-04-09 |
| 发明(设计)人: | 沈国江;申思;孔祥杰;郑建炜;张美玉 | 申请(专利权)人: | 浙江工业大学 |
| 主分类号: | G06F30/27 | 分类号: | G06F30/27;G06N3/04;G08G1/095 |
| 代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵 |
| 地址: | 310014 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 基于Actor‑Critic框架深度强化学习算法的交通灯信号控制方法,包括:建立仿真环境,定义深度强化学习模型的状态、动作、奖励值,设定并初始化策略网络、旧策略网络和值函数网络;采集交叉口交通状态信息,基于旧策略网络生成下一信号周期的配时方案;采集训练数据进行广义优势估计,计算策略网络和值函数网络的训练误差,并更新网络参数;将策略网络参数复制给旧策略网络;利用训练好的信号控制模型,基于当前时刻交叉口的交通状态信息,生成下一周期的信号配时方案。本发明能够显著提升信号控制模型的模型训练效率,明显降低交叉口平均排队长度、平均旅行时间和车辆平均延误等指标,且本发明生成的信号配时方案具备更高的实用性和安全性。 | ||
| 搜索关键词: | 基于 actor critic 框架 深度 强化 学习 算法 交通灯 信号 控制 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011538113.9/,转载请声明来源钻瓜专利网。





