[发明专利]一种基于强化学习的匝道信号控制优化方法和系统在审

申请号：	202110863361.9	申请日：	2021-07-29
公开（公告）号：	CN113409594A	公开（公告）日：	2021-09-17
发明（设计）人：	季盛逸;王翔;王喜;董彩银;田文婧;任泽其;张颖欣	申请（专利权）人：	苏州大学
主分类号：	G08G1/07	分类号：	G08G1/07;G08G1/08;G08G1/01;G06N20/00
代理公司：	苏州见山知识产权代理事务所(特殊普通合伙) 32421	代理人：	袁丽花
地址：	215000 ***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于强化学习匝道信号控制优化方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于强化学习的匝道信号控制优化方法和系统，包括：匝道交叉口优化控制步骤，通过单点自适应控制检测道路上的实时交通流，上位机根据所述实时交通流选择匝道信号控制方案，建立SARSA信号控制模型；模型参数标定步骤，获取车辆跟驰与换道模型，对所述车辆跟驰与换道模型的参数进行标定；仿真步骤，根据预设的需求训练所述SARSA信号控制模型和标定参数后的车辆跟驰与换道模型，得到优化的匝道信号控制方案。本发明通过设计基于强化学习的快速路上匝道信号控制优化方法，并基于交通仿真的匝道控制方法验证及效果评价，使用SUMO仿真验证效果，为以后的理论研究和工程应用提供新的思路和方法。

技术领域

本发明涉及交通控制及智能交通技术领域，特别是涉及一种基于强化学习的快速路上匝道信号控制优化方法和系统。

背景技术

随着我国城市机动车保有量不断增加，快速路交通需求日益增加，因此在有限的道路条件和通行能力的限制下，需要通过优化管理与控制方法提高路网通行量。

入口匝道控制有非常大的作用：第一，可以减少整个快速道路系统内所有车辆的行程时间；第二，使交通流量均匀平滑；第三，消除或减少交汇中的冲突和事故。

现有技术具有如下缺点：已有的匝道控制方法主要面向高速公路，且存在交通模型构建、模型参数标定、依赖先验知识以及控制迟滞性等缺陷。

发明内容

本发明的目的是通过以下技术方案实现的。

第一方面提供了一种基于强化学习的匝道信号控制优化方法，包括：

匝道交叉口优化控制步骤，通过单点自适应控制检测道路上的实时交通流，上位机根据所述实时交通流选择匝道信号控制方案，建立SARSA信号控制模型；

模型参数标定步骤，获取车辆跟驰与换道模型，对所述车辆跟驰与换道模型的参数进行标定；

仿真步骤，根据预设的需求训练所述SARSA信号控制模型和标定参数后的车辆跟驰与换道模型，得到优化的匝道信号控制方案。