[发明专利]基于深度强化学习的城市轨道交通列车时刻表优化方法在审
| 申请号: | 202111556696.2 | 申请日: | 2021-12-17 |
| 公开(公告)号: | CN114202316A | 公开(公告)日: | 2022-03-18 |
| 发明(设计)人: | 胡文斌;吴承泽;秦建楠;耿路路 | 申请(专利权)人: | 南京理工大学 |
| 主分类号: | G06Q10/10 | 分类号: | G06Q10/10;G06Q10/04;G06Q50/30;G06N3/04;G06N3/08 |
| 代理公司: | 南京理工大学专利中心 32203 | 代理人: | 薛云燕 |
| 地址: | 210094 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 深度 强化 学习 城市 轨道交通 列车时刻表 优化 方法 | ||
1.一种基于深度强化学习的城市轨道交通列车时刻表优化方法,其特征在于,包括以下步骤:
步骤1,建立基本数据模块,包括线路数据模块、列车运行数据模块、地铁运营数据模块、优化参数模块;
步骤2,建立列车牵引能耗计算模块,包括神经网络能耗拟合模块与时间-能耗曲线拟合模块;
步骤3,使用神经网络能耗拟合模块,将线路数据和列车速度数据作为输入量,使用实测的能耗数据作为期望输出量,通过调节网络参数取值,使误差沿梯度方向下降,经过反复学习训练,确定与最小误差相对应的网络参数;
步骤4,使用时间-能耗曲线拟合模块,用实测速度曲线和训练后的网络,对对应的能耗进行拟合,并获得时间与能耗的关系曲线;
步骤5,使用列车区间运行时间优化模块,采用深度强化学习算法,综合考虑列车全线能耗、乘客旅行体验和运营管理要求,设计目标函数,通过调整各个区间的运行时间,最大化该目标函数的值。
2.根据权利要求1所述的基于深度强化学习的城市轨道交通列车时刻表优化方法,其特征在于,步骤1所述的基本数据模块包括线路数据模块、列车运行数据模块、地铁运营数据模块、优化参数模块,该四个模块均为数据输入模块,为列车牵引能耗计算模块和列车区间运行时间优化模块提供初始参数,其中:
线路数据模块,分为车站数据、坡道数据、弯道数据;
列车运行数据模块,提供列车运行时的实测数据,包括列车速度、牵引电流、辅变电流;
地铁运营数据模块,提供列车每个运行区间的客流、列车原始的时刻表和换乘站数据;
优化参数模块,用于神经网络能耗拟合的参数设置,包括神经网络层数、每层神经元个数、激活函数种类、迭代次数;还用于深度强化学习算法的参数设置,包括深度强化学习算法种类、神经网络层数、每层神经元个数、激活函数种类、迭代次数、奖励函数各个组成部分的比重及所选算法对应的超参数。
3.根据权利要求1所述的基于深度强化学习的城市轨道交通列车时刻表优化方法,其特征在于,步骤2所述的建立列车牵引能耗计算模块,包括神经网络能耗拟合模块与时间-能耗曲线拟合模块,其中:
神经网络能耗拟合模块:利用线路数据、列车实测速度、实测能耗对神经网络进行训练,更新网络参数,获得能耗拟合模型;
时间-能耗曲线拟合模块:将更多的实测速度曲线作为训练后的神经网络的输入,计算列车区间运行能耗,获得时间-能耗曲线。
4.根据权利要求1所述的基于深度强化学习的城市轨道交通列车时刻表优化方法,其特征在于,步骤3所述神经网络能耗拟合模块,使用的列车实测速度、牵引电流、辅变电流、制动电阻电流均为间隔为0.1s的离散的点,对于每个时刻,输入量为当前时刻及前后各10个时刻的速度值、列车当前位置的坡道参数、列车当前位置的弯道参数,期望输出量为列车在该时刻的功率,利用误差反向传播算法对网络的参数进行更新,具体步骤如下:
(1)确定网络参数:包括网络层数、每层神经元个数、激活函数种类;
(2)确定训练参数:包括参数的更新方法、更新步长、终止条件;
(3)计算列车时间-位置曲线:根据实测的列车速度曲线,将速度对时间进行积分运算,得到列车的时间-位置曲线;
(4)计算每个时刻列车所处位置的线路参数:根据列车时间-位置曲线,以0.1s为间隔,获得列车在每个时刻的位置,查表获得该位置的坡道参数和弯道参数;
(5)计算每个时刻列车的功率:根据实测的网压u、牵引电流idr、辅变电流iaux,以0.1s为间隔,计算列车在每个时刻的功率p,计算方法如下:
p=u(ndridr-nauxiaux)
其中ndr为列车上的牵引变压器数量,naux为列车上的辅助变压器数量;
(6)训练网络:以一个时刻前后各10个时刻的速度值、该时刻列车所在位置的坡度、该时刻列车所在位置的曲率半径、该时刻的功率作为一组数据,每次将多组数据作为一个小批量,将速度、坡度、曲率半径作为输入,将功率作为期望输出值,使用均方差作为损失函数,并进行误差的反向传播;不断训练,直至终止条件达成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111556696.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种氨基酸螯合有机钙肥的制作方法
- 下一篇:一种新型充气防寒服
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





