[发明专利]一种高速列车的速度跟踪控制方法和自动驾驶控制系统有效
申请号: | 202010461495.3 | 申请日: | 2020-05-27 |
公开(公告)号: | CN111679577B | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 董海荣;高士根;王佳成;郑玥;李浥东 | 申请(专利权)人: | 北京交通大学 |
主分类号: | G05B13/04 | 分类号: | G05B13/04 |
代理公司: | 北京市商泰律师事务所 11255 | 代理人: | 刘源 |
地址: | 100044 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 高速 列车 速度 跟踪 控制 方法 自动 驾驶 控制系统 | ||
1.一种高速列车的速度跟踪控制方法,其特征在于,包括:
S1获取高速列车的实时位置p(t)、理想位置pd(t)、实时速度v(t)和理想速度vd(t);
S2将实时位置p(t)与理想位置pd(t)做差,获得实时位置误差ep(t);将实时速度v(t)与理想速度vd(t)做差,获得实时速度误差ev(t);
S3基于实时位置误差ep(t)、实时速度误差ev(t)、理想位置pd(t)和理想速度vd(t),获得高速列车优化控制模型;具体包括:
S31对实时位置误差ep(t)、实时速度误差ev(t)、理想位置pd(t)和理想速度vd(t)进行整合,获得高速列车复合系统状态公式X(t)=[ep(t),ev(t),pd(t),vd(t)]T(1),根据列车动力学模型建立高速列车复合系统表达公式式中,M为列车质量,fa为附加运行阻力,fb为基本运行阻力,F(X(t))为复合系统内部动态,为复合系统输入动态,ur为积分强化学习的高速列车控制输入量;
S32基于公式(1)和(2),获得高速列车复合系统值函数
V(X(t))=∫t∞e-γ(τ-t)[XT(τ)QX(τ)+U]dτ (3),式中,折扣因子0<γ<1,ρ(v)是速度v为自变量的控制输入受限值,Q和R分别为状态权重矩阵和输入权重矩阵;
S4通过基于演员-批评家神经网络结构的积分强化学习算法求解该高速列车优化控制模型,获得高速列车最优控制策略;基于该高速列车最优控制策略对高速列车进行速度跟踪控制;
所述基于演员-批评家神经网络结构的积分强化学习算法包括演员神经网络和批评家神经网络,所述步骤S4具体包括:
S41设置批评家神经网络权重向量为W1,设置演员神经网络权重向量为W2;设置批评家神经网络和演员神经网络的基函数为该基函数对高速列车复合系统状态X的一阶导数为
S42对批评家神经网络权重通过第一自适应律进行更新,该第一自适应律包括和式中,α1>0为自适应估计速率系数;
S43对演员神经网络权重通过第二自适应律进行更新,该第二自适应律包括和式中,α2>0为自适应估计速率系数,Y>0为控制常数;
S44基于该对批评家神经网络权重和演员神经网络权重的更新,获得积分强化学习的高速列车控制输入量将该积分强化学习的高速列车控制输入量用于高速列车的控制系统,获得t+T时刻的列车运行状态数据;式中,ρ为ρ(v)的简化形式;
S45多次执行所述步骤S2、S31、S42、S43和S44,获得演员神经网络权重数据集;
S46分析该演员神经网络权重数据集,获得演员神经网络的最优权重向量基于该最优权重向量获得高速列车最优控制策略
2.一种高速列车的自动驾驶控制系统,其特征在于,执行如权利要求1所述的方法,包括:
列车理想位置获取模块,用于实时获取高速列车的理想位置pd(t);
列车理想速度获取模块,用于实时获取高速列车的理想速度vd(t);
列车定位模块,用于获取高速列车的实时位置p(t);
列车测速模块,用于获取高速列车的实时速度v(t);
列车控制系统状态获取模块,分别与所述列车理想位置获取模块、列车理想速度获取模块、列车定位模块和列车测速模块通信连接,用于将实时位置p(t)与理想位置pd(t)做差,获得实时位置误差ep(t),将实时速度v(t)与理想速度vd(t)做差,获得实时速度误差ev(t),以及基于实时位置误差ep(t)、实时速度误差ev(t)、理想位置pd(t)和理想速度vd(t),获得高速列车优化控制模型;
控制策略生成模块,用于通过基于演员-批评家神经网络结构的积分强化学习算法求解该高速列车优化控制模型,获得高速列车最优控制策略;
列车控制模块,用于基于该高速列车最优控制策略,速度跟踪控制;
所述列车控制系统状态获取模块基于实时位置误差ep(t)、实时速度误差ev(t)、理想位置pd(t)和理想速度vd(t),获得高速列车优化控制模型的过程具体包括:
对实时位置误差ep(t)、实时速度误差ev(t)、理想位置pd(t)和理想速度vd(t)进行整合,获得高速列车复合系统状态公式X(t)=[ep(t),ev(t),pd(t),vd(t)]T(1),以及高速列车复合系统表达公式式中,ur为积分强化学习的高速列车控制输入量;
基于公式(1)和(2),获得高速列车复合系统值函数
V(X(t))=∫t∞e-γ(τ-t)[XT(τ)QX(τ)+U]dτ (3),式中,折扣因子0<γ<1,ρ(v)是速度v为自变量的控制输入受限值,Q和R分别为状态权重矩阵和输入权重矩阵;
所述控制策略生成模块包括,
批评家神经网络子模块,用于通过第一自适应律对评家神经网络权重进行更新,该第一自适应律包括和式中,W1为批评家神经网络权重向量,为批评家神经网络的基函数,为批评家神经网络的基函数对高速列车复合系统状态X的一阶导数,α1>0为自适应估计速率系数;
演员神经网络子模块,用于通过第二自适应律对演员神经网络权重向量进行更新,该第二自适应律包括和式中,W2为演员神经网络权重向量,为演员神经网络的基函数,为演员神经网络的基函数对高速列车复合系统状态X的一阶导数,α2>0为自适应估计速率系数,Y>0为控制常数;
列车控制输入量子模块,用于基于该对批评家神经网络权重和演员神经网络权重的更新,获得积分强化学习的高速列车控制输入量将该积分强化学习的高速列车控制输入量发送至所述列车控制模块;
神经网络权重向量寄存器,用于实时存储更新后的演员神经网络权重向量,获得演员神经网络权重数据集;
最优控制策略子模块,用于分析该演员神经网络权重数据集,获得演员神经网络的最优权重向量基于该最优权重向量获得高速列车最优控制策略
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学,未经北京交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010461495.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:城市安全智慧管控系统
- 下一篇:一种孔状颗粒物粉碎系统及其操作方法