[发明专利]一种车辆列队跟踪控制方法、装置及计算机可读存储介质有效
申请号: | 202110402251.2 | 申请日: | 2021-04-14 |
公开(公告)号: | CN113140104B | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 褚端峰;徐峻伟;吴超仲;陆丽萍 | 申请(专利权)人: | 武汉理工大学 |
主分类号: | G08G1/00 | 分类号: | G08G1/00;G06N3/00 |
代理公司: | 武汉智嘉联合知识产权代理事务所(普通合伙) 42231 | 代理人: | 陈建军 |
地址: | 430070 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 车辆 列队 跟踪 控制 方法 装置 计算机 可读 存储 介质 | ||
1.一种车辆列队跟踪控制方法,其特征在于,包括以下步骤:
获取自车、前车及领航车的状态误差向量,根据所述自车、前车及领航车的状态误差向量建立DDPG的策略网络和价值网络;
利用粒子群算法对DDPG的策略网络和价值网络进行训练,得到训练完备的DDPG网络;
根据所述自车、前车、领航车的状态误差向量及训练完备的DDPG网络获取车辆动作值,根据所述车辆动作值确定决策控制器的输出控制量,根据所述输出控制量确定车辆的节气门开度;
根据所述自车、前车及领航车的状态误差向量建立DDPG的策略网络,具体包括:在DDPG策略网络的输入层输入自车、前车及领航车的状态误差向量,所述DDPG策略网络包括若干个全连接层,所述DDPG策略网络的输出层输出车辆动作值;
根据所述自车、前车及领航车的状态误差向量建立DDPG的价值网络,具体包括:在所述DDPG价值网络的输入层输入自车、前车及领航车的状态误差向量,经过第一个全连接层后,所述自车、前车、领航车的状态误差向量与所述车辆动作值共同输入至第二个全连接层,DDPG价值网络的输出层输出执行最优动作评判标准值;
利用粒子群算法对DDPG的策略网络和价值网络进行训练,具体包括:
确定粒子群算法的种群数量、粒子维数,初始化粒子位置及速度,对粒子群每个粒子进行更新迭代,获取DDPG的最优连接权重,利用所述最优连接权重对DDPG的策略网络和价值网络进行训练;
所述对粒子群每个粒子进行更新迭代,获取DDPG的最优连接权重,具体包括:改进惯性权重因子,根据改进的惯性因子,对粒子群每个粒子进行更新迭代,获取DDPG的最优连接权重,所述改进的惯性因子为
ω=m+hlogT(T-t-1)
其中,m为惯性权重因子ω的收敛值,h0,T为最大迭代次数,t为当前迭代次数;
利用所述最优连接权重对DDPG的策略网络和价值网络进行训练,具体包括:价值网络采用基于执行最优动作评判标准值的确定性策略梯度进行梯度更新,策略网络根据损失函数进行梯度更新,并利用所述最优连接权重对DDPG的策略网络和价值网络进行训练;
所述损失函数的奖励值为R=R1+R2+R3+R4,其中,R2=-ω1|v2-v3|,R3=ω2(|Δxt-1|-|Δxt|)-ω3|Δxt|,x2、x3分别为前车与自车的纵向坐标,Lsafe为前车与自车静止时应保持的最小车间距,ω1是速度误差的权重,v2-v3是自车与前车速度误差,ω2是t-1时刻与t时刻两车间距误差变化量的权重,ω3是t时刻自车与前车间距误差的权重,Δxt是t时刻自车与前车的间距,Δxt-1是t-1时刻自车与前车的间距,ω4为自车加速度权重,|a|为受控车的控制器输出;
根据所述车辆动作值确定决策控制器的输出控制量,根据所述输出控制量确定车辆的节气门开度,具体包括:根据所述车辆动作值确定决策控制器的输出控制量,根据所述输出控制量及车辆节气门开度公式确定车辆的节气门开度,所述车辆节气门开度公式为uthrottle=uthrottle,f+uthrottle,b,uthrottle,f为车辆发动机期望扭矩与理论扭矩之比,uthrottle,b为确定决策控制器的输出控制量,对于前车,uthrottle,b=uthrottle,b2,
uthrottle.b2=kd(a1-a2)+kp(v1-v2)+ki(x1-x2-hv2-L),对于自车,uthrottle,b=uthrottle,b3,
uthrottle.b3=λ1(kd(a2-a3)+kp(v2-v3)+ki(x2-x3-hv3-Lcar-Lsafe))+λ2(kd(a1-a3)+kp(v1-v3)+ki(x1-x3-2hv3-2Lcar-2Lsafe))
其中,x1、x2、x3分别为领航车、前车与自车的位置信息,v1、v2、v3为领航车、前车与自车的速度,h为车间时距,L为车长,Lcar为车长,Lsafe为前车与自车静止时应保持的最小车间距,车辆动作值包括Kp、Ki、Kd,所述Kp、Ki、Kd分别为比例系数、积分系数、微分系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学,未经武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110402251.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多环芳族系化合物及其制备方法和应用
- 下一篇:一种超燃冲压发动机的燃烧室