[发明专利]一种粒子群优化的径向基神经网络车辆速度跟踪方法有效
| 申请号: | 201811541341.4 | 申请日: | 2018-12-17 |
| 公开(公告)号: | CN109376493B | 公开(公告)日: | 2023-02-03 |
| 发明(设计)人: | 尹智帅;何嘉雄;聂琳真 | 申请(专利权)人: | 武汉理工大学 |
| 主分类号: | G06F30/27 | 分类号: | G06F30/27;G06N3/006;G06N3/084;G06N3/09;G05B13/04 |
| 代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 薛玲 |
| 地址: | 430070 湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 粒子 优化 径向 神经网络 车辆 速度 跟踪 方法 | ||
1.一种粒子群优化的径向基神经网络车辆速度跟踪方法,其特征在于,包括以下步骤:
步骤1:通过引擎模型、传动系统模型、车辆模型、刹车模型构建汽车动力学模型;
步骤2:建立径向基神经网络模型,通过梯度下降法计算径向基神经网络模型的参数,PID控制器通过径向基神经网络模型自适应调整参数以构建径向基神经网络PID控制器;
步骤3:通过粒子群优化算法离线优化,得到粒子群优化后的参数;
步骤4:将粒子群优化后的参数初始化赋值给径向基神经网络PID控制器;
步骤5:通过初始化后径向基神经网络PID控制器得到初始节气门开度或初始制动踏板位置,将初始节气门开度或初始制动踏板位置输入到汽车动力学模型以计算实际跟踪车速V(τ),τ∈[0,TMAX],τ为仿真时间,TMAX为仿真最大时间;
步骤6:将实际跟踪车速V(τ)以及PID控制器输出得到τ-1时刻的A(τ-1)输入到神经网络中,根据速度的反馈误差调整径向基神经网络和PID控制器的参数,仿真时间τ增加时间步长并转至步骤5,循环执行,直到仿真时间τ达到仿真最大时间TMAX;
步骤1中所述引擎模型为:
其中,Te(t)为t时刻的引擎的有效转矩,Ne(t)为t时刻的曲轴的转速,AT(t)为t时刻的节气门的开度,Ti(t)为t时刻的曲轴换挡要求的叶轮转矩,Ie是引擎曲轴的转动惯量;
步骤1中所述传动系统模型为:
其中,Ne(t)为t时刻的曲轴的转速,K(t)是t时刻的容量因子,Ti(t)为t时刻的曲轴换挡要求的叶轮转矩,Tq(t)是t时刻的液力变矩器的输出轴转矩,RTQ(t)是t时刻的转矩因子,RTR(t)是t时刻的变速器的传动比,To(t)是t时刻的自动变速器的输出轴转矩,ηt是自动变速器的效率,Nm(t)是t时刻的自动变速器输入轴旋转速度,No(t)是t时刻的自动变速器输出轴的旋转速度,Nw(t)是t时刻的车轮的转速,Rfd是主减速器传动比,K(t)和RTQ(t)是由如下表达式确定的:
其中,f2是容量系数,f3是变矩率系数,Nm(t)为t时刻的自动变速器输入轴旋转速度,Ne(t)为t时刻的曲轴的转速;
步骤1中所述车辆模型为:
其中,Iv是转动惯量,是t时刻的车轮的转速的导数,Rfd是主减速器传动比,To(t)是t时刻的自动变速器的输出轴转矩,Tload(t)是t时刻的负载的转矩,V(t)为t时刻的实际跟踪车速,r为车轮的半径,Nw(t)是t时刻的车轮的转速,Rload,0是摩擦阻力系数,Rload,2是空气动力学阻力系数,Tu(t)是t时刻的刹车的转矩;
步骤1中所述刹车模型为:
其中,r为车轮的半径,AB(t)为t时刻的制动踏板的位置,Tu(t)为t时刻的刹车转矩;
步骤2中所述建立径向基神经网络模型为:
径向基神经网络的输入向量为:
X=(x1,x2,x3)T
其中,x1是t-1时刻的PID控制器的输出A(t-1),x2是t时刻的实际跟踪车速V(t),x3是(t-1)时刻的实际跟踪车速V(t-1);
径向基神经网络输入层的节点数量为3;
径向基神经网络隐藏层的节点数量为6;
径向基神经网络的输出为t时刻的模型输出VR(t),径向基神经网络输出层的节点数量为1;
在径向基神经网络结构中,X=[x1,x2,…,xn]T为径向基神经网络的输入向量,xi,i=1,2,…n为X的第i个输入量,径向基神经网络输入层的节点数量为n=3,h=[h1,h2,…,hm]T为径向基神经网络隐藏层节点径向基向量,hj,j=1,2,…m为第j个神经元隐藏层节点的径向基,径向基神经网络隐藏层的节点数量为m=6,径向基函数为高斯函数:
其中,X=[x1,x2,…,xn]T是径向基神经网络的输入向量,xi,i=1,2,…n为X的第i个输入量,cj=[cj,1,cj,2,…,cj,n]T是第j个神经元隐藏层节点的中心向量,cj,i,i=1,2,…n为第j个神经元隐藏层节点的第i个中心值,b=[b1,b2,…,bm]T为隐藏层节点的基宽向量,bj,j=1,2,…m为第j个神经元隐藏层节点的基宽,w=[w1,w2,…,wm]T是隐藏层到输出层连接的权值向量,wi,j=1,2,…m为第i个隐藏层神经元到输出层连接的权值,VR(t)是神经网络的输出,径向基神经网络输入层的节点数量为n=3,径向基神经网络隐藏层的节点数量为m=6;
径向基神经网络在t时刻的输出为VR(t),汽车动力学模型的输出为t时刻实际跟踪车速V(t),径向基神经网络的性能指标函数为:
径向基神经网络采用监督学习,为了让t时刻的J(t)的值达到最小,采用梯度下降法,不断更新隐藏层节点的中心向量cj=[cj,1,cj,2,…,cj,n]T、隐藏层节点的基宽向量b=[b1,b2,…,bm]T、以及隐藏层到输出层连接的权值向量w=[w1,w2,…,wm]T,径向基神经网络输入层的节点数量为n=3,径向基神经网络隐藏层的节点数量为m=6;
步骤2中所述通过梯度下降法计算径向基神经网络模型的参数为:
其中,径向基神经网络输入层的节点数量为n=3,径向基神经网络隐藏层的节点数量为m=6,β为神经网络的学习率,α为动量因子,β,α∈(0,1),cj,i(t)为t时刻的第j个神经元隐藏层节点的第i个中心值,cj,i(t-1)为t-1时刻的第j个神经元隐藏层节点的第i个中心值,cj,i(t-2)为t-2时刻的第j个神经元隐藏层节点的第i个中心值,Δcj,i(t)为t时刻的第j个神经元隐藏层节点的第i个中心值的增量;
X=[x1,x2,…,xn]T是径向基神经网络的输入向量,cj=[cj,1,cj,2,…,cj,n]T是第j个神经元隐藏层节点的中心向量,bj,j=1,2,…m为第j个神经元隐藏层节点的基宽,wj,j=1,2,…m为第j个隐藏层神经元到输出层连接的权值,Δcj(t)为t时刻的第j个神经元隐藏层节点的权重的增量,VR(t)为径向基神经网络在t时刻的输出,V(t)为步骤1中所述在t时刻的实际跟踪车速;
bj(t)为t时刻的第j个神经元隐藏层节点的基宽,bj(t-1)为t-1时刻的第j个神经元隐藏层节点的基宽,bj(t-2)为t-2时刻的第j个神经元隐藏层节点的基宽,Δbj(t)为t时刻的第j个神经元隐藏层节点的基宽的增量,hj,j=1,2,…m为第j个神经元隐藏层节点的径向基;
wj(t)为t时刻的第j个神经元隐藏层节点的权重,wj(t-1)为t-1时刻的第j个神经元隐藏层节点的权重,wj(t-2)为t-2时刻的第j个神经元隐藏层节点的权重,Δwj(t)为t时刻的第j个神经元隐藏层节点的权重的增量;
步骤2中所述PID控制器通过径向基神经网络模型自适应调整参数以构建径向基神经网络PID控制器为:
该控制器使用增量PID控制理论,其控制的误差为:
e(t)=Vd(t)-V(t)(9)
其中,Vd(t)为t时刻的跟踪目标车速,V(t)为t时刻的实际跟踪车速,e(t)为t时刻的跟踪误差;
控制器的输入以及控制算法为:
其中,e(t)为t时刻的跟踪误差,e(t-1)为t-1时刻的跟踪误差,e(t-2)为t-2时刻的跟踪误差,xc(1)是PID控制器的第一输入参数,xc(2)是PID控制器的第二输入参数,xc(3)是PID控制器的第三输入参数,A(t)是t时刻的PID控制器的输出,A(t-1)为PID控制器t-1时刻的输出,ΔA(t)为t时刻的A(t)的增量,Kp(t)是PID控制器t时刻的比例系数,Ki(t)是PID控制器t时刻的积分系数,Kd(t)是PID控制器t时刻的微分系数,设置PID控制器的参数调节的性能指标为:
其中,Vd(t)为t时刻的跟踪目标车速,V(t)为t时刻的实际跟踪车速;
为了使t时刻的JC(t)最小,使用梯度下降法调节PID的增益参数
式中,ΔKP(t)为PID在t时刻的比例系数的增量,ΔKi(t)为PID在t时刻的积分系数的增量,ΔKd(t)为PID在t时刻的微分系数的增量,ηP0是PID控制器的比例系数学习率的初始值,ηi0是PID控制器的积分系数学习率的初始值,ηd0是PID控制器的微分系数学习率的初始值;
其中,x1为径向基神经网络的输入向量为X=(x1,x2,x3)T的第一个元素,即x1=A(t-1),bj,j=1,2,…m为第j个神经元隐藏层节点的基宽,wj,j=1,2,…m为第j个隐藏层神经元到输出层连接的权值,hj,j=1,2,…m为第j个神经元隐藏层节点的径向基,cj,1,j=1,2,…m为第j个神经元隐藏层节点的第1个中心值;
t时刻的PID控制器的输出为:
A(t)=A(t-1)+(KP0+ΔKP(t))xc(1)+(Ki0+ΔKi(t))xc(2)+(Kd0+ΔKd(t))xc(3)
其中,KP0是PID控制器的比例系数初始值,Ki0是PID控制器的积分系数初始值,Kd0是PID控制器的微分系数初始值,ΔKP(t)为PID在t时刻的比例系数的增量,ΔKi(t)为PID在t时刻的积分系数的增量,ΔKd(t)为PID在t时刻的微分系数的增量,xc(1)是PID控制器的第一输入参数,xc(2)是PID控制器的第二输入参数,xc(3)是PID控制器的第三输入参数;
A(t)被引入来简化速度的控制,当A(t)为正值时,将其视为节气门的开度AT,当A(t)为负值时,将其绝对值视为制动踏板的位置AB;
步骤3中通过粒子群优化算法离线优化为:
初始化粒子位置和速度信息,设置种群规模为N,迭代总次数为L,粒子位置信息维度为D,即待优化的D参数即粒子位置为:
其中,表示第K次迭代第h个粒子的PID控制器的比例系数初始值,的最大值为P1,MAX,的最小值为P1,MIN,表示第K次迭代第h个粒子的PID控制器的积分系数初始值,的最大值为P2,MAX,的最小值为P2,MAX,表示第K次迭代第h个粒子的PID控制器的微分系数初始值,的最大值为P3,MAX,的最小值为P3,MIN,ηp0hK表示第K次迭代第h个粒子的PID控制器的比例系数学习率的初始值,ηp0hK的最大值为P4,MAX,ηp0hK的最小值为P4,MIN,ηi0hK表示第K次迭代第h个粒子的PID控制器的积分系数学习率的初始值,ηi0hK的最大值为P5,MAX,ηi0hK的最小值为P5,MIN,ηd0hK,表示第K次迭代第h个粒子的PID控制器的微分系数学习率的初始值,设置ηd0hK的最大值为P6,MAX,ηd0hK的最小值为P6,MIN;c0hK表示第K次迭代第h个粒子的神经网络的中心值的初始值,设置c0hK的最大值为P7,MAX,c0hK的最小值为P7,MIN,b0hK表示第K次迭代第h个粒子的神经网络基宽值的初始值,设置b0hK的最大值为P8,MAX,b0hK的最小值为P8,MIN,w0hK表示第K次迭代第h个粒子的神经网络权重值的初始值,w0hK的最大值为P9,MAX,w0hK的最小值为P9,MIN;
粒子位置上限为:
PMAX=[P1,MAX,P2,MAX,P3,MAX,P4,MAX,P5,MAX,P6,MAX,P7,MAX,P8,MAX,P9,MAX]
粒子位置下限为:PMIN=[P1,MIN,P2,MIN,P3,MIN,P4,MIN,P5,MIN,P6,MIN,P7,MIN,P8,MIN,P9,MIN]
设置粒子速度的最大值为VMAX,粒子速度最小值为VMIN,粒子速度V∈[VMIN,VMAX];
设置目标函数即适应度函数为:
其中,t为控制系统的仿真时间,e(t)为t时刻的跟踪误差;
粒子飞行速度更新公式为:
Vh,dK+1=WVh,dK+c1rand1(Ph,dK-Xh,dK)+c2rand2(Pg,dK-Xh,dK) (17)
粒子位置更新公式为:
Xh,dK+1=Xh,dK+Vh,dK+1,K∈[1,L],h∈[1,N],d∈[1,D]
其中,K为算法的当前迭代次数,Vh,dK+1表示第K+1次迭代粒子h飞行速度矢量的第d维分量,Vh,dK表示第K次迭代粒子h飞行速度矢量的第d维分量,Xh,dK+1表示第K+1次迭代粒子h位置矢量的第d维分量,Xh,dK表示第K次迭代粒子h位置矢量的第d维分量,Ph,dK表示第K次迭代粒子h个体极值的第d维分量,Pg,dK表示第K次迭代群体极值的第d维分量,c1为第一加速因子,c2为第二加速因子,rand1为分布在[0,1]之间的第一随机值,rand2为分布在[0,1]之间的第二随机值,W为惯性权重;
步骤3中所述粒子群优化后的参数为:
控制系统经过L次迭代优化之后的D个参数分别为:
*KP0,*Ki0,*Kd0,*ηp0,*ηi0,*ηd0,*c0,*b0,*w0;
其中*Kp0是优化后的PID控制器的比例系数初始值,*Ki0是优化后的PID控制器的比例系数初始值,*Kd0是优化后的PID控制器的比例系数初始值;*ηp0是优化后的PID控制器的比例系数学习率的初始值,*ηi0是优化后的PID控制器的积分系数学习率的初始值,*ηd0是优化后的PID控制器的微分系数学习率的初始值;*c0是优化后神经网络的中心值的初始值,*b0是优化后神经网络的基宽值的初始值,*w0是优化后神经网络的权重值的初始值;神经网络的中心向量c的维度为3×6的矩阵,初始化让这18个值相等都为*c0,神经网络的中心向量b的维度为1×6的矩阵,初始化让这6个值相等都为*b0,神经网络的中心向量w的维度为1×6的矩阵,初始化让这6个值相等都为*w0;
步骤6中所述速度的反馈误差为V(τ)-VR(τ),Vd(τ)-V(τ);
步骤6中所述径向基神经网络的参数为:中心向量c,基宽向量b,权重向量w;
步骤6中所述PID控制器的参数为:PID控制器的比例系数Kp,PID控制器积分系数Ki,PID控制器微分系数Kd;
步骤6中所述仿真时间τ增加时间步长为:τ=τ+Δτ,Δτ为时间步长;
τ∈[0,TMAX],τ为仿真时间,TMAX为仿真最大时间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学,未经武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811541341.4/1.html,转载请声明来源钻瓜专利网。





