[发明专利]一种粒子群优化的径向基神经网络车辆速度跟踪方法有效

申请号：	201811541341.4	申请日：	2018-12-17
公开（公告）号：	CN109376493B	公开（公告）日：	2023-02-03
发明（设计）人：	尹智帅;何嘉雄;聂琳真	申请（专利权）人：	武汉理工大学
主分类号：	G06F30/27	分类号：	G06F30/27;G06N3/006;G06N3/084;G06N3/09;G05B13/04
代理公司：	武汉科皓知识产权代理事务所(特殊普通合伙) 42222	代理人：	薛玲
地址：	430070 湖***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种粒子优化径向神经网络车辆速度跟踪方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种粒子群优化的径向基神经网络车辆速度跟踪方法，其特征在于，包括以下步骤：

步骤1：通过引擎模型、传动系统模型、车辆模型、刹车模型构建汽车动力学模型；

步骤2：建立径向基神经网络模型，通过梯度下降法计算径向基神经网络模型的参数，PID控制器通过径向基神经网络模型自适应调整参数以构建径向基神经网络PID控制器；

步骤3：通过粒子群优化算法离线优化，得到粒子群优化后的参数；

步骤4：将粒子群优化后的参数初始化赋值给径向基神经网络PID控制器；

步骤5：通过初始化后径向基神经网络PID控制器得到初始节气门开度或初始制动踏板位置，将初始节气门开度或初始制动踏板位置输入到汽车动力学模型以计算实际跟踪车速V(τ)，τ∈[0，T_MAX]，τ为仿真时间，T_MAX为仿真最大时间；

步骤6：将实际跟踪车速V(τ)以及PID控制器输出得到τ-1时刻的A(τ-1)输入到神经网络中，根据速度的反馈误差调整径向基神经网络和PID控制器的参数，仿真时间τ增加时间步长并转至步骤5，循环执行，直到仿真时间τ达到仿真最大时间T_MAX；

步骤1中所述引擎模型为：

其中，T_e(t)为t时刻的引擎的有效转矩，N_e(t)为t时刻的曲轴的转速，A_T(t)为t时刻的节气门的开度，T_i(t)为t时刻的曲轴换挡要求的叶轮转矩，I_e是引擎曲轴的转动惯量；

步骤1中所述传动系统模型为：

其中，N_e(t)为t时刻的曲轴的转速，K(t)是t时刻的容量因子，T_i(t)为t时刻的曲轴换挡要求的叶轮转矩，T_q(t)是t时刻的液力变矩器的输出轴转矩，R_TQ(t)是t时刻的转矩因子，R_TR(t)是t时刻的变速器的传动比，T_o(t)是t时刻的自动变速器的输出轴转矩，η_t是自动变速器的效率，N_m(t)是t时刻的自动变速器输入轴旋转速度，N_o(t)是t时刻的自动变速器输出轴的旋转速度，N_w(t)是t时刻的车轮的转速，R_fd是主减速器传动比，K(t)和R_TQ(t)是由如下表达式确定的：

其中，f2是容量系数，f3是变矩率系数，N_m(t)为t时刻的自动变速器输入轴旋转速度，N_e(t)为t时刻的曲轴的转速；

步骤1中所述车辆模型为：

其中，I_v是转动惯量，是t时刻的车轮的转速的导数，R_fd是主减速器传动比，T_o(t)是t时刻的自动变速器的输出轴转矩，T_load(t)是t时刻的负载的转矩，V(t)为t时刻的实际跟踪车速，r为车轮的半径，N_w(t)是t时刻的车轮的转速，R_load，0是摩擦阻力系数，R_load，2是空气动力学阻力系数，T_u(t)是t时刻的刹车的转矩；

步骤1中所述刹车模型为：

其中，r为车轮的半径，A_B(t)为t时刻的制动踏板的位置，T_u(t)为t时刻的刹车转矩；

步骤2中所述建立径向基神经网络模型为：

径向基神经网络的输入向量为：

X＝(x₁，x₂，x₃)^T

其中，x₁是t-1时刻的PID控制器的输出A(t-1)，x₂是t时刻的实际跟踪车速V(t)，x₃是(t-1)时刻的实际跟踪车速V(t-1)；

径向基神经网络输入层的节点数量为3；

径向基神经网络隐藏层的节点数量为6；

径向基神经网络的输出为t时刻的模型输出V_R(t)，径向基神经网络输出层的节点数量为1；

在径向基神经网络结构中，X＝[x₁，x₂，…，x_n]^T为径向基神经网络的输入向量，x_i，i＝1，2，…n为X的第i个输入量，径向基神经网络输入层的节点数量为n＝3，h＝[h₁，h₂，…，h_m]^T为径向基神经网络隐藏层节点径向基向量，h_j，j＝1，2，…m为第j个神经元隐藏层节点的径向基，径向基神经网络隐藏层的节点数量为m＝6，径向基函数为高斯函数：

其中，X＝[x₁，x₂，…，x_n]^T是径向基神经网络的输入向量，x_i，i＝1，2，…n为X的第i个输入量，c_j＝[c_j，1，c_j，2，…，c_j，n]^T是第j个神经元隐藏层节点的中心向量，c_j，i，i＝1，2，…n为第j个神经元隐藏层节点的第i个中心值，b＝[b₁，b₂，…，b_m]^T为隐藏层节点的基宽向量，b_j，j＝1，2，…m为第j个神经元隐藏层节点的基宽，w＝[w₁，w₂，…，w_m]^T是隐藏层到输出层连接的权值向量，w_i，j＝1，2，…m为第i个隐藏层神经元到输出层连接的权值，VR(t)是神经网络的输出，径向基神经网络输入层的节点数量为n＝3，径向基神经网络隐藏层的节点数量为m＝6；

径向基神经网络在t时刻的输出为V_R(t)，汽车动力学模型的输出为t时刻实际跟踪车速V(t)，径向基神经网络的性能指标函数为：

径向基神经网络采用监督学习，为了让t时刻的J(t)的值达到最小，采用梯度下降法，不断更新隐藏层节点的中心向量c_j＝[c_j，1，c_j，2，…，c_j，n]^T、隐藏层节点的基宽向量b＝[b₁，b₂，…，b_m]^T、以及隐藏层到输出层连接的权值向量w＝[w₁，w₂，…，w_m]^T，径向基神经网络输入层的节点数量为n＝3，径向基神经网络隐藏层的节点数量为m＝6；

步骤2中所述通过梯度下降法计算径向基神经网络模型的参数为：

其中，径向基神经网络输入层的节点数量为n＝3，径向基神经网络隐藏层的节点数量为m＝6，β为神经网络的学习率，α为动量因子，β，α∈(0，1)，c_j，i(t)为t时刻的第j个神经元隐藏层节点的第i个中心值，c_j，i(t-1)为t-1时刻的第j个神经元隐藏层节点的第i个中心值，c_j，i(t-2)为t-2时刻的第j个神经元隐藏层节点的第i个中心值，Δc_j，i(t)为t时刻的第j个神经元隐藏层节点的第i个中心值的增量；

X＝[x₁，x₂，…，x_n]^T是径向基神经网络的输入向量，c_j＝[c_j，1，c_j，2，…，c_j，n]^T是第j个神经元隐藏层节点的中心向量，b_j，j＝1，2，…m为第j个神经元隐藏层节点的基宽，w_j，j＝1，2，…m为第j个隐藏层神经元到输出层连接的权值，Δc_j(t)为t时刻的第j个神经元隐藏层节点的权重的增量，V_R(t)为径向基神经网络在t时刻的输出，V(t)为步骤1中所述在t时刻的实际跟踪车速；

b_j(t)为t时刻的第j个神经元隐藏层节点的基宽，b_j(t-1)为t-1时刻的第j个神经元隐藏层节点的基宽，b_j(t-2)为t-2时刻的第j个神经元隐藏层节点的基宽，Δb_j(t)为t时刻的第j个神经元隐藏层节点的基宽的增量，h_j，j＝1，2，…m为第j个神经元隐藏层节点的径向基；

w_j(t)为t时刻的第j个神经元隐藏层节点的权重，w_j(t-1)为t-1时刻的第j个神经元隐藏层节点的权重，w_j(t-2)为t-2时刻的第j个神经元隐藏层节点的权重，Δw_j(t)为t时刻的第j个神经元隐藏层节点的权重的增量；

步骤2中所述PID控制器通过径向基神经网络模型自适应调整参数以构建径向基神经网络PID控制器为：

该控制器使用增量PID控制理论，其控制的误差为：

e(t)＝V_d(t)-V(t)(9)

其中，V_d(t)为t时刻的跟踪目标车速，V(t)为t时刻的实际跟踪车速，e(t)为t时刻的跟踪误差；

控制器的输入以及控制算法为：

其中，e(t)为t时刻的跟踪误差，e(t-1)为t-1时刻的跟踪误差，e(t-2)为t-2时刻的跟踪误差，xc(1)是PID控制器的第一输入参数，xc(2)是PID控制器的第二输入参数，xc(3)是PID控制器的第三输入参数，A(t)是t时刻的PID控制器的输出，A(t-1)为PID控制器t-1时刻的输出，ΔA(t)为t时刻的A(t)的增量，K_p(t)是PID控制器t时刻的比例系数，K_i(t)是PID控制器t时刻的积分系数，K_d(t)是PID控制器t时刻的微分系数，设置PID控制器的参数调节的性能指标为：

其中，V_d(t)为t时刻的跟踪目标车速，V(t)为t时刻的实际跟踪车速；

为了使t时刻的J_C(t)最小，使用梯度下降法调节PID的增益参数

式中，ΔK_P(t)为PID在t时刻的比例系数的增量，ΔK_i(t)为PID在t时刻的积分系数的增量，ΔK_d(t)为PID在t时刻的微分系数的增量，η_P0是PID控制器的比例系数学习率的初始值，η_i0是PID控制器的积分系数学习率的初始值，η_d0是PID控制器的微分系数学习率的初始值；

其中，x₁为径向基神经网络的输入向量为X＝(x₁，x₂，x₃)^T的第一个元素，即x₁＝A(t-1)，b_j，j＝1，2，…m为第j个神经元隐藏层节点的基宽，w_j，j＝1，2，…m为第j个隐藏层神经元到输出层连接的权值，h_j，j＝1，2，…m为第j个神经元隐藏层节点的径向基，c_j，1，j＝1，2，…m为第j个神经元隐藏层节点的第1个中心值；

t时刻的PID控制器的输出为：

A(t)＝A(t-1)+(K_P0+ΔK_P(t))xc(1)+(K_i0+ΔK_i(t))xc(2)+(K_d0+ΔK_d(t))xc(3)

其中，K_P0是PID控制器的比例系数初始值，K_i0是PID控制器的积分系数初始值，K_d0是PID控制器的微分系数初始值，ΔK_P(t)为PID在t时刻的比例系数的增量，ΔK_i(t)为PID在t时刻的积分系数的增量，ΔK_d(t)为PID在t时刻的微分系数的增量，xc(1)是PID控制器的第一输入参数，xc(2)是PID控制器的第二输入参数，xc(3)是PID控制器的第三输入参数；

A(t)被引入来简化速度的控制，当A(t)为正值时，将其视为节气门的开度A_T，当A(t)为负值时，将其绝对值视为制动踏板的位置A_B；

步骤3中通过粒子群优化算法离线优化为：

初始化粒子位置和速度信息，设置种群规模为N，迭代总次数为L，粒子位置信息维度为D，即待优化的D参数即粒子位置为：

其中，表示第K次迭代第h个粒子的PID控制器的比例系数初始值，的最大值为P_1，MAX，的最小值为P_1，MIN，表示第K次迭代第h个粒子的PID控制器的积分系数初始值，的最大值为P_2，MAX，的最小值为P_2，MAX，表示第K次迭代第h个粒子的PID控制器的微分系数初始值，的最大值为P_3，MAX，的最小值为P_3，MIN，ηp0_h^K表示第K次迭代第h个粒子的PID控制器的比例系数学习率的初始值，ηp0_h^K的最大值为P_4，MAX，ηp0_h^K的最小值为P_4，MIN，ηi0_h^K表示第K次迭代第h个粒子的PID控制器的积分系数学习率的初始值，ηi0_h^K的最大值为P_5，MAX，ηi0_h^K的最小值为P_5，MIN，ηd0_h^K，表示第K次迭代第h个粒子的PID控制器的微分系数学习率的初始值，设置ηd0_h^K的最大值为P_6，MAX，ηd0_h^K的最小值为P_6，MIN；c0_h^K表示第K次迭代第h个粒子的神经网络的中心值的初始值，设置c0_h^K的最大值为P_7，MAX，c0_h^K的最小值为P_7，MIN，b0_h^K表示第K次迭代第h个粒子的神经网络基宽值的初始值，设置b0_h^K的最大值为P_8，MAX，b0_h^K的最小值为P_8，MIN，w0_h^K表示第K次迭代第h个粒子的神经网络权重值的初始值，w0_h^K的最大值为P_9，MAX，w0_h^K的最小值为P_9，MIN；

粒子位置上限为：

P_MAX＝[P_1，MAX，P_2，MAX，P_3，MAX，P_4，MAX，P_5，MAX，P_6，MAX，P_7，MAX，P_8，MAX，P_9，MAX]

粒子位置下限为：P_MIN＝[P_1，MIN，P_2，MIN，P_3，MIN，P_4，MIN，P_5，MIN，P_6，MIN，P_7，MIN，P_8，MIN，P_9，MIN]

设置粒子速度的最大值为V_MAX，粒子速度最小值为V_MIN，粒子速度V∈[V_MIN，V_MAX]；

设置目标函数即适应度函数为：

其中，t为控制系统的仿真时间，e(t)为t时刻的跟踪误差；

粒子飞行速度更新公式为：

V_h，d^K+1＝WV_h，d^K+c₁rand₁(P_h，d^K-X_h，d^K)+c₂rand₂(P_g，d^K-X_h，d^K) (17)

粒子位置更新公式为：

X_h，d^K+1＝X_h，d^K+V_h，d^K+1，K∈[1，L]，h∈[1，N]，d∈[1，D]

其中，K为算法的当前迭代次数，V_h，d^K+1表示第K+1次迭代粒子h飞行速度矢量的第d维分量，V_h，d^K表示第K次迭代粒子h飞行速度矢量的第d维分量，X_h，d^K+1表示第K+1次迭代粒子h位置矢量的第d维分量，X_h，d^K表示第K次迭代粒子h位置矢量的第d维分量，P_h，d^K表示第K次迭代粒子h个体极值的第d维分量，P_g，d^K表示第K次迭代群体极值的第d维分量，c₁为第一加速因子，c₂为第二加速因子，rand₁为分布在[0，1]之间的第一随机值，rand₂为分布在[0，1]之间的第二随机值，W为惯性权重；

步骤3中所述粒子群优化后的参数为：

控制系统经过L次迭代优化之后的D个参数分别为：

*K_P0，*K_i0，*K_d0，*ηp0，*ηi0，*ηd0，*c0，*b0，*w0；

其中*K_p0是优化后的PID控制器的比例系数初始值，*K_i0是优化后的PID控制器的比例系数初始值，*K_d0是优化后的PID控制器的比例系数初始值；*ηp0是优化后的PID控制器的比例系数学习率的初始值，*ηi0是优化后的PID控制器的积分系数学习率的初始值，*ηd0是优化后的PID控制器的微分系数学习率的初始值；*c0是优化后神经网络的中心值的初始值，*b0是优化后神经网络的基宽值的初始值，*w0是优化后神经网络的权重值的初始值；神经网络的中心向量c的维度为3×6的矩阵，初始化让这18个值相等都为*c0，神经网络的中心向量b的维度为1×6的矩阵，初始化让这6个值相等都为*b0，神经网络的中心向量w的维度为1×6的矩阵，初始化让这6个值相等都为*w0；

步骤6中所述速度的反馈误差为V(τ)-V_R(τ)，V_d(τ)-V(τ)；

步骤6中所述径向基神经网络的参数为：中心向量c，基宽向量b，权重向量w；

步骤6中所述PID控制器的参数为：PID控制器的比例系数K_p，PID控制器积分系数K_i，PID控制器微分系数K_d；

步骤6中所述仿真时间τ增加时间步长为：τ＝τ+Δτ，Δτ为时间步长；

τ∈[0，T_MAX]，τ为仿真时间，T_MAX为仿真最大时间。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于武汉理工大学，未经武汉理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201811541341.4/1.html，转载请声明来源钻瓜专利网。