[发明专利]SISO紧格式无模型控制器基于PSO-LSTM协同算法的参数自整定方法有效
| 申请号: | 202010558464.X | 申请日: | 2020-06-18 |
| 公开(公告)号: | CN112015081B | 公开(公告)日: | 2021-12-17 |
| 发明(设计)人: | 卢建刚;杨晔;陈晨;陈金水;王文海 | 申请(专利权)人: | 浙江大学;之江实验室 |
| 主分类号: | G05B13/02 | 分类号: | G05B13/02 |
| 代理公司: | 浙江杭州金通专利事务所有限公司 33100 | 代理人: | 刘晓春 |
| 地址: | 310027 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | siso 格式 模型 控制器 基于 pso lstm 协同 算法 参数 方法 | ||
1.SISO紧格式无模型控制器基于PSO-LSTM协同算法的参数自整定方法,其特征在于包括以下步骤:
步骤(1):SISO紧格式无模型控制器参数包含惩罚因子λ和步长因子ρ;确定SISO紧格式无模型控制器待整定参数,所述SISO紧格式无模型控制器待整定参数为所述SISO紧格式无模型控制器参数的部分或全部,包含惩罚因子λ和步长因子ρ的任意之一或其组合;确定LSTM神经网络的输入层节点数、隐含层单元数、输出层节点数,所述输出层节点数不少于所述SISO紧格式无模型控制器待整定参数个数;初始化LSTM神经网络每一个隐含层单元中输入门、遗忘门、输入状态以及输出门中待训练学习的权系数;初始化LSTM神经网络输出层待训练学习的权系数;确定PSO算法的最大迭代次数、种群规模;初始化PSO算法粒子群;确定适应度值下限值;
步骤(2):利用PSO算法优化计算步骤(1)所述的LSTM神经网络每一个隐含层单元中输入门、遗忘门、输入状态以及输出门中待训练学习的权系数;所述PSO算法中的适应度值由适应度值计算函数计算得到,所述适应度值计算函数的自变量包含系统输出期望值与系统输出实际值;基于粒子群中每一个粒子的适应度值,通过对比粒子的适应度,采用如下的更新公式:
V(i)=wpsoV(i)+c1r1(gbest(i)-pop(i))+c2r2(zbest-pop(i))
pop(i)=pop(i)+wpsoV(i)
其中V(i)是待更新的粒子个体速度,pop(i)是待更新的粒子个体位置,zbest是当前群体最优粒子,gbest是当前个体最优粒子,c1和c2是非负的常数,r1和r2是分布于0到1之间的随机数,wpso是惯性权重系数;
步骤(3):更新后的粒子进行转置与切割生成临时权重矩阵,将所述临时权重矩阵传入LSTM神经网络作为初始权重矩阵,LSTM神经网络输出所述SISO紧格式无模型控制器待整定参数的值,采用SISO紧格式无模型控制器的控制算法对被控对象进行控制后得到系统输出实际值,计算粒子在当前PSO算法迭代轮次的适应度值;
上述PSO算法重复迭代,直到适应度值小于适应度值下限值时输出群体最优解,或者直到迭代次数达到最大迭代次数时选取适应度值最小的结果来输出群体最优解;将所述群体最优解进行切割和转置操作生成权重矩阵,得到所述LSTM神经网络每一个隐含层单元中输入门、遗忘门、输入状态以及输出门中待训练学习的权系数;
步骤(4):将当前时刻记为k时刻,基于系统输出期望值与系统输出实际值,采用系统误差计算函数计算得到k时刻的系统误差,记为e(k);
步骤(5):将步骤(4)计算得到的系统误差及其函数组、系统输出期望值、系统输出实际值的任意之一或任意种组合,作为LSTM神经网络的输入;
步骤(6):基于步骤(5)所述的LSTM神经网络的输入,同时基于所述LSTM神经网络每一个隐含层单元中输入门、遗忘门、输入状态以及输出门中待训练学习的权系数,所述LSTM神经网络进行前向计算,首先将当前时刻的输入和上一时刻LSTM输出进行拼接并生成拼接向量,利用所述拼接向量计算LSTM隐含层单元中遗忘门的输出,然后进行LSTM隐含层单元中输入门与输入状态的计算,基于所述输入门与输入状态的值计算LSTM隐含层单元中单元状态值,接着完成LSTM隐含层单元中输出门的计算,利用所述输出门与单元状态的计算结果更新隐含层单元的最终输出,最后通过LSTM神经网络的输出层得到当前时刻LSTM输出,根据当前时刻LSTM输出计算并确定所述SISO紧格式无模型控制器待整定参数的值;
步骤(7):基于步骤(4)得到的系统误差e(k)、步骤(6)得到的所述SISO紧格式无模型控制器待整定参数的值,采用SISO紧格式无模型控制器的控制算法,计算得到SISO紧格式无模型控制器针对被控对象在k时刻的控制输入u(k);
步骤(8):基于步骤(7)得到的所述控制输入u(k),计算所述控制输入u(k)分别针对各个所述SISO紧格式无模型控制器待整定参数在k时刻的偏导数,具体计算公式如下:
当所述SISO紧格式无模型控制器待整定参数中包含惩罚因子λ时,所述控制输入u(k)针对所述惩罚因子λ在k时刻的偏导数为:
当所述SISO紧格式无模型控制器待整定参数中包含步长因子ρ时,所述控制输入u(k)针对所述步长因子ρ在k时刻的偏导数为:
其中,φ(k)为k时刻的伪梯度估计值;
步骤(9):以最小化系统误差函数的值为目标,采用基于链式法则的梯度下降法进行LSTM神经网络反向传播计算,更新所述LSTM神经网络每一个隐含层单元中输入门、遗忘门、输入状态以及输出门中待训练学习的权系数,供下一时刻所述LSTM神经网络进行前向计算时使用;所述梯度下降法公式如下:
其中w为LSTM神经网络中待训练学习的权系数,J(w)是关于权系数w的系统误差函数,α是学习率,α为0到1之间的实数;所述反向传播计算过程中,在更新所述LSTM神经网络每一个隐含层单元中输入门、遗忘门、输入状态以及输出门中待训练学习的权系数时,使用步骤(8)得到的所述控制输入u(k)分别针对各个所述SISO紧格式无模型控制器待整定参数在k时刻的偏导数;
步骤(10):所述控制输入u(k)作用于被控对象后,得到被控对象在后一时刻的系统输出实际值,返回到步骤(4),重复步骤(4)到步骤(10)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学;之江实验室,未经浙江大学;之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010558464.X/1.html,转载请声明来源钻瓜专利网。





