[发明专利]一种离散时间非线性系统的事件触发优化控制方法有效
| 申请号: | 202010434040.2 | 申请日: | 2020-05-21 |
| 公开(公告)号: | CN111812973B | 公开(公告)日: | 2022-02-22 |
| 发明(设计)人: | 穆朝絮;廖凯举;孙长银 | 申请(专利权)人: | 天津大学 |
| 主分类号: | G05B13/04 | 分类号: | G05B13/04 |
| 代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 韩帅 |
| 地址: | 300072*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 离散 时间 非线性 系统 事件 触发 优化 控制 方法 | ||
1.一种离散时间非线性系统的事件触发优化控制方法,其特征在于:
构建含有控制约束的离散时间非线性事件触发控制系统;
根据事件触发控制系统设定事件触发条件;
构建求解离散非线性事件触发控制系统的触发控制器,该触发控制器还包括:
--用于学习系统动态信息的模型网络;
--用于学习代价函数及其偏导数信息的评价网络;
--用于获得近似最优控制律的执行网络;
--用于计算触发误差和触发阈值之间关系的传感器;
--用于保持非采样状态下的控制律的零阶保持器:其中:
所述非线性事件触发控制系统为:
(1-1)一类离散时间非线性仿射系统如下:
xk+1=f(xk)+g(xk)uk, (1)
其中是状态向量,是控制输入向量;对于任意在f(0)=0处是可微的,是非奇异的;系统(1)是可控的,并且f+gu在包含原点的集合上是Lipschitz连续的,约束下的控制量其中:是第i个执行器的饱和边界;是由给定的常数对角矩阵;
(1-2)在事件触发控制中,设采样时刻为则该时刻的反馈控制律为
此外,定义事件触发误为
其中xk表示当前时刻的状态,表示采样时刻的状态,则反馈控制律uk可以重新表示为
uk=μ(ek+xk) (4)
那么,事件触发控制下系统(1)可以表示为
xk+1=f(xk)+g(xk)μ(ek+xk) (5)
(1-3)离散时间最优控制问题的目标是找出控制律uk,使得以下无限域代价函数最小:
其中U(xj,μ(ej+xj))为效用函数,为了解决控制约束问题,系统效用函数采用非二次型形式如下
其中表示一个满足的有界的一对一函数,Q和R是具有适当维度的正定矩阵;为了方便计算,将用Uk表示;其中:
基于Bellman最优性原理获得最优代价函数V*(xk)为
由于控制律uk满足最优控制的一阶必要条件,则对于k∈[ki,ki+1),i=0,1,2…,可以得到最优控制律为
根据事件触发控制系统设定事件触发条件为:
2.根据权利要求1所述的一种离散时间非线性系统的事件触发优化控制方法,其特征在于:所述模型网络的输出为:
其中:xk表示系统状态输入,是由神经网络获得的近似控制律,ψ(·)为激活函数,ωm和νm分别为模型网络输入层到隐含层和隐含层到输出层的权值矩阵;其中:根据梯度下降法,模型网络的权值更新为:
其中ξm为学习率;模型网络训练结束后,保持其最终权值不变,对评价网络和执行网络进行训练。
3.根据权利要求1所述的一种离散时间非线性系统的事件触发优化控制方法,其特征在于:所述评价网络的输出为:
其中:ωc和νc分别为评价网络输入层到隐含层和隐含层到输出层的权值矩阵;
其中:评价网络的权值也采用梯度下降法进行更新,如下:
其中:ξc>0为学习率。
4.根据权利要求1所述的一种离散时间非线性系统的事件触发优化控制方法,其特征在于:执行网络的输出为
其中:ωa和νa分别为执行网络输入层到隐含层和隐含层到输出层的权值矩阵,其中:
执行网络的权值更新律为
其中ξa>0为学习率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010434040.2/1.html,转载请声明来源钻瓜专利网。





