[发明专利]基于加强学习的非仿射系统最优容错控制方法有效
| 申请号: | 202110081539.4 | 申请日: | 2021-01-21 |
| 公开(公告)号: | CN112925204B | 公开(公告)日: | 2022-06-24 |
| 发明(设计)人: | 王雨佳;杨佳锷;王牧原;杨佳喆 | 申请(专利权)人: | 深圳翱诺科技有限公司 |
| 主分类号: | G05B13/04 | 分类号: | G05B13/04 |
| 代理公司: | 北京君恒知识产权代理有限公司 11466 | 代理人: | 张林 |
| 地址: | 518107 广东省深圳市光明区凤凰街道*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 加强 学习 非仿射 系统 最优 容错 控制 方法 | ||
1.基于加强学习的非仿射系统最优容错控制方法,其特征在于:该方法包括以下步骤:
步骤一:利用系统转换技术把非仿射系统转换为仿射系统;
步骤二:设计固定时间滑模观测器;
步骤三:设计容错跟踪控制器;
步骤一中通过以下形式的非线性系统:
其中,代表系统的状态向量,υ(t)∈Rm代表系统的控制输入,代表零时刻的状态向量,d(t)代表外部的未知时变扰动,代表与状态和控制有关的非仿射函数;
固定时间滑模观测器利用滑模技术设计;
滑模观测器如下:
其中,ξ1,ξ2为观测器的两个状态变量,假设综合扰动的导数满足l2为大于零的常数;则当观测器参数q,κ1,κ2,κ3,l2以下关系时
状态ξ1,ξ2可以在固定时间内分别收敛到和Δ(t);
固定时间表示如下:
其中,τ=(κ1/κ2)1/(q+1/2)>0;
容错跟踪控制器利用加强学习技术设计;
稳态控制器设计:参考信号表示如下:
其中,
状态反馈控制器:定义跟踪误差为
结合公式和得
其中υe=υ-υr,为了方便表达,把上诉公式写成如下形式
e(0)=e0,
其中,定义以下无限时间域性能指标
V(e0,υe)=γ(e(τ),υe(τ))dτ
利用最优理论,得到哈密顿方程如下
其中,为函数V对误差e求偏导,定义最优性能指标和最优状态反馈控制器如下
把最优性能指标和最优状态反馈控制器带入哈密顿方程,得
因此,可以计算得到,最优控制器表示如下
2.根据权利要求1所述的基于加强学习的非仿射系统最优容错控制方法,其特征在于:仿真验证基于加强学习的非仿射系统最优容错控制方法的有效性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳翱诺科技有限公司,未经深圳翱诺科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110081539.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于加强学习的最优跟踪控制算法
- 下一篇:一种无机非金属材料成型设备





