[发明专利]基于加强学习的非仿射系统最优容错控制方法有效

专利信息
申请号: 202110081539.4 申请日: 2021-01-21
公开(公告)号: CN112925204B 公开(公告)日: 2022-06-24
发明(设计)人: 王雨佳;杨佳锷;王牧原;杨佳喆 申请(专利权)人: 深圳翱诺科技有限公司
主分类号: G05B13/04 分类号: G05B13/04
代理公司: 北京君恒知识产权代理有限公司 11466 代理人: 张林
地址: 518107 广东省深圳市光明区凤凰街道*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 加强 学习 非仿射 系统 最优 容错 控制 方法
【权利要求书】:

1.基于加强学习的非仿射系统最优容错控制方法,其特征在于:该方法包括以下步骤:

步骤一:利用系统转换技术把非仿射系统转换为仿射系统;

步骤二:设计固定时间滑模观测器;

步骤三:设计容错跟踪控制器;

步骤一中通过以下形式的非线性系统:

其中,代表系统的状态向量,υ(t)∈Rm代表系统的控制输入,代表零时刻的状态向量,d(t)代表外部的未知时变扰动,代表与状态和控制有关的非仿射函数;

固定时间滑模观测器利用滑模技术设计;

滑模观测器如下:

其中,ξ1,ξ2为观测器的两个状态变量,假设综合扰动的导数满足l2为大于零的常数;则当观测器参数q,κ1,κ2,κ3,l2以下关系时

状态ξ1,ξ2可以在固定时间内分别收敛到和Δ(t);

固定时间表示如下:

其中,τ=(κ12)1/(q+1/2)>0;

容错跟踪控制器利用加强学习技术设计;

稳态控制器设计:参考信号表示如下:

其中,

状态反馈控制器:定义跟踪误差为

结合公式和得

其中υe=υ-υr,为了方便表达,把上诉公式写成如下形式

e(0)=e0

其中,定义以下无限时间域性能指标

V(e0,υe)=γ(e(τ),υe(τ))dτ

利用最优理论,得到哈密顿方程如下

其中,为函数V对误差e求偏导,定义最优性能指标和最优状态反馈控制器如下

把最优性能指标和最优状态反馈控制器带入哈密顿方程,得

因此,可以计算得到,最优控制器表示如下

2.根据权利要求1所述的基于加强学习的非仿射系统最优容错控制方法,其特征在于:仿真验证基于加强学习的非仿射系统最优容错控制方法的有效性。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳翱诺科技有限公司,未经深圳翱诺科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110081539.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top