[发明专利]一种基于模型参考强化学习的无人船容错控制方法在审

申请号：	202111631716.8	申请日：	2021-12-28
公开（公告）号：	CN114296350A	公开（公告）日：	2022-04-08
发明（设计）人：	张清瑞;熊培轩;张雷;朱波;胡天江	申请（专利权）人：	中山大学
主分类号：	G05B13/04	分类号：	G05B13/04
代理公司：	深圳市创富知识产权代理有限公司 44367	代理人：	高冰
地址：	510275 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于模型参考强化学习无人容错控制方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于模型参考强化学习的无人船容错控制方法，该方法包括：对无人船的不确定性因素进行分析，构建无人船名义动力学模型；基于无人船名义动力学模型，设计无人船标称控制器；基于最大熵的Actor‑Critic方法，根据实际无人船系统、无人船名义动力学模型的状态变量差值和无人船标称控制器的输出，构建基于模型参考强化学习的容错控制器；根据控制任务需求，搭建强化学习评价函数和控制策略模型并训练容错控制器，得到训练完成的控制策略。通过使用本发明，能够显著提高无人船系统的安全性和可靠性。本发明作为一种基于模型参考强化学习的无人船容错控制方法，可广泛应用于无人船控制领域。

技术领域

本发明涉及无人船控制领域，尤其涉及一种基于模型参考强化学习的无人船容错控制方法。

背景技术

随着制导、导航和控制技术的显著进步，无人船(autonomous surface vehicles，ASV)的应用已经占据了航空举足轻重的部分。在大多数应用中，无人船预计将在长时间没有人工干预的情况下安全运行。因此，需要无人船具有足够的安全和可靠性属性以提供正常的运作，并避免灾难性的后果。然而，无人船容易出现故障、系统组建退化、传感器故障等问题，从而经历性能恶化，不稳定，甚至灾难性的损失。

发明内容

为了解决上述技术问题，本发明的目的是提供一种基于模型参考强化学习的无人船容错控制方法，可以在遇到故障后恢复系统性能或保持系统运行，从而显著提高系统的安全性和可靠性。

本发明所采用的第一技术方案是：一种基于模型参考强化学习的无人船容错控制方法，包括以下步骤：

S1、对无人船的不确定性因素进行分析，构建无人船名义动力学模型；

S2、基于无人船名义动力学模型，设计无人船标称控制器；

S3、基于最大熵的Actor-Critic方法，根据实际无人船系统、无人船名义动力学模型的状态变量差值和无人船标称控制器的输出，构建基于模型参考强化学习的容错控制器；

S4、根据控制任务需求，搭建强化学习评价函数和控制策略模型并训练容错控制器，得到训练完成的控制策略。

进一步，所述无人船名义动力学模型的公式表示如下：

上式中，表示广义坐标向量，v表示广义速度向量，u表示控制力和力矩，M表示惯性矩阵，C(v)包括科氏力和向心力，D(v)表示阻尼矩阵，G(v)表示由于重力和浮力及力矩而产生的未建模动力学，B表示预设的输入矩阵

进一步，所述无人船标称控制器的公式表示如下：

上式中，N_m和H_m包含无人船动力学模型的所有已知常量参数，η_m表示标称模型的广义坐标向量，u_m表示控制律，x_m表示参考模型的状态。

进一步，所述容错控制器的公式表示如下：

上式中，H_m-L表示Hurwitz矩阵，u_l表示来自深度学习模块的控制策略，β(v)表示内环动力学中所有模型不确定性的集合，n_v表示广义速度测量值上的噪声矢量，f_v表示作用于广义速度矢量的传感器故障。

进一步，所述强化学习评价函数的公式表示如下：

Q_π(s_t,u_l,t)＝T^πQ_π(s_t,u_l,t)

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中山大学，未经中山大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202111631716.8/2.html，转载请声明来源钻瓜专利网。

上一篇：深度图检测装置、方法、系统及存储介质
下一篇：数据处理方法、装置和终端设备

同类专利

专利分类

G 物理

G05 控制；调节
G05B 一般的控制或调节系统；这种系统的功能单元；用于这种系统或单元的监视或测试装置
G05B13-00 自适应控制系统，即系统按照一些预定的准则自动调整自己使之具有最佳性能的系统
G05B13-02 .电的
G05B13-04 ..包括使用模型或模拟器的

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于模型参考强化学习的无人船容错控制方法在审

专利文献下载