[发明专利]一种基于强化学习算法与未知干扰观测器的多AUV编队分布式控制方法有效
| 申请号: | 202110303184.9 | 申请日: | 2021-03-22 | 
| 公开(公告)号: | CN112947505B | 公开(公告)日: | 2022-11-25 | 
| 发明(设计)人: | 王卓;吴淼;孙延超;邓忠超;秦洪德;王海鹏;杨赫 | 申请(专利权)人: | 哈尔滨工程大学 | 
| 主分类号: | G05D1/06 | 分类号: | G05D1/06 | 
| 代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 时起磊 | 
| 地址: | 150001 黑龙江*** | 国省代码: | 黑龙江;23 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 基于 强化 学习 算法 未知 干扰 观测器 auv 编队 分布式 控制 方法 | ||
一种基于强化学习算法与未知干扰观测器的多AUV编队分布式控制方法,属于机器人控制技术领域。为了解决现有的控制方法对AUV编队进行控制存在控制精度差的问题,本发明针对多AUV编队中的AUV,利用纵向和艏向的复合控制系统进行控制;纵向和艏向的复合控制系统包括:基于纵向干扰观测器确定的纵向分布式控制器、基于艏向干扰观测器确定的艏向分布式控制器,以及用于确定控制器控制增益的Actor‑Critic算法;Actor‑Critic算法由Actor当前网络、Actor目标网络、Critic当前网络和Critic目标网络四个网络构成,四个网络均使用RBF神经网络。本发明主要用于水下机器人的控制。
技术领域
本发明涉及多AUV编队分布式控制方法,属于机器人控制技术领域。
背景技术
自主水下机器人(Autonomous Underwater Vehicle,AUV)作为探索海洋的重要技术手段,近几年在海洋环境探索、资源勘探等领域具有革命性应用,受到社会各界的广泛关注。AUV在执行任务时离不开各种传感器,通过传感器实时反馈回的信息,机器人能得到自身位置、速度等运动信息,也能得到外部环境等与任务息息相关的重要数据。然而由于单台AUV传感器的探测范围有限,在涉及范围较大的任务中,单体AUV显然无法快速高效地完成任务。为了补偿单智能体的物理限制,通常将多个AUV进行编队,在一定队形基础上遥控几个AUV同时执行复杂任务,这样的工作模式减少了每台智能体的任务量,提高了工作效率,这样的系统被称为多水下机器人系统(Multiple Autonomous Underwater VehicleSystem,MAUVS)。在MAUVS系统中,每个智能体拥有独立的意识,拥有独立完成任务的能力。同时为了解决更复杂的问题,每个单体要学会与其他智能体相协作,在这种情况下多智能体协同控制就是需要解决的一大难题。
海洋环境复杂,洋流等干扰会影响AUV编队的运动精度,进一步给协同控制增加了难度。利用目前的控制方法在对AUV编队进行控制难以取得良好的控制精度,控制效果并不理。
发明内容
本发明是为了解决现有的控制方法对AUV编队进行控制存在控制精度差的问题。
一种基于强化学习算法与未知干扰观测器的多AUV编队分布式控制方法,其特征在于,包括以下步骤:
针对多AUV编队中的AUV,利用纵向和艏向的复合控制系统进行控制;AUV为自主水下机器人;
所述纵向和艏向的复合控制系统包括:基于纵向干扰观测器确定的纵向分布式控制器、基于艏向干扰观测器确定的艏向分布式控制器,以及Actor-Critic算法;
所述基于纵向干扰观测器确定的纵向分布式控制器、基于艏向干扰观测器确定的艏向分布式控制器如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110303184.9/2.html,转载请声明来源钻瓜专利网。





