[发明专利]一种适用于复杂未知环境的自适应SAC-PID方法有效

专利信息
申请号: 202110525617.5 申请日: 2021-05-13
公开(公告)号: CN113359704B 公开(公告)日: 2022-04-19
发明(设计)人: 樊越海;阮雨迪;徐思宇;禹鑫燚;欧林林 申请(专利权)人: 浙江工业大学
主分类号: G05D1/02 分类号: G05D1/02
代理公司: 杭州天正专利事务所有限公司 33201 代理人: 王兵
地址: 310014 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 适用于 复杂 未知 环境 自适应 sac pid 方法
【说明书】:

一种适用于复杂未知环境的自适应SAC‑PID方法,实现了无模型的PID参数的自适应最优整定。包含如下步骤:首先,获取表征移动机器人当前状态特征的信息;其次,基于深度强化学习SoftActor‑Critic算法,将状态信息输入强化学习网络模型,得到PID控制器的参数,PID控制器输出角速度信息控制移动机器人循迹;最后,根据设计好的奖励函数计算此次动作的奖励,并得到下一个时刻的状态,在与环境的交互中不断优化强化学习网络模型,得到最优的策略网络。该方法克服了传统PID控制自适应调参中对模型和经验的依赖,在仿真和落地的实验中均取得了优异的效果,并且具备良好的泛化性和鲁棒性。

技术领域

发明涉及一种自适应SAC-PID方法。

背景技术

比例-积分-微分控制器(PID)由于其结构简单、鲁棒性强、适应性强,被广泛应用于工业控制和机器人控制中。实际上,传统的PID控制采用经验整定的方法来调整PID参数,从而获得较为合适的PID控制器。但是在面对不断变化的环境时,经验整定的方法变得捉襟见肘。Onat等研究人员在2018年发表了Anew design method for PI-PD control ofunstable processes with dead time,基于稳定边界轨迹,提出了一种获得PI-PD控制器参数稳定域的图形化方法。然而该方法需要大量复杂的计算和精确的建模,因此该方法不适合移植,泛化性较差。除此之外,该方法只能保证系统的稳定性,而在实施时并不能保证得到最优PID参数。

随着人工智能的发展,深度强化学习方法在智能体面对复杂环境决策博弈取得了显著的突破。深度强化学习通过智能体与环境不断交互中,实时地做出决策,并在决策后得到一系列奖励。智能体通过此奖励不断地优化自己的决策过程,目标是使累积奖励的期望最大化,最终得到最优策略。

Carlucho在2020年发表了An adaptive deep reinforcement learningapproach for MIMO PID control of mobile robots,提出了一种基于深度确定性策略梯度(DDPG)的自适应PID用以控制移动机器人的速度。但DDPG存在对于超参数极其敏感,难以稳定等缺点。因此在如何设计一个具有良好的泛化性,鲁棒性的自适应PID是一个值得研究的问题。

发明内容

本发明要克服现有技术的上述不足,提出了一种适用于复杂未知环境的自适应SAC-PID方法。

本发明针对复杂未知环境,设计了一个基于深度强化学习和PID控制的分层控制器,实现了无模型的PID参数的自适应最优整定。

一种适用于复杂未知环境的自适应SAC-PID方法,包括如下步骤:

步骤一、利用机器人仿真平台搭建循线机器人的环境;

其中,机器人仿真环境包括带RGB相机的移动机器人模型和路径模型,并将移动机器人置于路径的起始位置(x0,y0,z0)为路径起点坐标。

步骤二、基于深度强化学习Soft Actor-Critic(SAC)构建深度神经网络模型;

其中,所述深度神经网络模型包括:决策网络π(φ),状态价值函数网络V(ψ)和动作价值函数网络Q(θi),i∈{1,2}。φ,ψ,θi分别为决策网络,状态价值函数网络和动作价值函数网络的参数;

步骤三、定义移动机器人循迹时的状态表征值;

其中,所述移动机器人状态表征值包括:轨迹中心线上均匀取由远及近的五个像素点的横纵坐标值(xi,yi),i∈{1,2,3,4,5};轨迹斜率和移动机器人的实时曲率之差ec;移动机器人的实时线速度vt和角速度ωt

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110525617.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top