[发明专利]基于自适应神经网络的机器人模型预测控制方法有效
| 申请号: | 202010698815.7 | 申请日: | 2020-07-20 |
| 公开(公告)号: | CN111618864B | 公开(公告)日: | 2021-04-23 |
| 发明(设计)人: | 康二龙;高洁;乔红 | 申请(专利权)人: | 中国科学院自动化研究所 |
| 主分类号: | B25J9/16 | 分类号: | B25J9/16 |
| 代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩;尹文会 |
| 地址: | 100190 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 自适应 神经网络 机器人 模型 预测 控制 方法 | ||
1.一种基于自适应神经网络的机器人模型预测控制方法,其特征在于,该方法包括:
步骤S10,获取机械臂tk时刻的实际位置、实际速度以及期望位置、期望速度,计算跟踪误差;并初始化i为0、nR为1;其中,i、nR为自然数;
步骤S20,对预构建的动作-评价网络中的动作网络,基于tk+i时刻的跟踪误差,结合其tk+i-1时刻的权重值,通过其获取tk+i-tk+i+1时刻的控制率,作为预测控制率,并更新动作-评价网络的权重值;
步骤S30,判断i是否大于设定的预测时长,若是,则执行步骤S40,否则基于所述预测控制率,结合tk+i时刻的跟踪误差,通过预构建的预测模型获取tk+i+1时刻的跟踪误差,并令i=i+1,跳转步骤S20;
步骤S40,判断动作网络、评价网络权重变化的和是否小于等于设定阈值或者nR是否 大于设定的最大迭代次数,若是,则执行步骤S50,否则令nR=nR+1,i=0,跳转步骤S20;所述权重变化为更新后的权重值与更新前的权重值的差;
步骤S50,基于更新的权重值,结合tk时刻的位置误差,通过所述动作网络计算机械臂tk-tk+1时刻的实际控制率,作用于机械臂;
步骤S60,令k=k+1,循环执行步骤S10-步骤S50,直至机械臂到达设定的目标位置;
所述预测模型、所述动作-评价网络基于径向基神经网络构建。
2.根据权利要求1所述的基于自适应神经网络的机器人模型预测控制方法,其特征在于,所述预测模型为基于机械臂的跟踪误差的动态特性构建的模型,该模型其获取跟踪误差的方法为:
其中,表示tk时刻的一阶跟踪误差、二阶跟踪误差,表示tk+1时刻的一阶跟踪误差动态、二阶跟踪误差动态,表示预测模型的激活函数,qd表示期望轨迹,L表示正整数,表示预测模型的权重值,表示tk时刻的跟踪误差的估计偏差,τ表示预测控制率,z+表示增广误差,表示tk时刻的左侧逼近,K1表示预设的虚拟变量参数。
3.根据权利要求2所述的基于自适应神经网络的机器人模型预测控制方法,其特征在于,所述动作网络其获取控制率的方法为:
其中,表示当前时刻的控制率,t表示时间段,表示哈密尔顿函数,表示跟踪误差,表示哈密尔顿函数中控制率的参数项,表示动作网络的权重值,表示动作网络的激活函数,λ表示输入约束上限值,R表示损失函数参数,表示预测模型参数,(·)T表示转置。
4.根据权利要求3所述的基于自适应神经网络的机器人模型预测控制方法,其特征在于,所述动作网络其权重值更新方法为:
其中,表示动作网络的更新变化率,αa>0表示动作网络预设的学习率,Ξ2(·)定义为一种运算,分别对每个(·)中的元素求平方,sech表示双曲正割函数,ka、kp表示动作网络预设的学习参数,表示评价网络的权重值。
5.根据权利要求4所述的基于自适应神经网络的机器人模型预测控制方法,其特征在于,所述评价网络其计算最优损失的方法为:
其中,表示评价网络的权重值,表示评价网络获取的最优损失值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010698815.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种低电压发热油墨及其制备方法
- 下一篇:一种钢珠铸造模具





