[发明专利]单关节机器人的变长度反馈辅助PD型迭代学习控制方法在审

专利信息
申请号: 202210493291.7 申请日: 2022-05-07
公开(公告)号: CN114740735A 公开(公告)日: 2022-07-12
发明(设计)人: 陶洪峰;官上雷;庄志和;郑月昌 申请(专利权)人: 江南大学
主分类号: G05B13/04 分类号: G05B13/04
代理公司: 无锡华源专利商标事务所(普通合伙) 32228 代理人: 过顾佳
地址: 214122 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 关节 机器人 长度 反馈 辅助 pd 型迭代 学习 控制 方法
【权利要求书】:

1.一种单关节机器人的变长度反馈辅助PD型迭代学习控制方法,该方法包括:

第一步、对单关节机器人系统的输入输出进行分析建模:

将所述单关节机器人系统的典型结构看作由单杆连接两端构成,两端分别为轴心端和自由端;所述轴心端作为轨迹参考点,由电机及与之匹配的减速器构成,共同组成了单关节机器人中的关节;以所述轴心端作为圆心与参考点,单杆在其360度内进行旋转运动,通过确定所述单杆与水平面或其他参考平面的角度,掌握单杆的长度,进而定位单杆另一端在空间中的具体位置;所述单杆的另一端称为自由端,所述单关节机器人的控制目标为对所述自由端的轨迹进行精确的控制;

在所述单关节机器人系统中,将所述单杆与水平面的夹角作为系统的运行状态,由绝对值角度编码器进行测量;系统的输入信号为作用在单杆轴心端的转矩,由外部控制信号驱动轴心端电机产生,带动单杆旋转;忽略电机与齿轮的重量,以及忽略单臂本身的惯性,以所述轴心端为原点,绝对坐标系的平移作为对应的坐标轴,则单杆以原点为圆心绕Z轴旋转,基于此设定,所述单关节机器人系统的动态模型表示为:

其中:t表示时间;Jm=1.33Ml2,为转动惯量;θ(t)为单关节机器人单杆的旋转角度;M为所述单杆的整体质量,g为重力加速度,l为质心距离所述轴心端的转动距离;τ(t)为作用在所述轴心端上的力矩;

由此便构建出了所述单关节机器人系统的单臂旋转角度与轴心端力矩的动态关系,通过调节转动力矩来控制所述自由端的旋转角度,从而进一步控制其运行轨迹,实现所述单关节机器人的具体应用;

第二步、构建所述单关节机器人系统的离散状态空间方程:

为了对单关节机器人系统应用迭代学习控制并进行收敛性分析,将第一步中构建的单关节机器人力矩-旋转角度的动态模型改写成非线性离散状态空间方程;令系统的采样周期为0.1,且θ(t)=x(1)(t),θ(t+1)=x(2)(t),u(t)=τ(t),则系统将进一步被描述为:

考虑到系统的重复运行,式(2)进一步用非线性函数f(xk(t),t)表示;其中的和代表系统第k次迭代的状态信息;建立所述单关节机器人系统的非线性离散状态空间方程:

其中,f(xk(t),t)是属于的非线性函数;分别代表着系统第k次迭代的状态、输入和输出,为时间变量;k=0,1,2,...表示系统的迭代次数;Bt,Ct是有着适当维度的系统矩阵,并且Ct+1Bt是满秩的;系统存在唯一的理想控制输入即在该信号的作用下,使得:

其中,xd(t)与yd(t)分别为期望状态与期望输出,At是有着适当维度的系统矩阵;

对于该系统,存在以下两条假设:一为该重复过程各批次的初始状态均等于期望的初始状态,即xk(0)=xd(0);二是系统满足全局Lipschitz条件,即存在一个实数kf≥0,对于所有的t∈[0,Nd],都满足:

第三步、针对变批次长度问题设计更新误差与输入序列:

由于所述系统在实际运行中,批次长度并不统一,令第k次迭代的实际运行长度为Nk,合理地认为所述Nk存在一个最小值NL与一个最大值NH,认为Nd=NH,其中,Nd为所述系统的期望运行长度;由此一来,得到Nk∈[NL,Nd],即t=0,1,2,...,NL,...,Nk,...,Nd

依据迭代学习控制的特性和如上的设定,利用过去批次的历史信息对控制信号uk(t)进行更新修正,使得能够实现控制目标(4);

引入一个指示函数当且仅当系统在第k次迭代的运行到达了t时刻时,该函数等于1,反之为0,即在不固定的批次长度的影响下,对于批次长度为Nk的第k次迭代来说,时刻Nk+1,...,Nd的输出是无法获取到的,这个时间段内的误差无法被计算;鉴于这种情况,将这部分的误差设置为0,从而第k次迭代的误差表示为:

其中,ek(t)=yd(t)-yk(t)为系统期望轨迹与实际输出轨迹的误差;利用所述指示函数将上式简单的表示为

对于即将到来的迭代,其运行长度无法预知,故计算出全部的uk(t),t∈[0,Nd-1]是必要的;为此,对于所有的构建出如下的更新误差序列:

式中的Ek(t)是递推生成,并且在每个时刻运行结束后,利用当前迭代的运行信息进行更新;

当所述系统的迭代长度分布不均时,Ek(t)的组成包含多个批次的误差信号,利用更新误差序列Ek(t),通过足够长的误差信号来计算下一次迭代的输入;对于每一个即将到来的迭代,都有足够长的误差信号被用来更新全部的uk+1(t),t∈[0,Nd-1],无论其是否真的被投入了运行,为此,需引入与所述Ek(t)构造思想相同的更新输入序列:

式中指示函数为的原因为t时刻的输入要在t+1时刻才能获得误差,这样递推生成的更新输入序列便储存了每一个时间点最近一次更新且拥有输出结果的输入信号;

第四步、设计针对变批次长度问题的反馈辅助PD型迭代学习控制算法:

利用第三步构建的更新误差序列和更新输入序列,所述系统在每次运行后存储最新的输入信号并获取其对应的输出信号,为变批次长度的系统的控制提供了一种新的框架;为了提高系统的跟踪性能,加快误差的收敛速度,利用所述更新误差序列和更新输入序列,结合当前批次运行的误差,构建了如下的反馈辅助PD型迭代学习控制算法:

uk+1(t)=Uk(t)+LtEk(t+1)+ΓtEk(t)+KtEk+1(t),t∈[0,Nd], (9)

其中的Lt,Γt和Kt为系统的学习增益;将学习律应用到离散非线性时变系统(3),得到下述定理:对于所述离散非线性时变系统(3),应用迭代学习控制更新算法(9),如果选择适宜的学习增益使得:

0||I-Ct+1BtLt||1,

那么当迭代次数k趋近无穷时,在时间间隔t∈[0,Nd]上实现式(2)所述的跟踪目标,即其中,I是维度合适的单位矩阵;

第五步、分析变批次长度下反馈辅助PD型迭代学习控制算法的收敛性:

在分析第四步所提出的反馈辅助PD型迭代学习控制算法的收敛性之前,需要将系统迭代的运行长度分为两部分;第一部分是系统每一次迭代都能到达的最小长度范围内;第二部分是系统批次长度变化的部分,由于变批次长度的影响,每一个迭代批次的实际运行长度都可能为这其中的任意一个值;为此给出假设三:对于一个任意的迭代批次k和时刻t∈{0,1,...,Nk},在过去的σ个批次里,存在至少一个批次的批次长度大于等于t;

控制算法收敛性证明的第一部分如下:

证明定理在t∈[0,NL]时成立;因为对于所有的迭代,NL时刻都会到达,即那么该时间间隔上的误差都能获得且每一迭代都会更新,得出此外,根据式(1),当t∈ψ,ψ=[0,NL-1]时,利用假设二得到:

式中为时变系统参数Bt在时间ψ内的最大值,并且根据假设一得到xk+1(0)-xk(0)=0,由此,根据的定义得到:

对上式两边取范数,得到:

令为时变系统参数Ct+1在时间ψ内的最大值,进一步得到:

其中的参数α≥kf,为了简洁起见,令和因此由上式进一步得出:

为构建λ-范数,定义常数λ0,对上式两端同乘α-λ(t+1)并取最小上确界,有:

其中,ρ=supt∈ψ||I-Ct+1BtLt||;根据λ-范数的定义,得到:

其中,结合(15)和(16)得到:

||ek+1(t+1)||λ≤ρ0||ek(t+1)||λ (17)

式中当0||I-Ct+1BtLt||1时,0ρ1,因此当λ足够大时,使得ρ01且1-k3ρ10;因此进一步得出同时,由于故得出

控制算法收敛性证明的第二部分如下:

通过归纳分析法,做出归纳假设:对于任意的T∈[NL,Nd-1],由此需证明t=T+1时,

定义一个子序列其包含了所有运行时间Nk≥T+1的批次序号;将其中的元素按出现顺序重新排列,得到并且由所述假设三可知,ki与ki+1的距离小于等于σ,即ki+1-ki≤σ;利用该子序列,当t=T+1时,得到:

并且:

利用上式得到:

对于所有的这些批次运行结束后,Uk(T)和Ek(T+1)并没有进行更新,即:

根据ILC更新律,同时定义得到:

接下来,将式(22)带入式(20),同时定义进一步得到:

对于通过递归得到:

其中由所述更新输入序列的生成规则可知,当时,才会被更新;考虑到这点,定义一系列子集中的元素按出现顺序排列为对于时刻t∈[0,T]的输入信号来说,其只会在内的批次结束后进行更新,从而得出对于所有的t∈[0,T],与ki为同一批次,与ki+1为同一批次;由此当t∈[0,T-1]时得到:

同时,由与的定义,进一步得到ki→∞时,且ki→∞随着k→∞;根据所述归纳假设,有并且,由所述假设三可知,在ki+1与ki批次之间最多拥有σ-1个迭代批次,即对于每一个时刻t∈[0,T],中的元素是有限的,由此确保作为结果得到

在等式(23)的两端同时取范数,得到如下不等式:

其中,

结合以上的推导得到由此对不等式(26)应用引理:对于一个迭代系统其中和分别为状态和有界内部输入,为系统矩阵;当时,得到当且仅当0||D||1;

由此得出当且仅当0||I-CT+1BTLT||1时,即从而基于归纳分析法,进一步总结出

结合所述第一部分和第二部分,在当前选取的学习增益矩阵满足0||I-CT+1BTLT||1时,是成立的,即实现了跟踪目标,由此完成了变批次长度下反馈辅助PD型迭代学习控制算法的收敛性证明;

第六步、实现变批次长度下单关节机器人系统的轨迹跟踪:

根据所设计的所述反馈辅助PD型迭代学习控制算法计算系统每一次迭代过程中每一时间点所需要的输入信号,将该信号作用到所述单关节机器人系统进行系统控制以获取响应输出,使得系统的自由端运动轨迹能够追踪系统预先设定的期望输出轨迹,实现精确的轨迹跟踪控制。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210493291.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top