[发明专利]基于策略迭代的电机系统最优调节控制方法有效

专利信息
申请号: 202010359025.6 申请日: 2020-04-29
公开(公告)号: CN111740658B 公开(公告)日: 2022-09-06
发明(设计)人: 姚建勇;梁相龙;姚志凯 申请(专利权)人: 南京理工大学
主分类号: H02P7/00 分类号: H02P7/00
代理公司: 南京理工大学专利中心 32203 代理人: 陈鹏
地址: 210094 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 策略 电机 系统 最优 调节 控制 方法
【权利要求书】:

1.一种基于策略迭代的电机系统最优调节控制方法,其特征在于,包括以下步骤:

步骤1,建立直驱电机系统的数学模型;具体如下:

步骤1-1,将电流环近似为比例环节,根据第二牛顿定律,直驱电机系统的运动方程为:

式(1)中,m为惯性负载参数,ki为力矩放大系数,B为库伦摩擦系数,y为惯性负载的位移,为惯性负载的速度,为惯性负载的加速度,u为控制系统的输入,t为时间变量;

步骤1-2,定义状态变量:则式(1)的运动方程转化为状态方程:

式(2)中,ki/m,B/m均为名义值且已知;x1表示惯性负载的位移,x2表示惯性负载的速度;

则状态方程(2)写成下面形式:

式(3)中,B=[0 ki/m]T,且(A,B)是稳定的;

步骤2,设计基于策略迭代的最优调节控制算法,并使用牛顿方法证明其收敛性;步骤如下:

步骤2-1,状态方程(3)满足最优控制问题:

u*(t)=arg minu(t)V(x(t),t,u(t)) (4)

其中u*(t)是系统的最优控制输入,最小化的二次代价函数V(x(t),t,u(t))表示为:

式(5)中,Q∈R2×2≥0,R0,且(Q1/2,A)是可测的;

取u(t)=-Kx(t),根据Bellman最优原理,K=R-1BTP,其中P是Riccati方程(6)的解,且P是正定的;

ATP+PA+Q-PBR-1BTP=0 (6)

步骤2-2,K为稳定的增益,又A,B均为稳定的,则是一个稳定的闭环系统;将u(t)=-Kx(t)代入(5)式,得:

式(7)中P∈R2×2是Lyapunov矩阵方程(8)的解,且P是实对称正定矩阵;

(A-BK)TP+P(A-BK)=-(Q+KTRK) (8)

式(7)进一步写成:

上式中,T1为时间区间;

记x(t)为xt,选取一个初始的稳定增益K1,由(7)和(8)得如下的策略迭代:

Ki+1=R-1BTPi (11)

实施式(10)和(11)的策略迭代不需要知道矩阵A;

步骤2-3,证明策略迭代算法的收敛性;

引理1:假设Ai=A-BKi是稳定的,则式(10)的解Pi与基本的Lyapunov方程(12)的解相同;

AiTPi+PiAi=-(Q+KiTRKi) (12)

证明:取Vi(xt)=xtTPixt作为系统的Lyapunov函数;因为Ai是一个稳定的矩阵,且Q+KiTRKi0,所以Lyapunov方程(13)存在唯一的解Pi0;

所以,Pi满足式(14);

引理2:假设控制策略Ki是稳定的,则用式(11)更新的新的控制策略Ki+1也是稳定的;

证明:取Vi(xt)=xtTPixt作为系统的Lyapunov函数,求解控制策略Ki+1产生的状态轨迹;对Vi(xt)求导,得:

将式(11)代入式(14)第二项,化简得:

xTt[KTi+1R(Ki-Ki+1)+(Ki-Ki+1)TRKi+1]xt

=xTt[-(Ki-Ki+1)TR(Ki-Ki+1)-Ki+1TRKi+1+KiTRKi]xt (15)

结合式(12)及(15):

因为Q≥0,R0,所以即式(11)更新的新的控制策略是稳定的;

定义矩阵值函数:

Ric(Pi)=ATPi+PiA+Q-PiBR-1BTPi (17)

记为Ric(Pi)关于Pi的Fréchet导数;给定矩阵M,则:

引理3:式(10)和(11)的迭代等价于牛顿方法:

证明:结合式(12)、式(13)被写成:

AiTPi+PiAi=-(Q+Pi-1BR-1BTPi-1) (20)

两边同时减去Ai-1TPi+PiAi-1

AiT(Pi-Pi-1)+(Pi-Pi-1)Ai=-(AiTPi-1+Pi-1Ai+Q-Pi-1BR-1BTPi-1)

利用Ric(Pi),有即式(19);

定理4:算法的收敛性;假设(A,B)是稳定的、(Q1/2,A)是可测的以及Q≥0,R0,给定一个初始的稳定控制输入,即稳定增益K1,式(10)、(11)将收敛到具有代价(5)的最优控制问题(4)的解,其中P满足Riccati方程(6);

证明:Kleinman已经证明在给定一个初始的稳定控制策略后,由引理3的牛顿方法得,式(10)、(11)的迭代将收敛到Riccati方程的解;此外,如果初始控制策略是稳定的,那么由引理2知随后的所有控制策略将是稳定的;式(10)、(11)和式(11)、(12)之间的等价证明,表明在不需要知道系统矩阵A的情况下,在线策略迭代算法将收敛于具有代价(5)的最优控制问题(4)的解;

步骤3,利用最小二乘法,实现最优调节控制算法的在线实施。

2.根据权利要求1所述的基于策略迭代的电机系统最优调节控制方法,其特征在于,步骤3所述利用最小二乘法,实现最优调节控制算法的在线实施,步骤如下:

实现(10)和(11)给出的迭代方案,仅需要知道策略更新中B矩阵即可,而关于系统矩阵的信息被嵌入到在线观察到的状态x(t)和x(t+T1)中,因此在策略迭代方案的两个步骤中都不需要系统矩阵A;下面给出算法的在线实施;

为了找出(10)中与控制策略Ki相关的代价函数的参数,即矩阵Pi,将xTtPixt写成:

式中

利用式(21),式(10)写成:

式(22)中,是未知参数的列向量,是一个回归向量;将式右边的项记为即它由时间区间[t,t+T1]的系统状态测量得到;

利用最小二乘法,在相同的时间区间T1内,在状态空间中取N≥3个点点的个数与矩阵Pi独立元素的个数相同;进而求得最小二乘解:

其中:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010359025.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top