[发明专利]基于强化学习的直升机系统控制方法、系统、装置及介质有效
| 申请号: | 202111249357.X | 申请日: | 2021-10-26 |
| 公开(公告)号: | CN114063453B | 公开(公告)日: | 2023-04-25 |
| 发明(设计)人: | 赵志甲;何伟添;邹涛;李致富;马鸽 | 申请(专利权)人: | 广州大学 |
| 主分类号: | G05B13/04 | 分类号: | G05B13/04 |
| 代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 黎扬鹏 |
| 地址: | 510006 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 强化 学习 直升机 系统 控制 方法 装置 介质 | ||
1.一种基于强化学习的直升机系统控制方法,其特征在于,包括以下步骤:
构建直升机系统的非线性状态空间方程;
构建直升机系统的评价神经网络和执行神经网络,所述评价神经网络用于根据直升机系统的状态计算成本函数作为评价得分,所述执行神经网络用于根据所述评价得分执行相应的操作;
通过强化学习对所述评价神经网络和所述执行神经网络进行权重更新,得到训练好的评价神经网络和执行神经网络;
根据训练好的评价神经网络和执行神经网络以及所述非线性状态空间方程确定直升机系统的控制律,进而根据所述控制律对直升机系统进行控制;
所述构建直升机系统的非线性状态空间方程这一步骤,其具体包括:
根据拉格朗日力学模型建立直升机系统的非线性动力学方程如下:
其中,θ表示俯仰角,ψ表示偏航角,Jp表示俯仰运动的转动惯量,Jy表示偏航运动的转动惯量,Dp表示俯仰运动的摩擦系数,Dy表示偏航运动的摩擦系数,Kpp表示俯仰螺旋桨中作用于俯仰轴上的扭矩推力增益,Kpy表示偏航螺旋桨中作用于俯仰轴上的扭矩推力增益,Kyp表示俯仰螺旋桨中作用于偏航轴上的扭矩推力增益,Kyy表示偏航螺旋桨中作用于偏航轴上的扭矩推力增益,m表示整机质量,Lcm表示质心到固定坐标系原点的距离;
对所述非线性动力学方程进行简化,得到直升机系统的非线性状态空间方程如下:
其中,x1=[θ,ψ]T,f(x1,x2)表示非线性未知函数,g表示重力加速度,u=[Vp,Vy]T,Vp表示控制俯仰运动的电机电压输入,Vy表示控制偏航运动的电机电压输入;
构建直升机系统的评价神经网络这一步骤,其具体包括:
确定长期成本函数如下:
其中,ζ表示未来成本折扣系数且ζ>0,I(t)表示瞬时成本函数;
确定瞬时成本函数如下:
I(t)=(x-xd)TQ(x-xd)+τTRτ
其中,x表示系统的状态量,x=[x1,x2]T,xd表示期望跟踪轨迹,Q和R表示正定权重矩阵,τ表示系统的输入;
构建用于近似长期成本函数的评价神经网络如下:
其中,表示对长期成本函数J(t)的近似,表示评价神经网络的估计权重,Hc(Zc)表示输入为跟踪误差Zc的高斯径向基函数,Zc=x-xd;
确定所述评价神经网络的权重更新率如下:
其中,表示评价神经网络的权重更新率,表示评价神经网络的权重,Ec表示评价神经网络的近似误差平方项,lc表示评价神经网络的学习率;
构建直升机系统的评价神经网络这一步骤,其具体包括:
构建用于近似非线性未知函数的执行神经网络如下:
其中,表示对非线性未知函数f(x1,x2)的近似,表示执行神经网络的估计权重,Ha(Za)表示网络输入向量Za的高斯径向基函数,
确定所述执行神经网络的误差如下:
其中,δa表示近似非线性未知函数的近似误差,KJ表示评价神经网络对执行神经网络的影响程度参数,和Jd(t)分别表示长期成本函数的估计值与理想值;
确定所述执行神经网络的权重更新率如下:
其中,表示执行神经网络的权重更新率,表示执行神经网络的权重,Ea表示执行神经网络的近似误差平方项,la表示执行神经网络的学习率;
所述通过强化学习对所述评价神经网络和所述执行神经网络进行权重更新这一步骤,其具体为:
根据所述评价神经网络的权重更新率和所述执行神经网络的权重更新率,通过强化学习对所述评价神经网络和所述执行神经网络进行权重更新;
所述控制律的函数表示如下:
其中,u(t)表示直升机系统的控制向量,inv(g)表示对函数g(x1)求逆,z1和z2表示跟踪误差,z1=x1-xd,z2=x2-α1,α1表示反步法辅助变量,K2为预设参数,表示α1的导数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州大学,未经广州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111249357.X/1.html,转载请声明来源钻瓜专利网。





