[发明专利]一种基于联合优化的无人机航迹规划方法有效
| 申请号: | 202110632549.2 | 申请日: | 2021-06-07 |
| 公开(公告)号: | CN113268074B | 公开(公告)日: | 2022-05-13 |
| 发明(设计)人: | 高敬鹏;胡欣瑜;叶方;江志烨;毛新蕊;高路;郑沛;何重航 | 申请(专利权)人: | 哈尔滨工程大学 |
| 主分类号: | G05D1/08 | 分类号: | G05D1/08;G05D1/10 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 联合 优化 无人机 航迹 规划 方法 | ||
1.一种基于联合优化的无人机航迹规划方法,其特征在于,包括以下步骤:
步骤1:搭建飞行状态优化模型;所述的飞行状态优化模型的输入为无人机携带的I个传感器在t时刻对无人机飞行状态的量测向量mi(t),飞行状态优化模型的输出为无人机t时刻飞行状态的最优估计ζ(t|t)=[p(t),v(t)]T;
步骤1.1:输入无人机携带的I个传感器在t时刻对无人机飞行状态的量测向量mi(t);
其中,I个传感器的采样间隔均为Ω;mi(t)=[pi(t),vi(t)]T;i={1,2,...,I};pi(t)表示第i个传感器获取的无人机位置量测向量,pi(t)=[pix(t),piy(t),piz(t)]T,pix(t)、piy(t)和piz(t)分别表示第i个传感器获取的笛卡尔坐标系下无人机在三维空间中x、y和z三个方向的位置坐标量测值;vi(t)表示第i个传感器获取的无人机速度量测向量,vi(t)=[vix(t),viy(t),viz(t)]T,vix(t)、viy(t)和viz(t)分别表示第i个传感器获取的笛卡尔坐标系无人机在三维空间中x、y和z三个方向的速度分量量测值;
步骤1.2:根据t-1时刻无人机飞行状态的最优估计ζ(t-1|t-1),计算t时刻无人机飞行状态的预测ζ(t|t-1);
其中,ζ(t-1|t-1)=[p(t-1),v(t-1)]T;为白噪声;
步骤1.3:计算t时刻各传感器对无人机飞行状态的量测预测δi(t|t-1);
δi(t|t-1)=Hi(t)ζ(t|t-1)
其中,Hi(t)表示第i个传感器的线性测量矩阵;||·||表示求模运算;
步骤1.4:计算t时刻各传感器的量测新息εi(t);
εi(t)=mi(t)-δi(t|t-1)
步骤1.5:根据t-1时刻无人机飞行状态的协方差P(t-1|t-1),计算t时刻无人机飞行状态的协方差预测P(t|t-1);
P(t|t-1)=FP(t-1|t-1)FT+O
其中,
步骤1.6:计算t时刻各传感器的预测新息协方差Ii(t);
其中,
步骤1.7:计算t时刻各传感器量测向量的关联概率βi(t);
步骤1.8:计算t时刻I个传感器的综合量测新息ε(t);
步骤1.9:计算t时刻无人机飞行状态的协方差P(k|k);
步骤1.10:计算无人机t时刻飞行状态的最优估计ζ(t|t);
ζ(t|t)=ζ(t|t-1)K(t)ε(t)
步骤2:构建并训练基于TD3的无人机航迹规划模型;
设置基于TD3的无人机航迹规划模型的强化学习状态空间为st=[pt,vt]T;pt=[px,t,py,t,pz,t]T表示t时刻无人机位置信息;px,t、py,t和pz,t分别代表笛卡尔坐标系下,无人机在三维空间中x、y和z三个方向的位置坐标点;vt=[vx,t,vy,t,vz,t]T为t时刻无人机速度信息,vx,t、vy,t和vz,t分别代表笛卡尔坐标系下,无人机在三维空间中x、y和z三个方向的速度分量;
设置基于TD3的无人机航迹规划模型的状态空间输入为ζ(t|t),设置基于TD3的无人机航迹规划模型的动作空间的输出为表示无人机t时刻飞行的方位角,θ(t)表示无人机t时刻飞行的俯仰角;设置强化学习奖励函数r(t)为:
r(t)=r1(t)+r2(t)
其中,r1表示到达正奖励;r2表示航程负奖励;parrive表示终点的位置坐标;pstart表示起点的位置坐标;dmax表示无人机最大探测范围;ρmax表示无人机携带的燃料可供给的最大可飞行航程;
搭建基于TD3的无人机航迹规划模型,其中Actor网络和Critic网络均为3层全连接网络结构,Actor网络的输入层为2个神经元,输出层为6个神经元,Critic网络的输入层为8个神经元,输出层为1个神经元,设置训练参数,进行网络训练,得到基于TD3的无人机航迹规划模型;
步骤3:构建并训练基于随机森林回归的飞行动作优化模型;
利用步骤2中训练好的基于TD3的无人机航迹规划模型,根据每一时刻基于TD3的无人机航迹规划模型输出的动作获取无人机执行动作a(t)后在t+1时刻到达的位置,将无人机t+1时刻的位置与t时刻的位置连接成标定线,标定线与无人机执行动作a(t)所得航迹构成夹角在直角坐标系中分解,得到构造训练数据集Angle_data={Angle_datat},训练好的基于随机森林回归的飞行动作优化模型根据输入的动作a(t)输出动作偏置
步骤4:联合飞行状态优化模型、基于TD3的无人机航迹规划模型和基于随机森林回归的飞行动作优化模型,对无人机航迹进行实时规划;
步骤4.1:获取无人机携带的I个传感器在t时刻对无人机飞行状态的量测向量mi(t),输入至飞行状态优化模型中,得到无人机t时刻飞行状态的最优估计ζ(t|t)=[p(t),v(t)]T;
步骤4.2:将无人机t时刻飞行状态的最优估计ζ(t|t)输入至训练好的基于TD3的无人机航迹规划模型中,得到动作
步骤4.3:将动作a(t)输入至训练好的基于随机森林回归的飞行动作优化模型中,得到动作偏置
步骤4.4:计算若则直接输出动作a(t)来控制无人机飞行;否则,执行步骤4.5;
步骤4.5:优化飞行动作,将原飞行动作a(t)和飞行动作偏置处理,得到新的飞行动作anew(t)来控制无人机飞行:
步骤4.6:在无人机的飞行过程中,实时执行步骤4.1至步骤4.5,实现每一时刻的前端飞行状态优化和后端飞行动作优化,并实时控制优化后的飞行动作输出,形成最终航迹。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110632549.2/1.html,转载请声明来源钻瓜专利网。





