[发明专利]基于长短期记忆网络的飞行器轨迹预测的方法有效
申请号: | 202111170023.3 | 申请日: | 2021-10-08 |
公开(公告)号: | CN114048889B | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 窦立谦;马秀俞;张睿隆;宗群;刘达 | 申请(专利权)人: | 天津大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 刘国威 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 短期 记忆 网络 飞行器 轨迹 预测 方法 | ||
1.一种基于长短期记忆网络的飞行器轨迹预测的方法,其特征是,针对传感器特征向量所带有的噪声干扰,利用卡尔曼滤波进行消除;对于直接获取的状态参数,对其进行数据预处理,包括降采样、无效值剔除、缺失值补足,另外,为了提高计算稳定性,将数据做归一化处理,将输入数据的取值范围纳入[0,1]区间;构建基于LSTM的轨迹预测网络模型,定义网络模型的输入输出,并对网络模型进行监督训练;详细步骤如下:
首先,是从敌我飞行器对抗仿真平台获取所需的特征数据,考虑到飞行器的轨迹受自身、战场环境、敌方动机多种因素影响,归纳得到飞行器轨迹具有连续性、时序性、交互性三个特点:
①连续性是指无人机轨迹是连续变化的,而不是间断的;
②时序性是指轨迹数据是带有时间性质的,且后一个时刻的位置与前一个时刻的位置是有关的,所以轨迹数据本质上是一个时间序列数据;
③交互性是指实际环境下,多机之间是动态变化的复杂过程,一架飞机的机动会影响另一架飞机的机动,一架飞机的位置也会影响另一架飞机的位置;
因此在进行轨迹预测时,除了考虑敌机的位置、姿态、速度外,由于交互性,还要考虑两机的包括23维特征向量:
经度、纬度、高度、俯仰角、滚转角、航向角、方位角、方位角速度、俯仰角速度、北向速度、天向速度、东向速度、北向加速度、天向加速度、东向加速度、水平进入角、相对距离、相对距离变化率、相对高度、雷达状态识别结果、径向速度、真航向、地速;
其次,在获得了特征向量后,由于从传感器获取的原始数据不能直接用作网络输入,需要对其进行预处理,按照1:5的采样间隔对数据进行数据降采样,对数据中的无效值剔除,利用均值填充法对缺失值进行补足,除此之外,由于部分所用参数数值较大,为了提高计算稳定性,将数据做归一化处理,输入数据的取值范围纳入[0,1]区间,归一化公式为:
式中,X为某特征量的实际取值,Xmax,Xmin分别为所有数据中X的最大值和最小值,Y是归一化后的结果;
使用训练好的预测模型对预测结果进行反归一化,从而与实际值进行误差比较分析,反归一化的公式为:
X=(Xmax-Xmin)Y+Xmin (2)
在完成了数据处理之后,就得到了规范化的,可供神经网络使用的样本数据集,此时需要按照实际需求构造LSTM网络的输入输出,在选定标签数据时,将下一时刻的经度、纬度、高度作为当前时刻的特征标签,采用滑动窗口法完成数据集的切分,网络的输入由原始数据迭代选取获得,从0开始到第一个time_step为止,由于本次训练选取的time_step是20,即从0到19是第一个输入,1到20是第二个输入,以此类推;输入数据的维度是(N,20,23),其中N取决于样本集的大小,20是指LSTM的time_step值,23是特征向量的维度,训练网络需要用到标签数据,由于本模型目的是预测飞机未来一步的轨迹,因此,在针对第一个0-19的输入,选择1-20的载机经纬高作为标签,对于第二个1-20的输入,选择2-21的载机经纬高作为标签,以此类推,因此输出数据的维度是(N,20,3),其中N取决于样本集的大小,20是指LSTM的time_step值,3对应输出的维度,即载机经度、纬度、高度;
最后是构造LSTM网络,使用LSTM作为模型的主体部分,通过构造多层网络结构,学习输入的轨迹相关特征量和下一时刻位置的标签的关系,预测未来可能到达的位置,预测模型主要包括LSTM层、Dropout层、全连接层,选定两层LSTM进行模型搭建:第一层的LSTM网络以二十三维特征量作为输入,第二层以第一层的输出作为输入,第二层输出经过一个全连接层之后,得到最终的网络输出Y,在每一层LSTM网络中添加了Dropout层,利用其控制隐含层节点权重,避免某些轨迹特征只在固定组合下生效,有意识地让网络去学习轨迹普遍的共性,对LSTM输出的特征量经过一个全连接层后,将维度转化为所需的输出纬度;
在确定了网络结构及输入输出之外,用训练样本集对网络进行训练,选定如式(3)所示的均方误差函数作为损失函数:
其中N表示一次训练过程中批量样本的个数,Ypred表示神经网络输出的预测值,Yi代表对应的真实值,神经网络训练就是更新权值的过程,网络的优化目标是让E趋近于0,在进行网络训练时,选用自适应矩估计法(adaptive moment estimation,Adam),适应矩估计法步骤如下:
首先考虑到传统反向传播算法中,权重的更新方向只依赖当前样本得到的梯度,因此借鉴物理中动量(moment)概念,即更新权重时在一定程度上保留之前更新的方向,同时加上当前样本的梯度,得到最终的更新方向,即
式中,s称为动量,也是梯度的一阶矩估计,β1称为一阶动量衰减系数;
式中,v称为速度量,也是梯度的二阶矩估计,β2称为二阶动量衰减系数,一般取β2=0.999;
进一步为实现学习率的自适应调整,即对于更新较慢的权重采用较大的ε更新,对于更新较快的权重采用较小的ε更新,因此对学习率ε进行调整:
δ为防止分母为零的常数,一般取δ=10-8;
在此基础之上,对梯度的一阶和二阶矩估计进行无偏修正:
最后,得到基于Adam算法的权重更新公式:
按照以上的步骤,就完成了LSTM网络的训练,将训练好的模型保存在本地,样本均值、方差参数以txt文件的格式保存,在对待测新样本进行实验时,直接调用这些本地文件;
在进行模型训练及测试时,网络结构参数取值如下表所示:
LSTM网络参数表
对于训练完成的预测模型,输入新的待测数据,对模型预测准确率进行验证;
选取样本数据集时,在仿真对抗环境下,每完成一次仿真对抗,就能得到一组实验数据,即一条轨迹曲线,考虑单个曲线特征点太少,不利于神经网络的学习,因此进行多次实验,将轨迹进行拼接,最终得到包含10600个点的时间序列数据,每一个点都包含二十三维特征量,经过降维之后,得到了维度为(21200,23)的样本集,按照0.75:0.25的比例划分训练集和测试集,得到测试集样本维度为(5300,23);
为了防止模型在设定的epoch范围内出现过拟合的情况,除了在设计模型时加入Dropout层之外,还对样本数据做处理,针对训练数据,选择其中一部分作为验证数据(valid data),验证集数据占训练集数据的比例定义为valid_data_rate=0.15,设定一个耐心值patience=5,如果验证集迭代次数超过了5次而训练精度和损失没有改善的话,训练提前中止,这称为“训练早停”(Early Stopping),通过加入验证集,可以避免出现过拟合的情况,完善模型选择。
2.如权利要求1所述的基于长短期记忆网络的飞行器轨迹预测的方法,其特征是,具体步骤如下:
第一步是从机载传感器获取原始的状态信息,共选择二十三维的特征量,作为预测模型的输入;
第二步是对数据进行预处理:首先,原始传感器参数包含一定的噪声干扰,选用卡尔曼滤波法,对其进行消除;其次,为了提高数据利用率,降低计算成本,对原始数据按照1:5进行降采样,并将数据做归一化处理;最后,将无效值剔除,将缺失值补足,完成数据的预处理工作;之后进行输入和标签值的选取:采用滑动窗口法完成数据集的切分,网络的输入由原始数据迭代选取获得,从0开始到第一个time_step为止,由于本次训练选取的time_step是20,即从0到19是第一个输入,1到20是第二个输入,以此类推;输入数据的维度是(N,20,23),其中N取决于样本集的大小,20是指LSTM的time_step值,23是特征向量的维度,训练网络需要用到标签数据,由于本模型目的是预测飞机未来一步的轨迹,因此,在针对第一个0-19的输入,选择1-20的载机经纬高作为标签,对于第二个1-20的输入,选择2-21的载机经纬高作为标签,以此类推;
第三步是构建基于LSTM的轨迹预测模型,所构建的模型,包含两层的LSTM层,每层LSTM层之后加入了一层Dropout层,避免过拟合现象的出现,将输出的特征量经过一个全连接层后,将维度转化为所需的输出维度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111170023.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:雷达视频显示方法、装置、设备及存储介质
- 下一篇:一种节能环保型智能蓝牙音箱
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理