[发明专利]一种基于GRU网络的UUV实时避碰规划方法有效
申请号: | 201810052628.4 | 申请日: | 2018-01-17 |
公开(公告)号: | CN108334677B | 公开(公告)日: | 2021-06-11 |
发明(设计)人: | 王宏健;林常见;吕洪莉;李庆;张勋;刘大伟 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06N3/04;G06N3/08;G01C21/20 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 gru 网络 uuv 实时 规划 方法 | ||
1.一种基于GRU网络的UUV实时避碰规划方法,其特征在于,包括以下步骤:
步骤一 构建全局坐标系和局部坐标系,建立声纳仿真模型;
全局坐标系采用北东坐标系,地图左下角为原点,正北方向为X轴,正东方向为Y轴;局部坐标系原点选在UUV重心处,X轴取在UUV纵向剖面内,指向UUV艏端,Y轴与纵剖面垂直,指向UUV右舷;二维多波束声纳仿真模型水平开角为120°,最大探测半径为120m,共80个波束,波束角为1.5°,每个波束上探测噪声为±1%;
步骤二 设计用于实时避碰规划的GRU网络;
所设计的GRU网络为端对端模型,可以直接根据传感器探测信息得出规划结果,该网络模型包含四层,分别为输入层、隐藏层、中间层以及输出层;
步骤三 构建数据集;
数据集包括训练集和测试集,分别用于神经网络的训练阶段和测试阶段;构建训练集时,在全局坐标系中生成若干组随机地图及实时路径,并在每个路径节点采集声纳信息,所采集的信息为训练样本,将实时路径中UUV艏向调整的转艏及速度作为训练标签;构建测试集时,在全局坐标系中生成若干组随机地图及实时路径,并在每个路径节点采集声纳信息,所采集的信息为测试样本,将实时路径中UUV转艏及速度作为测试标签;
步骤四 利用训练集中数据训练GRU网络,得到基于GRU网络的实时避碰规划器;
将训练数据中的声纳信息作为输入数据,将训练集中相对应的标签作为输出数据,对GRU网络进行训练,从而获得基于GRU网络的实时避碰规划器;损失函数为均方差函数;在训练过程中,采用小批量梯度下降误差反向传播算法优化GRU网络的权值;
步骤五 将声纳探测信息及目标点信息输入至基于GRU网络的避碰规划器,获得UUV下一时刻的转艏及速度的调整指令。
2.根据权利要求1所述的一种基于GRU网络的UUV实时避碰规划方法,其特征在于,GRU网络的输入层由81个单元组成,其中前80个单元分别对应仿真声纳的80个波束中包含的距离信息,第81个单元对应UUV当前位置与目标点之间的夹角;隐藏层由45个GRU模块组成,每个GRU模块都包含复位门和更新门结构;序列长度为10,上一时刻的隐藏层的输出反馈到下一时刻的模块中;中间层由23个单元组成;输出层由2个单元组成,分别对应所规划的下一时刻UUV的转艏和速度;输入层与隐藏层、隐藏层与中间层、中间层与输出层间的连接方式为全连接;
GRU记忆模块输出计算方式为:
zt=σ(Whzht-1+Wxzxt+bz)
rt=σ(Whrht-1+Wxrxt+br)
其中,zt、rt和ht分别为t时刻更新门、复位门和记忆模块的输出;xt为t时刻记忆模块的输入向量;ht-1为t-1时刻记忆模块的输出向量;Wxz、Wxr和Wxh分别为模块输入与更新门、复位门和间的权重矩阵;Whz和Whr分别为t-1时刻记忆模块的输出与更新门和复位门间的权重矩阵;bz、br和bh分别为更新门、复位门和的偏置;σ(·)表示逻辑sigmoid函数,其为门单元的激活函数;·表示对应元素相乘。
3.根据权利要求1所述的一种基于GRU网络的UUV实时避碰规划方法,其特征在于,数据集中仿真声纳探测到的距离信息为其中为当前时刻第i个波束探测到的距离信息,当第i个波束未探测到障碍时,
将t时刻声纳探测到的距离信息做如下处理:
将t时刻UUV所在位置与目标点形成的角度表示为则t时刻GRU网络的输入向量
t时刻GRU网络的标签lt=[Δθt,vt],其中Δθt和vt分别表示期望的UUV转艏和速度的调整指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810052628.4/1.html,转载请声明来源钻瓜专利网。