[发明专利]一种基于双反向传播神经网络的无人系统智能局部路径规划方法有效
申请号: | 201910800165.X | 申请日: | 2019-08-28 |
公开(公告)号: | CN110488835B | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 余翔;魏嫣然;乔建忠;郭雷;韩旭东 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G05D1/02 | 分类号: | G05D1/02;G01C21/34 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 安丽;杨学明 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 反向 传播 神经网络 无人 系统 智能 局部 路径 规划 方法 | ||
1.一种基于双反向传播神经网络的无人系统智能局部路径规划方法,其特征在于,包括以下步骤:
第一步,根据无人系统起止点位置、静态障碍物位置及动态障碍物位置和运行轨迹,建立智能无人系统运行的环境模型;
第二步,基于无人系统本身的物理学模型和运动学约束,建立无人系统运动学模型;
第三步,设计由两个反向传播神经网络组成拓扑结构的双反向传播神经网络,利用建立的智能无人系统运行环境模型和运动学模型信息训练双反向传播神经网络,进行局部路径规划主动避障,第一个反向传播神经网络经过离线训练,在动态避障中起到主导作用,第二个反向传播神经网络在线训练以获得输出的补偿,最终实现对动态障碍物的主动避障;
所述第一步中,建立智能无人系统运行的环境模型如下:
(1)确定无人系统在全局坐标系中的起点和目标点,确定动态的障碍物的位置及速度,确定静态障碍物,将无人系统看作一个质点,并相应膨胀障碍物的尺寸以便对环境进行建模;
(2)给出规划路径数学描述如下:
其中,为无人系统在全局坐标系中规划路径的各个中间点位置坐标,起点为ph0,目标点为phn,以原点、XI、YI轴建系,li为全局坐标系中一组平行于XI坐标轴的等距d的分割线,与规划路径相交于各个中间点phi;
(3)给出路径规划的目标如下:路径规划目标在于满足路径跟踪过程中不发生碰撞的情况下,通过路径规划使无人系统的路径长度值L(Path)和局部路径规划的决策次数n尽可能的小,其中:
路径长度L(Path)为:
所述第二步中,基于无人系统本身的物理学模型和运动学约束,建立无人系统运行的运动学模型如下:
R(θ)是一个正交旋转矩阵:
其中,与分别为无人系统在全局固定坐标系和无人系统坐标系中的速度向量,r表示无人系统驱动轮半径,l表示无人系统的半轮距,表示第S个驱动轮的旋转角度,θ表示无人系统坐标系相对于全局固定坐标系的转动角度,表示第S个驱动轮的输出角速度,表示驱动轮最大输出角速度,且满足:
所述第三步中,利用双反向传播神经网络进行局部路径规划过程如下:
①建立双反向传播神经网络拓扑结构
第一个神经网络,即主神经网络经过离线训练在局部路径规划中起主导作用,为输入层-隐层-输出层结构,输入层接收训练样本信息,隐层实现输入层到输出层的映射变换,其中:输入层的三个参数分别是:(a)dx表示无人系统与最近的障碍物XI-轴距离,dx>0;(b)dy表示无人系统与最近的障碍物YI-轴距离,dy>0;(c)α表示无人系统相对速度方向θo和无人系统与障碍物的连接θr的夹角;输入层和隐层之间的神经元通过权值wimjm连接,隐层和输出层之间的神经元通过权值wjm连接;隐层的神经元数目视训练样本大小而定,输出层输出的是无人系统转向角;
第二个神经网络,即补偿神经网络,经过在线训练,补偿主神经网络在局部路径规划中的偏差,结构为:输入层有三个神经元,三个参数与主神经网络参数相同,接收主神经网络本步输出和前步输入信息,输入层和隐层之间的神经元通过权值wicjc连接,隐层和输出层之间的神经元通过权值wjc连接,最后输出的是在线训练后的补偿转角;
双反向传播神经网络具体拓扑结构设计如下:
当进行至局部路径规划的第l步决策时,无人系统输入与输出之间的关系表示为:
其中,和是相等的系统输入(dx,dy,α),和是主神经网络的阈值,是主神经网络的输出,n是神经元的数目,上式中tansig和purelin表示激活函数,是整个神经网络的最终输出,Δyl为补偿神经网络对第l步主神经网络输出的补偿量,l>1,表示为:
其中,η是补偿神经网络补偿比例的补偿系数;
②进行主神经网络的离线训练和补偿神经网络的在线训练:
主神经网络的离线训练需要有效样本,设无人系统在所有可能的位置遇到障碍物,以障碍物为圆心,以不同半径设置无人系统的位置,并设无人系统速度方向为穿过障碍物,得到无数组的系统输入,通过几何解析得到此时无人系统的最优决策,进而得出无人系统输出,实现以最短距离无碰撞经过障碍物区域,通过得到无数组有效样本,利用得到的样本对主神经网络进行离线训练,得到训练好的主网络模型;
补偿神经网络在线训练只需要通过一组样本进行训练,补偿神经网络的输入为当前次无人系统决策的输入;当前次无人系统输入条件下主神经网络的输出上一次无人系统的决策输出inputl-1与补偿神经网络对前一次主神经网络输出的补偿量Δyl组成改组训练样本,用改组训练样本对补偿神经网络进行在线训练,得到训练好的补偿网络模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910800165.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种航天器高精度自动转运装置及其定位方法
- 下一篇:一种电梯的智能控制方法