[发明专利]一种基于激光雷达的非结构化环境可行驶区域提取方法有效
申请号: | 202110051699.4 | 申请日: | 2021-01-14 |
公开(公告)号: | CN112749662B | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 李旭;倪培洲;徐启敏 | 申请(专利权)人: | 东南大学 |
主分类号: | G06V20/56 | 分类号: | G06V20/56;G06V10/44;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08;G01S17/89 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 薛雨妍 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 激光雷达 结构 环境 行驶 区域 提取 方法 | ||
1.一种基于激光雷达的非结构化环境可行驶区域提取方法,其特征在于:包含如下步骤:
(1)雷达点云预处理
确定激光雷达的数据点坐标系OXYZ,以雷达中心为原点,载体前进方向为OX轴,按右手定则建立;方位角和顶角θ的计算公式如下:
其中,(x,y,z)为雷达点云中每一个点在欧式坐标系下的坐标;对于点云中的每一个点都可以通过其(x,y,z)计算其即将欧式坐标系中的点投影到球面坐标系中;此球面坐标系实则是一个二维坐标系,为了便于理解,对其角度进行微分化从而得到一个二维的直角坐标系:
其中,i、j为二维直角坐标系的横、纵坐标,Δθ分别对应θ的分辨率;
通过此球面投影变换,可将欧式空间中得任意一点(x,y,z)投影到二维坐标系下的点(i,j);本发明提取点云中每一个点的5个特征:欧式坐标(x,y,z),反射率ref,角度信息r;其中,从而得到一个尺寸为(H,W,C)的张量,其中,H为球面投影变换后所得渲染图像的宽,W为该图的长,C=5;以KITTI数据集为例,该数据集使用的是64线激光雷达,因此H=64;水平方向上,受数据集标注范围的限制,使用正前方90°的雷达点云数据,并将其划分为512个网格;即水平采样512个点,因此W=512;
(2)基于残差扩张卷积的编码-解码网络设计
主要包括以下子步骤:
子步骤1:确定卷积层类型、卷积核大小和卷积步长
设计扩张卷积层卷积核大小为1×1和3×3,步长均设为1;反卷积层的卷积核大小为3×3,步长为2;
子步骤2:确定池化层类型、采样尺寸和步长
采用最大池化,并将采样尺寸设为2×2,步长设为2;
子步骤3:确定dropout层分布
仅在编码器和解码器的中心层插入dropout;
子步骤4:将子步骤1~3中涉及的不同类型的网络层组合,利用交叉验证法进行模型选择,确定各层的层数、卷积核数量以及扩张卷积的扩张率,得到如下最优网络架构, 其中每一个卷积操作都经过ReLU函数激活:
Block1:用32个1×1、扩张率为1的卷积核与512×64×5的输入样本做卷积,得到子特征图1,之后分别与3×3、扩张率为1以及3×3、扩张率为2的卷积核做卷积并做批标准化处理;BN,Batch Normalization,将特征图拼接concatenation后与1×1、扩张率为1的卷积核做卷积并做BN,再与子特征图1做逐像素相加element-wise addition,得到维度为512×64×32的特征图;
池化层1:Block2输出的特征图用2×2的最大池化层做下采样,步长为2,得到维度为256×32×32的特征图;
Block2:参照Block1,用64个1×1、扩张率为1的卷积核与池化层1输出的特征图做卷积,得到子特征图2,之后分别与3×3、扩张率为1以及3×3、扩张率为2的卷积核做卷积并做BN,将特征图拼接后与1×1、扩张率为1的卷积核做卷积并做BN,再与子特征图2做逐像素相加,得到维度为256×32×64的特征图;
池化层2:Block2输出的特征图经过dropout后,用2×2的最大池化层做下采样,步长为2,得到维度为128×16×64的特征图;
Block3:参照Block1,用128个1×1、扩张率为1的卷积核与池化层2输出的特征图做卷积,得到子特征图3,之后分别与3×3、扩张率为1以及3×3、扩张率为2的卷积核做卷积并做BN,将特征图拼接后与1×1、扩张率为1的卷积核做卷积并做BN,再与子特征图3做逐像素相加,得到维度为128×16×128的特征图;
池化层3:Block3输出的特征图经过dropout后,用2×2的最大池化层做下采样,步长为2,得到维度为64×8×128的特征图;
Block4:参照Block1,用256个1×1、扩张率为1的卷积核与池化层3输出的特征图做卷积,得到子特征图4,之后分别与3×3、扩张率为1以及3×3、扩张率为2的卷积核做卷积并做BN,将特征图拼接后与1×1、扩张率为1的卷积核做卷积并做BN,再与子特征图4做逐像素相加,得到维度为64×8×256的特征图;
反卷积层1:用128个3×3的卷积核与Block4输出的特征图做卷积并做BN,步长为2,经dropout后与Block3输出的特征图逐像素相加,再经过dropout后分别与3×3、扩张率为1以及3×3、扩张率为2的卷积核做卷积并做BN,将特征图拼接后与1×1、扩张率为1的卷积核做卷积并做BN,最后经过dropout得到维度为128×16×128的特征图;
反卷积层2:参照反卷积层1,用64个3×3的卷积核与Block4输出的特征图做卷积并做BN,步长为2,经dropout后与Block3输出的特征图逐像素相加,再经过dropout后分别与3×3、扩张率为1以及3×3、扩张率为2的卷积核做卷积并做BN,将特征图拼接后与1×1、扩张率为1的卷积核做卷积并做BN,最后经过dropout得到维度为256×32×64的特征图;
反卷积层3:参照反卷积层1,用32个3×3的卷积核与Block4输出的特征图做卷积并做BN,步长为2,与Block3输出的特征图逐像素相加,再分别与3×3、扩张率为1以及3×3、扩张率为2的卷积核做卷积并做BN,将特征图拼接后与1×1、扩张率为1的卷积核做卷积并做BN,最后得到维度为512×64×32的特征图;
标准卷积层:用2个1×1的卷积核与反卷积层3输出的特征图做卷积,得到维度为512×64×2的特征图,2个通道对应语义类的总数;
Soft-max层:对标准卷积层输出的特征图做像素级二分类,得到可行驶区域;
(3)网络模型训练
采用标准Soft-max交叉熵损失函数和Adam优化器对网络参数进行迭代训练;优化器初始学习率设为0.01,衰减率设为0.1/20K次迭代,dropout率设为0.5,batch size设为32,训练epoch设为500;
为了增加训练数据的数量,对原始点云做水平翻转、加入随机噪声以及绕z轴随机旋转[-5°,5°]处理;
(4)可行驶区域提取
采集到的雷达点云经过步骤(1)的预处理后,输入步骤(2)搭建的基于残差扩张卷积的编码-解码网络中,并利用步骤(3)得到的网络权重进行在线测试,得到非结构化环境可行驶区域的提取结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110051699.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自动码垛设备
- 下一篇:基于物联网和CCNN模型的农业果实成熟度检测系统