[发明专利]一种基于点云的三维目标检测方法有效
申请号: | 202011169810.1 | 申请日: | 2020-10-28 |
公开(公告)号: | CN112288709B | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 范赐恩;邹炼;金伟正;李方玉;李晓鹏;陈庆生 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/11;G06T9/00;G06N3/04;G06N3/08;G06T3/40;G06T5/50 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 王琪 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 三维 目标 检测 方法 | ||
本发明公开了一种基于点云的三维目标检测方法,该方法首先裁剪出有效的点云空间,将其划分为均匀的体素后进行特征提取,再使用三维稀疏卷积层将空间下采样八倍,并通过维度整合将稀疏的三维数据转化为二维俯视图,最后使用分裂‑聚合特征金字塔网络作为区域建议网络的骨干网络,实现对物体的精细检测。其中分裂‑聚合特征金字塔网络包含两个分支,粗糙分支提取多尺度俯视图特征用于检测不同尺寸的物体,并利用丰富的上下文信息来减少背景点和噪声点造成的误检,精细分支对粗糙分支的多尺度特征进一步细化,并完成多尺度特征图的交叉融合,实现了高质量的俯视图边界框回归和高精度的三维目标检测。
技术领域
本发明涉及计算机视觉,自动驾驶技术领域,具体地涉及一种基于点云的三维物体检测方法。
背景技术
基于深度学习的三维目标检测在机器人技术和自动驾驶领域中扮演着重要角色。三维物体检测的任务是找出给定场景中所有感兴趣的物体,并确定其类别,位置,以及朝向。传统彩色相机采集的图像数据由于缺乏了三维物体检测所必需的深度信息,对于遮挡严重的物体常常难以回归得到良好的边界框。随着激光雷达和彩色深度相机的普及,点云数据的获取变得更加方便可行,由于点云数据保留了物体精确的深度信息和几何结构信息,使用点云进行三维物体检测可以达到更高的精度。目前使用点云进行三维目标检测的方法主要分为两类:一类是基于点云和图像融合的方法,主要以MV3D(Multi-view 3DObject Detection Network For Autonomous Driving)为代表,该方法将点云数据投影到前视图和鸟瞰图,再对多视图的点云数据和彩色图像使用二维卷积神经网络提取特征,最后将这些特征进行深度融合,并用于物体检测。这类方法利用鸟瞰图中物体遮挡较少的特点,巧妙地将点云的深度信息和彩色图像进行了融合。由于点云通常是稀疏且分布不均匀的,因此在将点云和图像进行融合的过程中,常常会由于无法精准对齐而对检测结果造成干扰。此外,在将点云数据投影到多视图的过程中,也存在着不可避免的空间结构信息丢失,因此这类方法的检测精度远达不到自动驾驶的技术要求。另一类是基于纯点云的方法,主要以SECOND(Sparsely Embedded Convolutional Detection)为代表,这类方法将点云划分为规则均匀地体素,对每个体素提取特征后,学习三维空间Z轴上的信息,再将空间高度进行压缩形成俯视图伪图像,最后使用区域建议网络处理俯视图特征,实现最终的三维物体检测。这种方法实现了对物体的高精度检测,并且保证了训练和推理速度。由于这类方法将稀疏的三维数据转化为二维伪图像后简单地处理后就用于检测,除了无法避免的体素采样的信息丢失,俯视图特征提取的不充分也丢失了物体的细节信息,因此这类方法预测的边界框不准确,且容易出现误检。
因此,探寻一种兼具速度和精度优势的三维目标检测器是当前自动驾驶领域亟待解决的问题。
发明内容
针对三维目标检测器无法有效地从BEV伪图像中提取有用信息用于3D物体检测的问题,本发明提出了一种融合俯视图多尺度跨层特征的三维物体检测方法,该方法训练及推理速度快,且3D目标检测和BEV目标检测的精度明显高于其它现有方法。
与现有技术不同的是,我们提出了一种深度融合俯视图多尺度特征的三维物体检测方法,整个网络将空间中的三维体素压缩为伪图像后,对俯视图提取多尺度特征,并使用分裂-聚合特征金字塔网络充分融合跨层特征图,最终使用三个 1×1卷积层得到最终的精细检测结果。我们的方法在具有挑战性的KITTI自动驾驶场景的数据集上进行了丰富的实验,结果表明我们的方法对于3D目标检测和BEV(Bird’s Eye View)目标检测的精度均有着显著提升。
为实现上述目的,本发明的技术 方案为一种基于点云的三维目标检测方法,包括如下步骤:
步骤S1:将三维空间进行裁剪,保留一定范围内的点云,滤除不包含物体的三维空间,以减少额外的计算量;
步骤S2:点云划分与分组,将裁剪后三维点云空间划分为均匀大小的3D体素;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011169810.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种蔬菜育苗系统及育苗方法
- 下一篇:一种便于装卸货物的货车