[发明专利]一种基于点云的三维目标检测方法有效
申请号: | 202011169810.1 | 申请日: | 2020-10-28 |
公开(公告)号: | CN112288709B | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 范赐恩;邹炼;金伟正;李方玉;李晓鹏;陈庆生 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/11;G06T9/00;G06N3/04;G06N3/08;G06T3/40;G06T5/50 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 王琪 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 三维 目标 检测 方法 | ||
1.一种基于点云的三维目标检测方法,其特征在于,包括如下步骤:
步骤S1:将三维空间进行裁剪,保留一定范围内的点云,滤除不包含物体的三维空间,以减少额外的计算量;
步骤S2:点云划分与分组,将裁剪后三维点云空间划分为均匀大小的3D体素;
步骤S3:体素特征提取,对每个体素内包含的点云进行采样,多于N个点的体素,从中随机采样N个点,对于少于N个点的体素,使用0进行填充,以克服不同体素内包含的点云个数极不均匀的问题;然后使用VFE模块对每个体素进行特征提取,以得到逐体素特征;
步骤S4,将逐体素特征作为输入,先使用一个稀疏卷积张量层将体素特征转化为四维张量C×D×H×W,其中C表示通道数,D×H×W表示空间高度、宽度、长度的维度变化,然后使用步长为2的稀疏卷积层和子流形卷积对空间进行8倍下采样;
步骤S5:将下采样后的四维张量进行稠密化操作,并对空间高度进一步进行压缩,再将其重整为(C×D)×H×W的2D俯视图伪图像;
步骤S6:使用分裂-聚合特征金字塔网络作为区域建议网络的骨干网络,实现精细的3D目标检测,包括:
使用一系列卷积层将原尺寸为S的2D俯视图转化为金字塔型特征层级,其中一共包含三个尺度的特征图F11,F12,F13,其尺寸分别为S,S/2,S/4,再将这三个尺度的特征图分别进行池化和反卷积操作,生成三个独立的金字塔型特征层级;然后使用Concat拼接操作和1×1卷积层将它们聚合成全新的金字塔型特征层级,并反卷积到相同大小S的F21,F22,F23;对于三个尺度的F11,F12,F13,使用三个不同步长的反卷积将其分别恢复到大小S,再进行Concat拼接操作得到Fc;最后将F21,F22,F23与Fc进行逐元素相加,融合得到最终用于检测的特征图;最后,使用三个1×1的卷积层分别预测物体的类别,3D边界框,以及朝向。
2.如权利要求1所述的一种基于点云的三维目标检测方法,其特征在于:步骤S1中保留高×宽×长在[-3,1]×[-40,40]×[0,70.4]m3 范围内的点云。
3.如权利要求1所述的一种基于点云的三维目标检测方法,其特征在于:步骤S2中选用0.1×0.05×0.05m3 作为体素的尺寸。
4.如权利要求1所述的一种基于点云的三维目标检测方法,其特征在于:步骤S3中N取5。
5.如权利要求1所述的一种基于点云的三维目标检测方法,其特征在于:步骤S3中使用平均VFE作为体素特征编码器,将每个非空体素内的N个点的信息进行求平均,平均后的结果作为该体素的特征。
6.如权利要求1所述的一种基于点云的三维目标检测方法,其特征在于:步骤S6的具体实现方式如下,
步骤S61:使用4个步长为1的3×3卷积得到大小为S的特征图F11,再使用一个步长为2和5个步长为1的3×3卷积处理F11,得到大小为S/2的特征图F12;然后使用一个步长为2和5个步长为1的3×3卷积得到大小为S/4的特征图F13;最后,分别使用步长为1,2,4的反卷积处理F11,F12,F13,得到大小均为S的三个输出,对其进行Concat拼接操作融合后作为粗糙分支的输出Fc;
步骤S62:对于粗糙分支的中间特征图F11,F12,F13,其大小分别为S,S/2,S/4,对大小为S的F11分别使用卷积核为2和4的最大池化,得到大小为S/2,S/4的新特征图;再对大小为S/2的F12分别使用步长为2的反卷积和卷积核为2的max-pooling,得到大小为S,S/4的新特征图;最后对大小为S/4的F13分别使用步长为4和2的反卷积,得到大小为S,S/2的新特征图;对于F11,F12,F13以及新生成的6个特征图,将相同大小的特征图进行Concat拼接,使其融合得到新的S,S/2,S/4特征图,再使用1×1卷积层对其分别降维到128,256,256;
步骤S63:对于降维后的三个大小为S,S/2,S/4特征图,分别使用7×7,5×5,3×3的卷积得到高层特征表示F21,F22,F23;分别使用步长为1,2,4的反卷积将其都变为大小为S的特征图,再与粗糙分支的输出Fc逐元素相加,最后分别使用一个3×3卷积处理后,将其结果Concat拼接后作为最后用于检测的精细分支特征Fout;
步骤S64:对于精细分支得到的用于检测的特征Fout,分别使用三个1×1的卷积,得到物体的类别,3D边界框,以及朝向。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011169810.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种蔬菜育苗系统及育苗方法
- 下一篇:一种便于装卸货物的货车