[发明专利]基于点云-体素聚合网络模型的语义场景补全方法及系统在审
| 申请号: | 202110422598.3 | 申请日: | 2021-04-15 |
| 公开(公告)号: | CN113850270A | 公开(公告)日: | 2021-12-28 |
| 发明(设计)人: | 陈小康;唐嘉祥;王靖博;曾钢 | 申请(专利权)人: | 北京大学 |
| 主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62;G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 北京万象新悦知识产权代理有限公司 11360 | 代理人: | 黄凤茹 |
| 地址: | 100871*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 聚合 网络 模型 语义 场景 方法 系统 | ||
1.一种基于点云-体素聚合网络模型的语义场景补全方法,建立点云-体素聚合网络模型作为三维图像语义场景补全深度神经网络模型,将二维单目深度图像转换为三维点云;提取点云与体素两种数据模态中互补的特征,并对特征进行融合;再使用提取的特征进行预测,得到每个三维点的语义结果,最终对应到体素中得到三维场景的结构与语义;
三维图像语义场景补全深度神经网络模型包括点云-体素双路编码器和以语义传播模块为基本单元构成的解码器;所述点云-体素双路编码器以点云模型作为主干,同时使用浅层的三位卷积神经网络作为体素分支,用于提取局部结构信息,并对特征进行融合,且保留稠密体素中的局部结构特征;再通过解码器对提取的特征逐层上采样,恢复三维场景的几何结构以及语义信息;
所述基于点云-体素聚合网络模型的语义场景补全方法包括如下步骤:
A.通过深度传感器采集二维单目深度图像,根据二维单目深度图像生成三维空间的体素表示;并计算得到三维空间中每一个体素的截断符号距离函数TSDF矩阵以及标准化高度信息;根据TSDF矩阵,提取可见表面以及被遮挡的体素;再转换为点云表示;
B.构建三维图像语义场景补全深度神经网络模型的点云-体素双路编码器;通过点云-体素双路编码器提取特征;
点云-体素双路编码器包括点云分支和体素分支;使用体素分支对生成的体素表示进行卷积,提取体素特征;使用点云分支对生成的点云表示提取点云特征;再将体素特征融合到点云特征中;
C.构建三维图像语义场景补全深度神经网络模型的解码器;包括:
C1.将融合的特征逐层上采样,最后输出每一个输入的点云的分类结果,包括场景补全结果和语义分割结果;
C2.根据点云与体素的一一对应关系,将点云的预测结果对应到体素的预测结果,从而获得使用体素表示的三维场景结构及其语义分割结果;
利用训练好的三维图像语义场景补全深度神经网络模型,即实现基于点云-体素聚合网络模型的语义场景补全。
2.如权利要求1所述基于点云-体素聚合网络模型的语义场景补全方法,其特征是,步骤A具体包括:
A1.通过相机参数,将二维单目深度图像投影到三维空间,并对三维空间按照一定的空间分辨率进行量化,得到以体素的形式表示的三维场景;
A2.对体素空间进行进一步编码,计算其中每一个体素的截断符号距离函数TSDF矩阵以及标准化的高度信息;
A3.根据TSDF矩阵,提取可见表面以及被遮挡的体素,并转换为点云表示。
3.如权利要求1所述基于点云-体素聚合网络模型的语义场景补全方法,其特征是,在步骤A中,根据输入的深度图数据以及相机参数将二维深度投影到三维空间,得到观测到的表面的位置和被遮挡区域的位置。
4.如权利要求3所述基于点云-体素聚合网络模型的语义场景补全方法,其特征是,在步骤A中,根据TSDF值,将体素空间中的每一个体素进行分类,TSDF为0的位置为可见表面体素,TSDF为正的位置为可见空气体素,TSDF为负的位置为被遮挡的体素;在点云表示中舍弃可见空气体素,只提取可见表面与被遮挡的体素转换为点云分支的输入。
5.如权利要求1所述基于点云-体素聚合网络模型的语义场景补全方法,其特征是,在步骤B中,通过点云-体素双路编码器对输入进行特征提取;体素分支具体使用浅层3D CNN提取局部结构特征;点云分支具体使用层次化的多层感知机提取全局特征;神经网络的层数包含多个层次,每个层次均对点云进行降采样,并提高特征的维度。
6.如权利要求1所述基于点云-体素聚合网络模型的语义场景补全方法,其特征是,在步骤C中,解码器的基本单元语义传播模块首先对相邻的深层与浅层的点云之间,根据欧式距离构建k-近邻图结构,再根据每两个相邻的点的特征预测连接边的权重,最后根据权重进行从深层到浅层的特征传播;解码器逐层将深层特征传播到浅层特征,并逐渐上采样以恢复点的数量,最终输出每一个输入点对应的语义标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110422598.3/1.html,转载请声明来源钻瓜专利网。





