[发明专利]三维图像处理方法在审

申请号：	201611046880.1	申请日：	2016-11-23
公开（公告）号：	CN108090404A	公开（公告）日：	2018-05-29
发明（设计）人：	殷鹏	申请（专利权）人：	法乐第（北京）网络科技有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62
代理公司：	北京邦信阳专利商标代理有限公司 11012	代理人：	金玺;张伟杰
地址：	100026 北京市朝***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	八叉树结构卷积运算三维图像处理三维图像节省空间节省运算三维图形转换
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例公开一种三维图像处理方法，方法包括：将三维图像转换为相应的八叉树结构；对所述八叉树结构进行卷积运算，得到卷积运算后的八叉树结构。本发明实施例通过将三维图像转换为八叉树结构，能大量节省空间，同时大量节省运算时间，提高效率，实现对三维图形的卷积运算。

技术领域

本发明涉及图像处理相关技术领域，特别是一种三维图像处理方法。

背景技术

环境感知是决定无人车系统对于环境信息识别能力的关键技术，基于激光(Velodyne 64e)的环境感知算法可以有效的提取道路可行驶区域、对象识别与追踪等任务，但是传统的基于激光点云数据的场景感知算法需要根据3D点云数据的几何特征信息，通过设计有监督的分类分割方法以对场景进行简单分类。

然而，发明人在实现发明的过程中发现，现有的卷积计算方法无法应用于三维图像处理中。

传统的二维图片的卷积网络采用对整张图片进行卷积计算，如果三维卷积网络采用直接对整个空间进行卷积计算则会带来很大的计算问题。以ImageNet为例，如果在第一层卷积网络的输入图片的规格为224×224×3(3通道RGB)，输出为96×7×7(96个滤波器，7x7的卷积核)，则其所需要的操作数为96×(224/2)×(224/2)；

对于同样边大小的三维数据224×224×224×3(每个点三个通道RGB)，输出为96×7×7×7，则其所需要的操作为96×(224/2)×(224/2)×(224/2)，是二维空间卷积计算的112倍。对于ImageNet的Model C模型，二维卷积网络总共所需要的操作约为5.3×10^10次计算，三维卷积所需要的计算约为6.1×10^12。但是针对于无人车环境感知的3D点云数据，取50m×50m×10m的三维空间，栅格分辨率取0.1m，则对应的数据大小为500×500×100(不考虑颜色信息)，这样带来的计算复杂度远不能满足实时性的要求。这里有三个问题需要引出：

a.由于激光点云数据是稀疏的，这个计算过程大部分计算浪费在了对0元素的操作上；

b.三维数据进行卷积网络需要确定每个元素的相邻单元，但是三维空间的近邻确定相比于图像非常耗时；

c.对于每个元素的卷积操作还需要知道其几何特征、颜色特征等信息，只有点云的几何位置信息无法获取比较好的卷积效果。

发明内容

基于此，有必要针对现有技术无法实现较好的三维卷积计算，提供一种三维图像处理方法。

本发明实施例提供一种三维图像处理方法，包括：

将三维图像转换为相应的八叉树结构；

对所述八叉树结构进行卷积运算，得到卷积运算后的八叉树结构。

进一步的，所述对所述八叉树结构进行卷积运算，得到卷积运算后的八叉树结构，包括：

选择八叉树结构中一个未进行卷积运算的叶节点作为当前叶节点；

根据卷积核的大小，确定当前叶节点的邻近节点；

将当前叶节点及其邻近节点与卷积核进行卷积运算，得到当前叶节点对应的卷积运算结果；