[发明专利]一种基于图卷积神经网络的三维点云自动分类方法在审
| 申请号: | 202011398492.6 | 申请日: | 2020-12-02 |
| 公开(公告)号: | CN112488210A | 公开(公告)日: | 2021-03-12 |
| 发明(设计)人: | 王亮;李建书;范德巧 | 申请(专利权)人: | 北京工业大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
| 地址: | 100124 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 图卷 神经网络 三维 自动 分类 方法 | ||
1.一种基于图卷积神经网络的三维点云自动分类方法,其特征在于包括以下步骤:
步骤1:构建数据集并进行预处理,采用3D激光雷达扫描仪获取点云数据,所述数据集由L个类别组成,其中包括I个训练数据和J个测试数据;数据预处理的具体过程为:将采集到的点云数据归一化到单位球内,随机抽取若干个点作为其采样样本;采用随机旋转、随机缩放、随机抖动以及添加高斯噪声的方式实现数据扩增;
步骤2:构建点云自动分类网络,所述的点云自动分类网络包括空间变换矩阵模块,局部特征提取模块,全局特征提取模块,相关层模块,以及输出模块;
所述空间变换矩阵模块是指通过学习点云自身的位姿信息得到一个最有利于网络进行分类的D×D变换矩阵,其输入是经过预处理的三维点云B×n×D,其中B、n、D分别表示输入点云的批处理大小、点云个数以及特征维度,输出是经过空间变换得到的点云,空间变换矩阵模块中所涉及到的参数是通过训练学习得到;该模块利用卷积操作对输入点云进行三次下采样,然后利用最大池化层和全连接层对输入特征进行上采样操作,最后加入权重和偏置量;经过上述操作,所述网络的输出尺寸为B×D×D;
所述局部特征提取模块是用于对点云中的点构造局部特征的图神经网络,其输入是经过空间变换的三维点云,输出是聚合了K个邻近点特征的局部特征;具体操作步骤如下:利用有向图G=(V,E)来表示点云,有向图中的顶点和边分别用V={1,2,...,n}和表示;点云中的每一个点与其邻近的点的局部信息用其K近邻图来表示,则整个点云用图G来表示,通过构造局部邻域图和在连接相邻点对的边上应用图卷积操作来计算局部特征,经过上述操作后,所述网络的输出尺寸为B×N×K×D,其中K表示邻近点的个数;
所述全局特征提取模块由KNN图和3D卷积层组成,用于获取点云的全局特征,其输入是经过空间变换的三维点云,输出是表示整个点云的全局特征;所述的全局特征提取模块提取全局特征的过程如下:首先利用KNN图用于将输入点云分成n组,然后将每组点云分别通过3D卷积层进行特征提取,最后通过最大池化操作得到全局特征,所述网络的输出尺寸为B×N×D;
所述的相关层模块是指将局部特征以及全局特征合并,用于获取局部细粒度特征和具备上下文语义信息的点云特征;
所述的输出模块主要由全连接层组成,用于整合卷积层中具有类别区分性的特征信息;全连接层中每个神经元采用ReLU激活函数;
步骤3:模型训练,将服务机器人利用3D激光雷达、扫描仪等设备获取的点云数据或者已有公开数据集中的每一个点云数据归一化到单位球内,然后随机抽取若干个点作为其采样样本,在点云数据的每一次迭代训练时,随机打乱训练数据的排列顺序,同时采用随机旋转、[0.8,1.2]尺度范围内随机缩放、区间[-0.1,0.1]内随机抖动以及添加[0.01,0.05]高斯噪声的方式实现数据扩增;
将经过预处理的训练数据集和对应的分类基准值作为输入,对构建的三维点云自动分类网络进行前向传播训练以学习该网络的参数,训练前对学习参数进行初始化,其中学习率的初始值设置为[0,0.1],批量归一化的动量为[0,1],最大迭代次数为[200,300],批处理大小为[8,32];然后基于交叉熵的损失函数利用自适应时刻估计方法简称Adam进行反向传播训练,更新模型的权重和偏置项;Adam在模型训练优化的过程中让每个参数获得自适应的学习率,来达到优化质量和速度的双重提升;最后不断迭代训练网络模型参数,以获得最优的三维点云自动分类网络模型;在训练过程中采用Dropout机制,使得模型在训练过程中随机让网络的某些节点权值为零,不参与训练,避免训练过程中出现过拟合的现象;
步骤4:利用训练完成的分类网络进行三维点云分类测试。
2.根据权利要求1所述的三维点云自动分类方法,其特征在于,步骤1所述的预处理指:针对每一个点云模型,随机抽取1024个点作为其采样样本,且每一个点云模型坐标预先被归一化至单位球区间[-1,1]内,通过随机旋转、[0.8,1.2]尺度范围内随机缩放、区间[-0.1,0.1]内随机抖动以及添加[0.01,0.05]高斯噪声的方式实现数据扩增。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011398492.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种改良造纸法生产再造烟叶的方法
- 下一篇:一种多股电缆缠绕成捆生产线





