[发明专利]一种基于深度学习的点云物体姿态估计方法、装置及其设备有效
申请号: | 201810800385.8 | 申请日: | 2018-07-20 |
公开(公告)号: | CN108961339B | 公开(公告)日: | 2020-10-20 |
发明(设计)人: | 徐楷;冯良炳;陈先开 | 申请(专利权)人: | 深圳辰视智能科技有限公司 |
主分类号: | G06T7/73 | 分类号: | G06T7/73;G06N3/04 |
代理公司: | 深圳协成知识产权代理事务所(普通合伙) 44458 | 代理人: | 章小燕 |
地址: | 518000 广东省深圳市南山区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 物体 姿态 估计 方法 装置 及其 设备 | ||
本发明实施例提供一种基于深度学习的点云物体姿态估计方法、装置及其设备,所述方法包括:获取需要学习的数据;网络模型的设计;模型的训练及预测。网络模型的设计包括:将点云物体姿态估计问题建模为无区别的多分类问题;设计残差块结构来提取特征;将提取的特征通过最大池化层获取全局特征;将全局特征分别送入三个并行的多层感知机做坐标轴的预测类别得分;使用分类器对坐标轴做预测类别得分后的特征做最后的类别预测;对经过分类器处理后得到的损失值进行等权重的求和,并将此和作为整体的多分类损失函数;使用适应性矩估对多分类损失函数进行优化。本发明所述方法能精确地对点云物体姿态进行评估,以提高对物体姿态定位及预测的精准性。
技术领域
本发明涉及计算机视觉领域,尤其涉及一种基于深度学习的点云物体姿态估计方法、装置及其设备。
背景技术
目前,在对3D点云的深度学习方法的研究中,3D点云往往会被投影到2D平面或被转化为3D体素以适应卷积神经网络的高度规则化的输入数据格式,但在数据的转换操作过程中往往会引入人为噪声,为去除人为噪声往往会增加计算量,过程较为繁杂,且人为噪声的引入会严重影响对物体姿态评估的准确性,从而导致现有对物体姿态的评估的准确率都不高,导致严重影响该技术在应用领域的效果。
发明内容
有鉴于此,本发明的目的在于提供一种基于深度学习的点云物体姿态估计方法、装置及其设备,旨在能精确地对点云物体姿态进行评估,以提高对物体姿态定位及预测的精准性。
本发明解决上述技术问题所采用的技术方案如下:
本发明的第一方面提供一种基于深度学习的点云物体姿态估计方法,该方法包括步骤:
获取需要学习的数据;
网络模型的设计;
模型的训练;
模型的预测;
其中,所述网络模型的设计具体包括:
将点云物体姿态估计问题建模为无区别的多分类问题;
设计残差块结构来提取点云物体的特征;
将经过所述残差块结构获取的特征通过最大池化层获取全局特征;
将经过最大池化层获取的所述全局特征分别送入三个并行的多层感知机做坐标轴的预测类别得分;
使用分类器对分别经过所述多层感知机做坐标轴的预测类别得分后的特征做最后的类别预测;
对经过所述三个并行分类器处理后得到的损失值进行等权重的求和,并将此和作为整体的多分类损失函数;
使用适应性矩估计对多分类损失函数进行优化。
在一些实施例中,所述使用分类器对分别经过所述多层感知机做坐标轴的预测类别得分后的特征做最后的类别预测包括:
使用交叉熵损失函数作为分类器,进行最后的类别预测,公式如下:
公式10为softmax计算公式,用于计算网络的前向传播最终得分;
公式11为损失函数,其中“b”代表批尺寸batch size。
在一些实施例中,所述设计残差块结构来提取点云物体的特征包括步骤:
网络输入首先通过第一卷积层做卷积操作输出特征图;
将第一卷积层做卷积操作输出特征图输入第二卷积层做卷积操作输出特征图;
将第二卷积层做卷积操作输出的特征图分别通过Block1和Block2;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳辰视智能科技有限公司,未经深圳辰视智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810800385.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种腹部穴位的辅助定位方法及装置
- 下一篇:一种目标物体的自动射击方法及装置