[发明专利]一种物体识别方法及装置在审
申请号: | 201611122841.5 | 申请日: | 2016-12-08 |
公开(公告)号: | CN106778856A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 黄惠;徐凯;张俊宇 | 申请(专利权)人: | 深圳大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京三友知识产权代理有限公司11127 | 代理人: | 王涛,贾磊 |
地址: | 518060 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 物体 识别 方法 装置 | ||
技术领域
本发明是关于三维模型技术,特别是关于一种物体识别方法及装置。
背景技术
当前机器人对场景中的物体进行识别和操作主要是基于视觉的方法,但是随着三维感知技术和三维模型数据库的飞速发展,使得自主机器人识别系统得到爆发式的增长,三维模型在机器视觉中扮演者越来越重要的角色。
一般地,比较粗糙的物体识别,比如区分桌子和椅子,只需要一个视角就可以区分清楚,然而,在一个大型三维模型数据库中,一个物体的细粒度的识别就非常有挑战性,这种情况下,一个单一视角已经不足够区分。
对于高效地完成机器人自主识别的过程,能够计算出物体的一系列视角就变得极其重要。该问题可以称为下一最优视点问题,即next-best-view问题,简称NBV估计问题,NBV的估计和物体的分类是分不开的,目的是尽可能的减小分类的不确定性,同时最小化观测所需的能量。细粒度的物体识别既需要对物体进行分类,也需要计算出最好的下一最优视点。一个最直接的解决办法是对整个模型数据库训练实例级的分类器。然而,众所周知地,当需要分类的种类太多时,细粒度分类的方法表现不佳,因此基于所有预定视角下的静态信息的预测方法和计算视点间的顺序就需要额外的工作。
为了解决上述问题,现有技术中通常使用体积的方式表示三维模型,并训练了一个卷积深度置信网络(Convolutional Deep Belief Network,简称CDBN)来对空间容积信息和种类进行建模,并作为形状的分类器。通过对分布的采样,能够基于深度图对形状进行完善和补全,并使用虚拟扫描来估计视角的信息增益。但是该方法不能够预测下一最优视点,并且该方法是对通过物体的空间容积信息来进行分类,因此没有层次化的结构,不能够处理不同粒度的分类问题。
发明内容
本发明实施例提供了一种物体识别方法及装置,以进行物体的识别,解决了下一个视点的规划问题。
为了实现上述目的,本发明实施例提供了一种物体识别方法,该物体识别方法包括:
S1:将待识别物体当前最优视角的一深度图输入特征提取器进行特征提取,得到第一特征向量;
S2:将所述第一特征向量通过第一隐含层得到池化层结果,将所述池化层结果输入层次化分类器得到分类结果;
S3:根据所述池化层结果及视角观测参数的观测向量生成当前聚焦的局部区域;
S4:将所述局部区域输入第二隐含层得到第二特征向量,所述第二特征向量包括所述池化层结果及当前局部观测视角的信息;
S5:利用一全连接层及所述第二特征向量生成下一最优视角;
S6:重复所述S1至S5,直至所述分类结果遍历到所述层次化分类器叶子节点。
一实施例中,所述第一隐含层为最大池化层,用于将各个视角的信息进行集成。
一实施例中,该物体识别方法还包括:将视角观测参数通过非线性函数编码成所述观测向量。
一实施例中,该物体识别方法还包括:
对于每一个非根节点,利用高斯混合模型对形状进行聚类;
基于聚类结果训练所述层次化分类器。
一实施例中,如果所述深度图存在遮挡,物体识别方法还包括:
提取所述深度图的一系列局部图像,在所述层次化分类器的每个节点训练一个局部级别的卷积神经网络。
为了实现上述目的,本发明实施例还提供了一种物体识别装置,该物体识别装置包括:
特征提取单元,用于将待识别物体当前最优视角的一深度图输入特征提取器进行特征提取,得到第一特征向量;
分类单元,用于将所述第一特征向量通过第一隐含层得到池化层结果,将所述池化层结果输入层次化分类器得到分类结果;
区域生成单元,用于根据所述池化层结果及视角观测参数的观测向量生成当前聚焦的局部区域;
向量生成单元,用于将所述局部区域输入第二隐含层得到第二特征向量,所述第二特征向量包括所述池化层结果及当前局部观测视角的信息;
最优视角生成单元,用于利用一全连接层及所述第二特征向量生成下一最优视角。
一实施例中,所述第一隐含层为最大池化层,用于将各个视角的信息进行集成。
一实施例中,物体识别方法还包括:编码单元,用于将视角观测参数通过非线性函数编码成所述观测向量。
一实施例中,物体识别方法还包括:
聚类单元,用于对于每一个非根节点,利用高斯混合模型对形状进行聚类;
分类单元,用于基于聚类结果训练所述层次化分类器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611122841.5/2.html,转载请声明来源钻瓜专利网。