[发明专利]一种非结构化环境中的3D目标实例物体检测的方法有效
| 申请号: | 201611031180.5 | 申请日: | 2016-11-18 |
| 公开(公告)号: | CN108073940B | 公开(公告)日: | 2021-09-17 |
| 发明(设计)人: | 王睿;梁颖;许婧文 | 申请(专利权)人: | 北京航空航天大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100191*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 结构 环境 中的 目标 实例 物体 检测 方法 | ||
本发明公开了一种非结构化环境中的三维目标实例物体检测的方法。该方法采取了基于分类器学习的多视角三维目标实例物体检测方案。方案包含两大模块:候选窗口提取及目标识别验证。首先利用改进的二值化规范梯度(BING Binary normed Gradients)算法,快速有效地获取可能存在目标实例物体的候选窗口。在目标识别阶段,方案融合了目标实例物体的颜色,形状,纹理特征,并采用随机森林,线性SVM分类器级联的方式对候选窗口进行验证,最终实现在非结构化的环境中对三维目标实例物体的快速准确识别检测。
技术领域
本发明属于计算机视觉领域,具体涉及一种在非结构化环境中的3D目标实例物体检测的方法。
背景技术
目标检测与识别是计算机视觉领域的研究热点,在目标侦察,精确制导,智能监控,视觉导航,人机交互,空间遥感及智能服务等方面具有广泛应用。视频或图像信号中的目标检测的在本专利中的具体含义是利用计算机对图像信号进行加工处理,主要通过提取并分析窗口特征,来判断图像中是否存在目标实例物体并标出目标在图像中的位置。
按照目标物体所处的环境,可以分为结构化和非结构化环境。与结构化环境相比,非结构化环境是一种没有明确结构、不规则的环境,即目标周围的环境信息非固定,不可知。目前,目标检测技术在简单场景中能够获得较高的检测率,然而对于实际复杂环境下的目标检测问题尚未完全解决。
目标检测可以进一步分为实例级(instance-level)目标检测和类别级(category-level)目标检测。类别级目标检测的主要任务是判断给定图片中是否存在给定类别的实例物体并将该类别的实例物体全部用矩形框标出。实例级目标检测的主要任务是在图片中搜索某一个指定的实例物体并确定当前时刻目标在当前帧的位置。本发明主要针对实例级即特定3D目标检测。
相比于二维平面物体,三维物体检测的难点主要体现在视角变化问题上,在同一场景中,对于一个物体来说从不同的视角看过去,其表现形式可能是大不相同的。在现有技术中,针对多视角问题的解决方法大致可以分为两类:基于CAD模型匹配的方法和基于特征的方法。在基于CAD模型匹配的物体检测方法中,需要首先生成一个目标物体的三维模型,然后将此模型用于目标匹配。这种方法只对已知形状的物体有效,并不适用于形状和维数变化很大的物体,且不具备学习能力。相比之下,基于特征的方法可以避免这个问题。
钟诚在专利中曾提出(钟诚.多角度特定物体判别设备及多角度特定物体判断方法[P].北京:CN102147851A,2010-02-08.)一种有监督的基于特征的三维物体检测方法,将训练样本按角度均分成多个集合,然后针对每个视角,分别提取训练样本的特征,学习出多个级联分类器组,其中每个级联分类器组由多个与同一检测角度相对应的分类器级联构成。然而这种方法需要计算每个视角下的分类器组,计算量大,耗时长,且对于各个视角临界处的图像检测效果不好。
为了解决这个问题,学者们提出了一种无监督的基于特征的三维物体检测方法,即训练样本不需要进行事先分组,分类器是在所有角度的正样本基上训练而成的。徐胜在文章《三维物体识别研究》中提出一种基于二维视图和局部特征提取匹配的三维物体检测方法,该方法在目标视图中提取了多种底层特征,包括多种不变矩,颜色,纹理等,这些特征在不同视角下具有稳定性,因此可利用它们训练分类器。然而该方法选取的特征是针对整幅图像的信息抽取,无法区分前景和背景,因此背景对于物体检测的干扰是该方法面临的重大挑战。
为了解决背景干扰的问题,张维泽在《基于简单局部特征学习的物体检测方法》中提出了一种基于物体局部简单特征的检测方法,首先提取物体局部特征,如类HARR特征,分散矩形特征等,通过学习建立物体模型或者分类器,然后对静态图像中的特定物体类别进行检测定位的方法,避免了背景对检测的影响。然而特征检测子的纬度较高,计算复杂度很大,使得该方法的耗时较长,处理速度较慢。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611031180.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据聚类方法及装置
- 下一篇:一种基于深度学习的图像语义生成方法





