[发明专利]对象识别设备和方法有效
申请号: | 201210203740.6 | 申请日: | 2012-06-15 |
公开(公告)号: | CN103514453B | 公开(公告)日: | 2017-07-11 |
发明(设计)人: | 范伟;皆川明洋;孙俊;堀田悦伸;直井聪 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 李春晖,李德山 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对象 识别 设备 方法 | ||
技术领域
本发明总体上涉及图像处理领域,具体涉及模式识别和人机交互领域,更具体地,本发明涉及一种用于对象识别的设备和方法。
背景技术
在计算机视觉应用中,基于数字图像或视频输入的自动对象识别是一项重要技术。作为对象识别系统的前端,快速有效的对象识别方法是非常重要的,尤其对于低计算能力的装置比如移动电话、平板电脑等而言更是如此。对象识别中的难点在于如何提取描述对象的稳定特征。
传统的方法通常设计一些简单的规则来定义海量的基本特征,然后使用机器学习方法比如boosting通过大量训练样本来选择出一些最有效的特征构成分类器,将目标对象与背景区分开。现有的特征包括例如类Haar矩形特征、局部二值模式(LBP)、梯度方向直方图(HOG)等。
但是,这些方法都存在一些缺陷。例如,类Haar特征太简单,为获得满意的性能,学习得到的分类器通常要包括上千个矩形特征。大量的特征提取使得训练过程和测试过程都十分耗时。另外,采用LBP特征的优点在于不受图像灰度的整体变换的影响,但是,如果灰度反转,该特征会改变较大。如图1所示,当对象(例如,杯子)处于不同亮度的背景,例如如图1a所示处于暗背景和如图1b所示处于亮背景中时,同样位置的LBP特征完全不一样。相比而言,HOG特征对背景灰度反转较为鲁棒,但是该特征向量是由4个局部直方图级联得到的高维向量(例如,36维)。在这种高维的特征空间中训练弱分类器十分耗时,因此只能承受较简单的弱分类器,例如线性支持向量机(SVM)。
发明内容
在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
鉴于背景技术部分所述的需求,本发明关注于采用局部边缘方向分布模式特征进行分类以识别对象。由于所采用的特征的候选集小、表示简单且不受背景灰度反转的影响,因此本发明可以在降低计算量的同时提供更好的识别性能。
因此,根据本发明的一个方面,提供了一种对象识别设备,包括:边缘方向分布模式计算装置,被配置为计算候选对象的多个局部区域中每个局部区域的边缘方向分布模式,作为所述候选对象的多个局部边缘方向分布模式特征;以及分类器,被配置为基于所述多个局部边缘方向分布模式特征对所述候选对象进行分类,其中,边缘方向分布模式计算装置包括:边缘提取模块,被配置为提取局部区域内的边缘;概率分布计算模块,被配置为计算边缘的方向的概率分布;以及二值化模块,被配置为将概率分布二值化,以得到局部区域的边缘方向分布模式。
根据本发明的另一个方面,提供了一种对象识别方法,包括:计算候选对象的多个局部区域中每个局部区域的边缘方向分布模式,作为所述候选对象的多个局部边缘方向分布模式特征;以及使用分类器基于所述多个局部边缘方向分布模式特征对所述候选对象进行分类,其中,计算边缘方向分布模式包括:提取局部区域内的边缘;计算边缘的方向的概率分布;以及将概率分布二值化,以得到局部区域的边缘方向分布模式。
依据本发明的其它方面,还提供了相应的计算机程序代码、计算机可读存储介质和计算机程序产品。
通过以下结合附图对本发明的优选实施例的详细说明,本发明的这些以及其他优点将更加明显。
附图说明
为了进一步阐述本发明的以上和其它优点和特征,下面结合附图对本发明的具体实施方式作进一步详细的说明。所述附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分。具有相同的功能和结构的元件用相同的参考标号表示。应当理解,这些附图仅描述本发明的典型示例,而不应看作是对本发明的范围的限定。在附图中:
图1a是示出了对象处于暗背景中的图;
图1b是示出了对象处于亮背景中的图;
图2示出了根据本发明的一个实施例的对象识别设备的结构;
图3示出了根据本发明的一个实施例的对象识别设备中的边缘方向分布模式计算装置的结构;
图4示出了根据本发明的一个实施例的边缘方向的概率分布计算的实例的图;
图5示出了根据本发明的一个实施例对图4中的直方图进行二值化的图;
图6示出了根据本发明的一个实施例的对象识别方法的流程图;
图7示出了根据本发明的一个实施例的对象识别方法中计算每个局部区域的边缘方向分布模式的步骤的流程图;以及
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210203740.6/2.html,转载请声明来源钻瓜专利网。