[发明专利]图像识别装置、图像识别方法和集成电路有效
申请号: | 201280002529.6 | 申请日: | 2012-08-29 |
公开(公告)号: | CN103189897A | 公开(公告)日: | 2013-07-03 |
发明(设计)人: | 黄仲阳;华扬;颜水成;陈强;川西亮一 | 申请(专利权)人: | 松下电器产业株式会社 |
主分类号: | G06T7/00 | 分类号: | G06T7/00 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 王成坤;胡建新 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 装置 方法 集成电路 | ||
技术领域
本发明涉及进行一般物体识别的图像识别技术,特别涉及金字塔匹配技术。
背景技术
近年来,关于一般物体识别,提出了使用空间金字塔匹配(SPM)(参照非专利文献1)的手法。在SPM中,在计算表现输入图像的特征的直方图时,首先,有层次地分割输入图像,以使得将输入图像分割成多个区域,进而,将分割后的各区域分割成多个区域。然后,针对各层次中的分割后的各个区域计算直方图,将它们结合起来计算表示输入图像的特征的直方图。
由此,能够在表示输入图像的特征的直方图中反映出分割后的各区域的输入图像中的几何学的位置关系,能够提高一般物体识别的精度。
现有技术文献
非专利文献
非专利文献1:S.Lazebnik,C.Schmid,and J.Ponce、“Beyond Bags of Features:Spatial Pyramid Matching for Recognizing Natural Scene Categories”、Proc.of IEEE Computer Vision and Pattern Recognition,pp.2169-2178(2006).
非专利文献2:G.Wang、D.Forsyth著、Joint learning of visual attributes,object classes and visual saliency.In Proceedings of IEEE International Conference on Computer Vision,pages537-544,2009.
非专利文献3:Laurent Itti、Christof Koch、Ernst Niebur著、A model of saliency-based visual attention for rapid scene analysis、IEEE TRANSACTIONS ONPATTERN ANALYSIS AND MACHINE INTELLIGENCE,VOL.20,NO.11,NOVEMBER1998
发明内容
发明要解决的课题
但是,如上所述,在使用将输入图像分割成多个区域的手法的一般物体识别中,也需要进一步提高精度。
因此,本发明的目的在于,提供如下的图像识别装置:能够减少一般物体识别中的输入图像中的识别对象即物体的位置、大小、背景干扰等的影响,与以往相比,能够提高一般物体识别的精度。
用于解决课题的手段
为了解决上述课题,本发明的图像识别装置进行一般物体识别,其中,该图像识别装置具有:分割单元,根据从输入图像的内容中提取出的意思对该输入图像进行分割;生成单元,计算所述分割后的各个区域的特征信息,生成反映了计算出的特征信息的所述输入图像的特征信息;以及检查单元,根据所述输入图像的特征信息,对所述输入图像中的识别对象物体的存在情况进行检查。
发明效果
根据上述结构,本发明的图像识别装置在对输入图像进行分割时,不是规则地进行等分割,而是根据与输入图像的内容有关的信息进行分割,所以,在根据分割后的图像而生成的直方图中反映出与输入图像的内容有关的信息,能够减少一般物体识别中的输入图像中的识别对象即物体的位置、大小、背景干扰等的影响,与以往相比,能够提高一般物体识别的精度。
附图说明
图1是示出基于金字塔匹配的一般物体识别处理的流程的流程图。
图2是示出图像识别装置200的结构的框图。
图3(a)是示出使用意思图(位置图)的输入图像分割处理顺序的流程图,(b)是示意地示出在输入图像分割处理中使用的图像等的一例的图。
图4是用于说明输入图像的直方图的生成的图,(a)是示出输入图像的图,(b)是示出分割图像的图,(c)是示出空间子区域的直方图的图,(d)是示出输入图像的直方图的图。
图5是用于说明使用输入图像的直方图的基于匹配处理的判断有无存在各识别对象物体的图。
图6(a)是示出使用意思图(显著性图)的输入图像分割处理顺序的流程图,(b)是示意地示出在输入图像分割处理中使用的图像等的一例的图。
图7是用于说明输入图像的直方图的生成的图,(a)是示出输入图像的图,(b)是示出分割图像的图,(c)是示出空间子区域的直方图的图,(d)是示出输入图像的直方图的图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器产业株式会社,未经松下电器产业株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280002529.6/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序