[发明专利]构建装置和方法、图像分类装置和方法以及电子设备有效
申请号: | 201310253005.0 | 申请日: | 2013-06-24 |
公开(公告)号: | CN104239906B | 公开(公告)日: | 2017-07-07 |
发明(设计)人: | 李斐;刘汝杰 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/66 | 分类号: | G06K9/66 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 朱胜,李春晖 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 构建 装置 方法 图像 分类 以及 电子设备 | ||
技术领域
本发明涉及图像处理领域,尤其涉及构建装置和方法、图像分类装置和方法以及电子设备。
背景技术
随着数字图像数目的急剧增长,需要研究开发有效的自动图像分类技术。一般而言,为了对待测图像进行分类,先要基于给定的训练图像(包括正例和负例图像)构建有效的分类器,然后根据分类器的输出确定待测图像所属的类别。图像分类技术可以应用于人们生活的很多方面,比如个人照片管理、图像图书馆、在线购物等等。
一般而言,描述图像的特征可以分为图像级特征和区域级特征。图像级特征表现的是图像的整体特性,而在图像分割的基础上抽取的区域级特征更加关注图像的局部特性。为了综合考虑两方面的信息,传统的方法通常首先分别基于两种特征独立地构建两个基本分类器,然后将两个基本分类器的输出进行组合。可以看到,传统的方法在构建基本分类器的过程中,对两种特征分别进行处理。也就是说,当基于图像级特征构建分类器的时候,没有利用基于区域级特征构建的分类器提供的任何信息;同样的,当基于区域级特征构建分类器的时候,也没有利用基于图像级特征构建的分类器提供的任何信息。实际上,两种特征从不同角度对同一图像进行描述,往往可以互相提供更多的信息。显然,传统的图像分类方法由于在构建基本分类器的过程中没有利用上述有用的信息,从而影响了最终的分类性能。
发明内容
在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
鉴于此,本发明提供了构建装置和方法、图像分类装置和方法以及电子设备,以至少解决传统的图像分类技术由于没有考虑图像的图像级特征和区域级特征之间的联系而导致分类结果不准确的问题。
根据本发明的一个方面,提供了一种图像分类器的构建装置,该构建装置包括:训练图像分割单元,其被配置用于将训练图像集中的每个训练图像分割为多个区域;第一提取单元,其被配置用于提取训练图像集中每个训练图像的图像级特征,以及提取每个训练图像的多个区域中的每一个的区域级特征;以及构建单元,其被配置用于基于训练图像集中每个训练图像的图像级特征和每个训练图像中的多个区域的区域级特征对图像级支持向量机分类器和区域级支持向量机分类器进行训练,以构建包括图像级支持向量机分类器和区域级支持向量机分类器的图像分类器;其中,构建单元在进行训练的过程中考虑了如下的第一约束:针对训练图像集的全集或子集中的每个训练图像,令区域级支持向量机分类器对该训练图像的多个区域的分类结果中的最大值和图像级支持向量机分类器对该训练图像的分类结果尽量接近。
根据本发明的另一个方面,还提供了一种图像分类装置,该图像分类装置包括:待测图像分割单元,其被配置用于将待测图像分割为多个区域;第二提取单元,其被配置用于提取待测图像的图像级特征和待测图像的多个区域中的每一个的区域级特征;分类单元,其被配置用于基于待测图像的图像级特征获得图像级支持向量机分类器对待测图像的分类结果,以及基于待测图像的多个区域的区域级特征获得区域级支持向量机分类器对待测图像中多个区域中的每一个的分类结果;以及结果确定单元,其被配置用于根据区域级支持向量机分类器对待测图像中多个区域的分类结果中的最大值和图像级支持向量机分类器对待测图像的分类结果,确定待测图像的最终分类结果;其中,图像级支持向量机分类器和区域级支持向量机分类器通过如上所述的构建装置构建而得。
根据本发明的另一个方面,还提供了一种图像分类器的构建方法,该构建方法包括:将训练图像集中的每个训练图像分割为多个区域;提取训练图像集中每个训练图像的图像级特征,以及提取每个训练图像的多个区域中的每一个的区域级特征;以及基于训练图像集中每个训练图像的图像级特征和每个训练图像中的多个区域的区域级特征对图像级支持向量机分类器和区域级支持向量机分类器进行训练,以构建包括图像级支持向量机分类器和区域级支持向量机分类器的图像分类器;其中,在训练的过程中考虑了如下的第一约束:针对训练图像集的全集或子集中的每个训练图像,令区域级支持向量机分类器对该训练图像的多个区域的分类结果中的最大值和图像级支持向量机分类器对该训练图像的分类结果尽量接近。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310253005.0/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序