[发明专利]构建装置和方法、图像分类装置和方法以及电子设备有效
申请号: | 201310253005.0 | 申请日: | 2013-06-24 |
公开(公告)号: | CN104239906B | 公开(公告)日: | 2017-07-07 |
发明(设计)人: | 李斐;刘汝杰 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/66 | 分类号: | G06K9/66 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 朱胜,李春晖 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 构建 装置 方法 图像 分类 以及 电子设备 | ||
1.一种图像分类器的构建装置,包括:
训练图像分割单元,其被配置用于将训练图像集中的每个训练图像分割为多个区域;
第一提取单元,其被配置用于提取所述训练图像集中每个所述训练图像的图像级特征,以及提取每个所述训练图像的所述多个区域中的每一个的区域级特征;以及
构建单元,其被配置用于基于所述训练图像集中每个所述训练图像的图像级特征和每个所述训练图像中的所述多个区域的区域级特征对图像级支持向量机分类器和区域级支持向量机分类器进行训练,以构建包括所述图像级支持向量机分类器和所述区域级支持向量机分类器的图像分类器;其中,所述构建单元在进行所述训练的过程中考虑了如下的第一约束:针对所述训练图像集的全集或子集中的每个训练图像,令所述区域级支持向量机分类器对该训练图像的多个区域的分类结果中的最大值和所述图像级支持向量机分类器对该训练图像的分类结果尽量接近,
其中,所述第一约束包括:
针对所述训练图像集的全集或子集中的每个训练图像,令该训练图像到表示所述图像级支持向量机分类器的第一超平面的函数间隔与该训练图像到表示所述区域级支持向量机分类器的第二超平面的函数间隔尽量接近,其中,该训练图像到所述第二超平面的函数间隔是所述区域级支持向量机分类器对该训练图像的多个区域的分类结果中的最大值所对应的区域到所述第二超平面的函数间隔。
2.根据权利要求1所述的构建装置,其中,所述子集不包括所述训练图像集中的离群样本,所述离群样本是满足以下条件的训练图像:
其到所述第一超平面的函数间隔小于第一预定阈值,和/或
其到所述第二超平面的函数间隔小于第二预定阈值;
其中,所述第一预定阈值和所述第二预定阈值均为正数。
3.根据权利要求2所述的构建装置,其中,所述构建单元被配置用于:
在考虑所述第一约束和第二约束的情况下构建以所述图像级支持向量机分类器和所述区域级支持向量机分类器的支持向量机参数为未知量的代价函数;以及
通过求解所述代价函数的最优问题来获得所述图像级支持向量机分类器和所述区域级支持向量机分类器的支持向量机参数的最优值;
其中,所述第二约束包括:
使得到所述第一超平面的函数间隔为所述第一预定阈值的训练图像到所述第一超平面的几何间隔尽量大,以及
使得到所述第二超平面的函数间隔为所述第二预定阈值的训练图像到所述第二超平面的几何间隔尽量大。
4.根据权利要求3所述的构建装置,其中,所述构建单元被配置用于在所述训练的过程中还考虑如下的第三约束:
针对所述图像级支持向量机分类器,使得所述训练图像集中的、到所述第一超平面的函数间隔小于所述第一预定阈值的训练图像所对应的第一松弛变量的加权和尽量小;以及
针对所述区域级支持向量机分类器,使得所述训练图像集中的、到所述第二超平面的函数间隔小于所述第二预定阈值的训练图像所对应的第二松弛变量的加权和尽量小。
5.一种图像分类装置,包括:
待测图像分割单元,其被配置用于将待测图像分割为多个区域;
第二提取单元,其被配置用于提取所述待测图像的图像级特征和所述待测图像的所述多个区域中的每一个的区域级特征;
分类单元,其被配置用于基于所述待测图像的图像级特征获得图像级支持向量机分类器对所述待测图像的分类结果,以及基于所述待测图像的多个区域的区域级特征获得区域级支持向量机分类器对所述待测图像中所述多个区域中的每一个的分类结果;以及
结果确定单元,其被配置用于根据所述区域级支持向量机分类器对所述待测图像中所述多个区域的分类结果中的最大值和所述图像级支持向量机分类器对所述待测图像的分类结果,确定所述待测图像的最终分类结果;
其中,所述图像级支持向量机分类器和所述区域级支持向量机分类器通过如权利要求1-4中任一项所述的构建装置构建而得。
6.根据权利要求5所述的图像分类装置,其中,所述结果确定单元将所述区域级支持向量机分类器对所述待测图像中所述多个区域的分类结果中的最大值和所述图像级支持向量机分类器对所述待测图像的分类结果的加权和确定为所述待测图像的最终分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310253005.0/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序