[发明专利]图像识别设备及方法在审
申请号: | 201010605112.1 | 申请日: | 2010-12-14 |
公开(公告)号: | CN102567736A | 公开(公告)日: | 2012-07-11 |
发明(设计)人: | 马赓宇;程刚;王强;毛文涛;金智渊 | 申请(专利权)人: | 三星电子株式会社;北京三星通信技术研究有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 韩明星;李娜娜 |
地址: | 韩国京畿*** | 国省代码: | 韩国;KR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 设备 方法 | ||
技术领域
本发明涉及图像处理领域,更具体地讲,涉及一种图像识别设备及方法。
背景技术
随着互联网技术的发展,人们能够访问大量的信息,这包括文本信息、多媒体信息。因此,从互联网中找到希望的信息变为一个重要问题。基于文本的检索和搜索技术在搜索引擎中已经被广泛使用并取得了极大的成功。
然而,对于多媒体信息的搜索,特别是对于图像和视频内容的搜索较为困难。这主要是搜索引擎不能理解图像的含义或者不能将图像中的内容转换为文本的形式进行描述。当前,图像搜索引擎基本上仅是利用围绕图像的文本(例如,网页中图像周围的文本信息)作为搜索的依据,而不是直接从图像中搜索信息。换句话说,当前的图像搜索引擎实质上还是通过搜索网页上用于描述图像的文本来搜索图像。在这种情况下,如果没有用于描述图像的文本信息或者文本信息错误,则无法搜索到正确的结果。
为了解决上述问题,当前的主要解决方案是利用图像识别技术,从待搜索的图像中识别出其中存在的对象,来用于图像的搜索。
第2010/0124377号美国专利申请公开了一种图像分类方法,其中,首先将图像的预定位置上的点设置为关键点,基于关键点提取SIFT特征或者SURF特征;利用稀疏编码对提取的特征进行编码;使用最大汇聚方法对编码后的特征进行汇聚;最后利用SVM分类器从上述汇聚结果中识别图像中的对象。
在上述方案中,在图像的预定位置提取一种类型的特征来根据提取的特征识别图像中的对象。这种方式虽然简化了提取方式,然而需要大量的样本才能训练出效果较好的分类器,这导致识别结果的健壮性不是很高,受外部因素的影响较大。
因此,在图像识别中,需要一种能够具有较高的识别结果健壮性的识别设备和方法。
发明内容
本发明的目的在于提供一种图像识别方法和设备,其通过提取多种类型的特征来识别图像,并对来自不同类型的特征的识别结果进行融合。
为了实现上述目的,提供一种图像识别方法,包括:从输入图像提取K种类型的特征,其中,K为大于1的自然数;分别对提取的K种类型的特征进行编码,以获得用于表示输入图像的与K种类型相应的K个直方图;利用用于对预设的M个类进行分类的分类器对获得的K个直方图进行分类,以获得预设的M个类的得分,其中,针对K种类型的每种类型,训练用于对预设的M个类进行分类的分类器,来对相应类型的直方图进行分类,其中,M为大于1的自然数;对获得的预设的M个类的得分进行融合。
所述融合的步骤可包括:根据特征的类型将相同类的各个得分加权,将相同类的加权后的得分相加,得到与M个类相应的M个得分。
所述融合的步骤还可包括:选择M个类中的一个类作为主导类,根据主导类与M个类中的其他类之间的依存关系,对所述M个得分加权,将加权后的M个得分相加,以得到与主导类相应的一个得分,其中,依次选择M个类的每个类作为主导类,计算与每个主导类相应的得分。
所述融合的步骤可包括:选择M个类中的一个类作为主导类,根据主导类与M个类中的其他类之间的依存关系,对M个类中的每个类的得分加权,将加权后的得分相加,以得到与主导类相应的一个得分,其中,依次选择M个类的每个类作为主导类,计算与每个主导类相应的得分。
将相同类的得分加权的步骤可包括:训练用于加权的权重,以最大化平均精度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社;北京三星通信技术研究有限公司,未经三星电子株式会社;北京三星通信技术研究有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010605112.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序