[发明专利]精细粒度类别识别及物体的部分定位和特征提取方法有效
| 申请号: | 201510026025.3 | 申请日: | 2015-01-19 | 
| 公开(公告)号: | CN104573744B | 公开(公告)日: | 2018-07-20 | 
| 发明(设计)人: | 熊红凯;张晓鹏 | 申请(专利权)人: | 上海交通大学 | 
| 主分类号: | G06K9/66 | 分类号: | G06K9/66;G06K9/46 | 
| 代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 徐红银;郭国中 | 
| 地址: | 200240 *** | 国省代码: | 上海;31 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 类别识别 精细粒度 特征表达 检测器 定位问题 特征提取 姿态变化 尺度 平移不变性 定位目标 位置提取 物体表达 形变影响 学习训练 形变 有效地 聚类 互补性 精细 融合 检测 监督 | ||
本发明提出了一种精细粒度类别识别及物体的部分定位和特征提取方法,该方法较好地解决了精细粒度类别识别问题中物体的部分定位问题和特征表达问题。针对物体的部分定位问题,利用有监督学习训练一系列的部分检测器,考虑到定位目标的姿态变化以及形变影响,该方法仅仅检测形变较小的部分,并且利用姿态聚类方法对同一个物体部分训练不同的检测器,从而把物体的姿态变化考虑在内。针对物体或者部分的特征表达,该方法提出在多个尺度以及多个位置提取特征,然后融合这些特征用于最终物体表达,由此使得该特征具有一定的尺度以及平移不变性。本发明的物体部分定位以及特征表达间同时具有一定的互补性,从而能够有效地提高精细类别识别问题的精度。
技术领域
本发明涉及一种图像处理技术领域的方法,具体地说,涉及的是一种精细粒度类别识别方法,以及该识别问题中涉及的物体的部分定位和特征提取方法。
背景技术
精细粒度分类问题的目标是区分同一大类下的数以百计的多个子类别,比如说区分不同类别的花,鸟,狗等等。对于非专业人员来说,识别这些子类是非常困难的,精细粒度分类问题的提出解决了非专业人员识别这些相似子类的问题。用户只需要给定目标物体,通过精细类别识别方法,就可以返回目标物体的类别,进而可以获得该子类一系列特性。不同于一般类别识别问题(比如说区分车子和人),由于子类间的差异比较小并且高度局部化,区分这些子类是非常困难的。广泛应用于一般类别识别问题的空间金字塔模型由于不能捕获这种高度局部化的子类间差异,因而不能达到满意的识别结果。
经过对现有技术的文献检索发现,精细粒度分类问题的难点主要在两个方面,即部分定位以及图像描述。部分定位广泛采用的是P.Felzenszwalb在2010年《IEEETransactions on Pattern Analysis and Machine Intelligence》上发表的``Adiscriminatively trained,multiscale,deformable part model”,即可变形部分模型以及它的变种。该模型通过训练模板检测器寻找目标物体或者部分目标物体,并且考虑到了部分模型之间的几何相关性。然而,该模型仅仅对形变比较小的部分具有较好的检测效果,对形变比较大的部分,诸如鸟的翅膀,部分检测模型的性能很差。针对图像描述,大多采用D.G.Lowe在2004年发表在《International Journal of Computer Vision》上的``Distinctive image features from scale-invariant keypoints”,即尺度不变特征。然而,该特征仅仅是一些梯度信息的组合,独立于具体的数据集,不具备较好的区分能力。其他的特征诸如Krizhevsky在2010年发表在《Neural Information Processing Systems》上的``Imagenet classification with deep convolutional neural networks”,即卷及神经网络特征,该特征尽管是针对数据设计的语义丰富的特征,但却缺乏足够的尺度以及平移不变性。当检测的部分物体与真实位置有较大偏差时,该特征不能很好的克服这种平移变化。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种精细粒度类别识别及其物体的部分定位和特征提取方法,提高部分定位的精度以及特征表达的尺度不变性以及平移不变性,从而提高精细类别分类问题的识别精度。
本发明是通过以下技术方案实现的:
根据本发明的第一方面,提供一种物体的部分定位方法,是一种针对精细粒度分类的部分定位方法,该方法利用物体检测器和部分检测器检测目标物体以及它的形变较小部分,所述检测器是利用姿态聚类的有监督方法学习得到的,考虑到了物体或者部分的姿态变化;物体检测器和部分检测器是独立进行的,并返回每个检测器中得分高的检测区域作为候选,最终的检测结果通过校正物体和部分检测结果得到。
优选的,所述检测器是利用姿态聚类的有监督方法学习得到的,具体为:对于物体以及每一个部分,根据姿态聚集正例样本到一些混合模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510026025.3/2.html,转载请声明来源钻瓜专利网。





