[发明专利]基于尺度选择的自顶向下的视觉显著性提取方法有效
申请号: | 201210425652.0 | 申请日: | 2012-10-30 |
公开(公告)号: | CN102999763A | 公开(公告)日: | 2013-03-27 |
发明(设计)人: | 张瑞;仇媛媛;朱俊;付赛男;邹维嘉;朱玉琨 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 郭国中 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 尺度 选择 向下 视觉 显著 提取 方法 | ||
技术领域
本发明涉及的是一种视觉显著性的计算方法,特别涉及一种基于尺度选择的自顶向下的视觉显著性提取方法,属于视觉显著性领域。
背景技术
视觉注意是帮助人类视觉系统准确有效的识别场景的一种重要机制。获取图像中的显著区域是计算机视觉领域的一个重要的研究课题。它可以帮助图像处理系统在后续处理步骤中合理的分配计算资源。视觉显著区域提取被广泛的应用于很多计算机视觉应用当中,如感兴趣物体分割、物体识别、自适应图像压缩、内容敏感的图像缩放、图像检索等。
关于视觉显著性的检测分为两类:快速的、与任务无关的、数据驱动的自底向上的显著性检测和较慢的、与任务相关的、目标驱动的自顶向下的显著性检测。现有的视觉显著性检测方法大都是属于前一类的,通过计算各种形式的图像内容和场景的对比度来获得视觉显著性。本发明所涉及的是后一类。运用机器学习的方法学习模型来提取目标相关的显著区域,该方法可以应用于物体检测、物体识别等领域。自顶向下的视觉显著性检测方法主要有基于特征融合的方法和基于信息最大化原则的方法。
基于特征融合的方法主要是通过调整不同特征通道的权重值来获得自顶向下的显著性。Frintrop等人于2005年Pattern Recognition中提出了VOCUS系统:“Goal-directed search with a top-down modulated computational attention system”(Frintrop,S.,Backer,G.,Rome,E.:Goal-directed search with a top-down modulated computational attention system.In:Patter Recognition,Proceedings.LNCS,vol.3663,pp.117-124(2005))。在自顶向下模块里,学习阶段通过样本图片学习得到不同特征通道的权重值。在预测阶段,将不同特征加权得到最终的显著值。基于信息最大化原则的方法主要是通过判别式的方法突出来自目标的特征。Gao Dashan等人于2009年IEEE Transactions on Pattern Analysis and Machine Intelligence中提出了“Discriminant Saliency,the Detection of Suspicious Coincidences,and Applications to Visual Recognition”(Gao,D.,Han,S.,Vasconcelos,N.:Discriminant Saliency,the Detection of Suspicious Coincidences,and Applications to Visual Recognition.IEEE Transactions on Pattern Analysis and Machine Intelligence,vol.31,pp.989-1005(2009)),将自顶向下的显著性检测定义为一个二分类的问题。本方法同样将自顶向下的显著性检测定义为一个二分类的问题。
传统的基于局部特征的物体检测方法需要大量的扫窗,其扫窗的数量可能达到采窗数量的几倍甚至几十倍。如何有效地提取与目标相关的显著区域,并将之运用于物体检测,正是本发明要解决的问题。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种基于尺度选择的自顶向下的视觉显著性提取方法,该方法基于编码的图像分类框架进行视觉显著性提取,并且考虑了多尺度的上下文信息,避免了大量重复性的扫描,从而减小了时间复杂度。
为实现上述目的,本发明采用了以下技术方案:现有的大部分方法都是自底向上的,只与图像本身有关,而与人的意图无关。本发明提出的方法充分考虑人的意图,而且利用多尺度的上下文关系,能有效地提取出与人的意图相关的视觉显著的区域,并可以应用于物体检测等领域。本方法包括两个阶段,每阶段四步。训练阶段学习得到非线性模型,并找到多尺度合并中的最佳的尺度,用于显著值的计算。显著值计算阶段根据训练阶段得到的最佳尺度和非线性模型来提取显著图。
具体的,一种基于尺度选择的自顶向下的视觉显著性提取方法,包括两个阶段,每阶段四个步骤,即:
第一阶段:训练阶段
S1:对每幅图像进行稠密采窗,对每个窗提取特征描述符,特征描述符不限定于哪种特征,可以是颜色特征描述符,也可以是形状特征描述符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210425652.0/2.html,转载请声明来源钻瓜专利网。