[发明专利]基于随机扫视图稀疏信号重构的图像关注区域检测方法有效

专利信息
申请号: 201510185348.7 申请日: 2015-04-20
公开(公告)号: CN104778704B 公开(公告)日: 2017-07-21
发明(设计)人: 李甲;陈小武;赵沁平;夏长群 申请(专利权)人: 北京航空航天大学
主分类号: G06T7/10 分类号: G06T7/10
代理公司: 北京科迪生专利代理有限责任公司11251 代理人: 杨学明,贾玉忠
地址: 100191*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 随机 视图 稀疏 信号 图像 关注 区域 检测 方法
【说明书】:

技术领域

发明涉及计算机视觉关注和图像场景理解领域,具体地说是基于随机扫视图稀疏信号重构的图像关注区域检测方法。

背景技术

当人在察看图片或视频序列时,总是会存在特定的视觉刺激引起令人印象深刻的关注。正因此如,在开展复杂的图片分割和认知任务之前锁定图片中显著性的内容是非常重要的。这样一来,有限的计算资源可以更优先的分配给视觉显著的内容,这也是和人类处理图像视频的方式是一致的。

在过去二十年里,大量根据心理和神经生物学理论(如引导搜索模型或者特征整合理论)的显著计算模型已被提出。在讨论这些计算模型之前,我们先来了解这样一个基本的问题:如何生成一张图像的真实显著图?在人眼追踪实验中,图像的真实显著图是由多个观察者在自由察看图像的过程中收集视点形成视点密度图。也就是说,这些观察者都要求对同一幅图像自由察看几秒钟,观察者的眼球活动,比如扫视、追视或者固视,都会被高速的眼动追踪设备(比如30赫兹、60赫兹或者240赫兹)记录下来。最终,一个捕获人眼视点并且停留较长时间的位置认为是显著的。仔细分析这个过程,我们可以将生成图像真实显著图的过程简化为二个步骤:一是人眼迅速在整张图像的不同位置快速扫过;二是对锁住视点的位置分析其停留时间并进行内容认知。在整个过程中,某位置的视觉显著性和该位置被察看的概率以及能锁住视点的概率息息相关。

了解图像真实显著图的生成过程之后,我们现在来分析现存的预测人眼视点的显著计算模型。在这些方法中,有一个共同的解决办法就是在单尺度或者多尺度上将图像分成若干个不重叠的图像宏块,然后再计算每一个图像宏块的显著性。其中计算的准则是衡量每一个图像块中视觉上下文内容的局部或全局稀有性。图像块的稀有性可以通过计算局部对比度得到,或者通过视觉刺激性、察看时间的长短、熵率、同现频率等方式计算。有一些方法将图像转换到频域并通过谱分析来衡量图像块的稀有性。此外,通过多个特征通道来计算图像块的稀有性也是一种有效的方法,一些研究人员因此提出了通过启发式框架或者从特征到显著性的映射函数来联合多种特征来计算图像块的显著性。总的来说,这些方法都取得了不错的显著性结果,但存在两大缺点,第一,这些方法都只考虑了图像块内的局部或全局上下文内容,但是在生成真实显著图的过程中,每一次视点转换时,某一个图像块都是连同其他图像块一起出现的;第二,这些方法中的图像块都是固定大小的,但是实际扫视过程中视点常常会落在比较大的区域上。因此,为了构建一个符合生理性机制的显著计算模型,这两个问题是必须要解决的。

发明内容

根据上述需求,为了克服现有技术的不足,本发明的目的在于:提供基于随机扫视图稀疏信号重构的图像关注区域检测方法,该方法通过引入稀疏编码理论来计算图像的视觉显著性,使其更符合生理学机制。为完成发明目的,本发明采用的技术方案是:基于随机扫视图稀疏信号重构的图像关注区域检测方法,该方法包含以下步骤:

步骤(1)对图像自由察看,构造出多个随机扫视图,并在扫视端点处得到圆形观测区域;

步骤(2)对训练数据集进行预处理,得到大量图像块,提取其稠密特征,求解稀疏基元构建的稀疏字典;

步骤(3)利用稀疏字典,对测试图像的图像块求解其稀疏表示,计算得到稀疏基元激活代价和稀疏信号重构误差,综合这两个影响因子,求解出每一次扫视时视点在圆形观测区域内的停留时间;

步骤(4)利用稀疏基元激活代价和稀疏信号重构误差以及求解出的视点停留时间,计算得到每一个图像块的显著度,综合所有图像块的影响,得到整张图的图像度;构建图像金字塔,得到最终的图像显著图。

进一步地,对图像自由察看时,人眼会在图片的不同位置快速转移以至于能对输入的刺激信号重构出意象图。在此过程中,某些特定位置会锁定人眼视点更长的停留时间,因此该位置也会变得更加显著。因为在眼球运动时视觉处理过程是阻塞的,也即是所谓的扫视掩蔽,因此我们忽略在扫视过程中的扫视路径,只关注扫视端点。每一次扫视之后,在扫视端点处生成随机大小的圆形区域,用来决定哪一些视觉刺激能够进入到我们的视网膜。在随机扫视图像时,并不是以逐个像素的方式认知图像中的视觉内容,相反地,每一个扫视端点的圆形观测区域内的视觉刺激同时进入到视网膜。此外,经过某次随机扫视之后我们计算出某一位置的视觉辨别能力。

为求解稀疏字典,先对彩色图像数据集采样出大量非重复图像块,并对每一个图像块在LAB颜色空间上提取出稠密特征。得到所有图像块的稠密特征表示之后,给定每一个图像块的稀疏表示最多只有有限个稀疏基元被激活的条件下,稀疏字典可通过最大化其信号重构能力而学习得到。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510185348.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top