[发明专利]一种复杂场景的显著区域检测方法有效

专利信息
申请号: 201110163787.X 申请日: 2011-06-17
公开(公告)号: CN102184557A 公开(公告)日: 2011-09-14
发明(设计)人: 李永杰;杨盼;李朝义 申请(专利权)人: 电子科技大学
主分类号: G06T7/60 分类号: G06T7/60;G06K9/46
代理公司: 电子科技大学专利中心 51203 代理人: 周永宏
地址: 611731 四川省成*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 复杂 场景 显著 区域 检测 方法
【说明书】:

技术领域

发明属于计算机视觉技术领域,特别涉及一种复杂场景的显著区域检测方法。

背景技术

面对各类信息的超大膨胀速度,如何有效的组织和管理这些多媒体信息,并从中检测出自己所需要的信息成为当前迫切需要解决的问题。我们希望能够模拟人类的视觉处理机制从大量、冗余、并且内容解释多义的复杂场景数字图像数据中快速、准确地提取这些关键区域,大大提高分析和处理图像的效率和准确度。Itti和Koch基于视觉注意机制提出了一种经典的显著检测模型——Itti模型,参见文献:L.Itti,C.Koch,E.Niebur,Amodel of saliency-based visual attention for rapid scene analysis,Pattern Analysis and Machine Intelligence,IEEE Transactions on,1998,Vol.20(11),1254-1259。这个模型利用了金字塔分层、中央-周边算子以及Winner-Take-All(WTA)机制等,在一些单一目标的场景图像上有一定程度的效果,但也存在很多的不足之处,比如过多参数需要手动置,对复杂场景图像的检测效果较差,并且显著性度量完全依靠图像的局部信息,由于细节信息的能量比较低,没有充分考虑整幅图像的细节信息,并且检测效果与人眼的观测结果不一致。

发明内容

本发明的目的是为了解决现有的Itti模型对复杂场景图像中的显著区域提取时存在的缺陷,提出了一种复杂场景的显著区域检测方法。

本发明的技术方案是:一种复杂场景的显著区域检测方法,包括如下步骤:

S1.小波变换:对输入图像进行小波变换,获得高频成分矩阵和低频成分矩阵;

S2.建立多尺度图像:分别对输入图像、高频成分矩阵和低频成分矩阵建立多尺度图像,分别得到输入图像的多尺度图像、高频成分矩阵的多尺度图像和低频成分矩阵的多尺度图像;

S3.特征提取:从步骤S2得到的输入图像的多尺度图像提取两个颜色特征金字塔,从步骤S2得到的高频成分矩阵的多尺度图像提取高频强度特征金字塔以及四个方向高频特征金字塔,从步骤S2得到的低频成分矩阵的多尺度图像提取低频强度特征金字塔以及四个方向低频特征金字塔;

S4.特征叠加:对得到的12个特征金字塔分别进行中央-周边操作和规范化,得到12个子特征金字塔,对12个子特征金字塔分别进行叠加,得到12个特征图,对得到的12个特征图进行规范化,然后对规范化后的12个特征图进行叠加,得到一幅显著图。

本发明的有益效果:本发明基于人类大脑视觉信息处理机制,在现有的Itti模型基础上提出了一种复杂场景的显著区域检测方法。本发明的方法通过利用离散小波变换将图像信息分解分为高频成分矩阵和低频成分矩阵,然后建立多尺度图像,再从中提取强度特征金字塔以及方向特征金字塔,最后整合成为一幅显著图。由于考虑了图像的细节信息,较好的提高了细节检测的效果,并且检测效果与人眼的观测结果相一致,更加符合人眼的视觉特性。

附图说明

图1是本发明显著图检测方法的流程示意图。

图2是本发明的方法对一幅自然图像检测的显著图与经典模型检测作比较的结果图。

具体实施方式

下面结合附图和具体的实施例对本发明做进一步的阐述。

本发明以人类视觉系统和小波分析为基础,人类视路中很可能存在对图像空间频率非常敏感的视觉频率通道,每一个频率通道就是一个带通滤波器,依次对高低不同的频率分量敏感,帮助视觉系统认知的几乎所有频率成分。而小波变换是一种多分辨率多通道分析信号局部变化的常用工具,使用不同尺度不同截止频率的一组带通滤波器,图像可以被分解成不同带宽频率的系数,这与人类视觉系统的多通道滤波模型理论一致,并且这组小波滤波器的带宽在对数尺度下是相同的,这与人类视觉通路按对数特性变换也是一致的。小波变换可以用不同的分辨率聚焦到原图像不同的独立频带与不同空间方向内的任意细节,因此具有良好的方向选择特性,由于人眼视觉系统在响应频带与空间方向选择上敏感性不同,因而更加符合人眼的视觉特性。

为此本发明将图像经小波变换后,其高频部分代表细节,对高频成分采用逐渐精细的时域或空域取样,从而可以聚焦对象的任意细节,具有较强的空间位置和方向选择性,并且能捕捉对应于空间和频率的局部结构信息,而低频部分表示物体的总体形状。然后再从这些高频和低频成分以及原图像中提取特征,得到显著图,最终对显著值进行加权得到最后结果。下面以一副自然图像的显著检测进行具体说明。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110163787.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top