[发明专利]基于频谱特征分析的图像重复检测方法有效
| 申请号: | 200710304207.8 | 申请日: | 2007-12-26 |
| 公开(公告)号: | CN101470730A | 公开(公告)日: | 2009-07-01 |
| 发明(设计)人: | 胡卫明;李玺;吴偶 | 申请(专利权)人: | 中国科学院自动化研究所 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06T7/00 |
| 代理公司: | 中科专利商标代理有限责任公司 | 代理人: | 周国城 |
| 地址: | 100080北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 频谱 特征 分析 图像 重复 检测 方法 | ||
技术领域
本发明涉及计算机应用技术领域的多媒体检索技术,是一种基于频谱特征分析的图像重复检测方法。
背景技术
随着多媒体技术和计算机网络的飞速发展,全世界包括数字图像、音频、视频在内的多媒体数据正在以惊人的速度进行增长。特别是图像数据,由于其直观、内容表达丰富、可以进行个性化编辑等因素,非常受到用户的青睐。但是,每天新生成的海量级的图像数据,由于其巨大的冗余性,无情地吞噬了我们有限的存储空间,并且淹没了很多有用的信息,从而给用户的图像数据搜索带来了很大的麻烦。如何才能使用户有效地利用信息并对所需多媒体资源的快捷定位、方便获取以及有效管理已经是一个亟待解决的问题,特别是那些为用户服务的互联网搜索公司以及个性化数据供应商更是希望能够低成本地维护和更新图像数据库。然而,目前诸如google、yahoo以及百度等成熟的商业图像搜索引擎几乎都是用文本来索引图像的,这样就会导致在数据库出现大量的文本索引不同而内容几乎一样的图像,从而占用了大量的宝贵的存储空间;更严重的是,用户检索服务的质量会严重下降,因为检索出来的图像存在很大的重复性,直接会影响用户的使用心情,造成用户的不满。因此,图像数据库中的重复检测问题显得尤为重要,然而重复检测问题的核心是图像表达。只要数据库中的图像索引做得好,就能有效地进行图像重复检测。
图像表达的本质是寻找一个合适的特征映射函数,该函数能够将图像映射到一个不仅类内相似度高而且类间相似度也低的高维空间。在图像表达研究领域,大致存在两种类型的特征映射函数,它们分别是基于底层视觉特征和高层语义特征,我们称它们为底层特征映射函数和高层语义特征映射函数。底层特征映射函数主要是获得图像的一些底层信息,这些信息主要包括颜色、纹理、梯度等。该函数的主要优点是操作方便,灵活度高,计算复杂度低等,其主要缺点是缺乏图像的高层语义信息。相比之下,高层语义特征映射函数主要是获得图像里的存在的目标或者整个图像场景的语义信息,其主要优点是能够有效进行图像理解,从而较准确地表达图像,但是,其主要的缺点是计算复杂度高,需要设定参数较多,灵活度低,不能够被大规模地使用。综合以上两种映射函数的优缺点以及图像数据库重复检测问题本身的特性,我们决定采用底层特征映射函数去捕获图像信息,其主要原因如下:(1)图像数据库的规模比较大,对计算复杂度的要求非常严格;如果采用高层语义特征映射函数的话,数据库维护和更新的代价非常巨大。(2)图像重复检测这个问题本身对图像内容表达的要求不高。通常,两幅重复的图像是可以通过一些变换进行相互转换的,这些变换主要包括平移、旋转以及尺度,且其变换幅度非常小。底层特征映射函数完全可以处理以上这些变换所造成的影响。(3)底层特征映射函数灵活度高,易于计算机处理;而高层语义特征映射函数正好相反,它受到诸多因素的限制,需要事先设置很多的经验参数,不利于计算机处理。于是在这种背景下,我们提出了一种融合图像颜色和梯度信息的特征。在该特征中,图像颜色信息是通过图像的频谱来体现的,而图像梯度信息主要是通过图像梯度方向直方图的频谱来体现的。在以下几个部分,我们将详细介绍该特征。
发明内容
本发明提出了一种基于频谱特征分析的图像重复检测方法,这种方法采用了集成了图像颜色和梯度信息的图像索引,,应用于图像重复检测领域。
本发明提出的基于频谱分析的图像重复检测方法,包括:
采用下采样模块对图像进行下采样,用于缩短图像频谱分析的计算时间;
采用频谱分析模块对图像进行频谱分析,用于提取下采样后的图像的低频谱信息,得到图像像素的颜色信息;
采用频谱分析模块对图像进行梯度信息分析;用于获取下采样后的图像梯度分布特征;
采用索引生成模块融合图像颜色和梯度信息,作为图像索引;
以图像索引为依据,检测图像是否重复。
进一步,所述下采样后的图像的低频谱信息包括旋转、平移以及尺度不变。
进一步,所述下采样后的图像梯度分布特征具有旋转、平移以及尺度不变的性质。
进一步,所述频谱分析步骤包括:
对图像进行傅立叶变换,获取其幅度谱;
对幅度谱进行对数极坐标映射形成一幅新的图像;
对这幅新的图像进行傅立叶变换,获得幅度谱;
仅保留低频谱信息,用来刻画图像颜色分布的特征。
进一步,所述梯度信息分析步骤包括:
提取图像每一个像素的梯度,统计所有像素的梯度方向;
将方向空间量化为n个等级;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710304207.8/2.html,转载请声明来源钻瓜专利网。





