[发明专利]一种基于视觉显著性融合的图像检索方法在审
申请号: | 201710479300.6 | 申请日: | 2017-06-22 |
公开(公告)号: | CN107357834A | 公开(公告)日: | 2017-11-17 |
发明(设计)人: | 白琮;陈佳楠;黄玲;郝鹏翼;陈胜勇 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/46;G06K9/62;G06T7/136;G06T7/194 |
代理公司: | 杭州斯可睿专利事务所有限公司33241 | 代理人: | 王利强 |
地址: | 310014 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 视觉 显著 融合 图像 检索 方法 | ||
技术领域
本发明涉及一种图像检索方法,特别涉及一种基于视觉显著性融合的图像检索方法,属于基于内容的图像检索领域。
背景技术
随着多媒体技术的发展,数字图像的数量呈现了几何级的增长。如何在浩繁的图像资源中快速准确的查找出用户请求的资源也摆在了人们面前。
基于内容的图像检索技术允许用户输入一张图片以查找具有相同或是相似内容的其他图片,它代表了图像检索技术的主流发展趋势。
Josef Sivic等人于2006年提出了词袋模型。其核心思想是在整幅图像中检测一些关键点,然后提取这些关键点的局部特征,之后这些局部特征被量化为“视觉词”。这样每幅图像都可以表示成关于“视觉词”的特征向量。之后就可以借鉴文本检索的成熟技术,应用可扩展的索引及快速搜索技术完成检索。
词袋模型具有简单及可以利用文本检索成熟技术等特点,但是同时具有一定的缺陷。因为一幅图像中可能包含了前景目标和背景两部分,如果在整幅图像中进行特征提取容易造成主体目标不够明确,次要目标特征显著于前景目标等结果,这样会大大影响图像检索的结果。
图像显著性是图像中重要的视觉特征,体现了人眼对图像的某些区域的重视程度。自从1998年Itti的工作以来,产生了大量的显著性映射方法,图像显著性也广泛应用于图像压缩、编码、图像边缘和区域加强、显著性目标分割和提取等。图像显著性分析应用广泛,主要包括:基于视觉显著性区域的自适应图像压缩和编码,基于视觉显著性度量的图像边缘或区域加强,基于视觉显著性分析的目标分割或提取等。
发明内容
为了克服现有图像检索方法的分割效果较差、检索性能较低的不足,本发明提供一种分割效果较好、检索性能较高的基于视觉显著性融合的图像检索方法,利用显著性融合算法将不同的显著性模型融合起来,能够提升图像分割的效果,进而提高图像检索的性能。
本发明的目的是通过下述技术方案实现的。
一种基于视觉显著性融合的图像检索方法,检索对象为彩色图像,所述图像检索方法包括训练过程和测试过程;
所述训练过程包括步骤一至步骤四:
步骤一、建立视觉词汇字典:依次对训练图像集中的每张图像进行分析处理,为后续检索建立一个视觉词汇字典;
步骤二、利用图像的视觉显著性特征融合算法得到视觉显著性图,再根据显著图分割得到图像的前景目标图和背景区域图;
步骤三、对前景目标图和背景区域图分别提取图像的色彩特征和纹理特征;
步骤四、在步骤一的操作基础上,统计数据库中每张图片的视觉词汇分布直方图;
所述测试过程包括步骤五;
步骤五、对测试图像进行检索,过程如下:
步骤5.1:对测试图像用步骤二所述方法分割得到前景目标图和背景区域图;
步骤5.2:对测试图像用步骤三所述方法提取测试图像前景目标图和背景区域图的色彩特征和纹理特征;
步骤5.3:对测试图像用步骤四所述方法统计前景目标图和背景区域图的视觉词汇统计直方图;
步骤5.4:将测试图像按照步骤5.1,步骤5.2和步骤5.3得到的每个特征依次与训练图像集中的每张图像的对应特征进行距离度量;
步骤5.5:对步骤5.4所得的每种特征的距离度量进行累加,得到总距离,用D1,D2,…Di表示,其中i代表训练图像集中的图像数量;
步骤5.6:针对训练图像集中的每张图像,按照D1,D2,…Di从小到大的顺序对训练图像排序并输出;
经过上述步骤的操作,即可实现对测试图像的检索。
进一步,所述步骤5.4中,距离度量采用的方法是余弦距离。
再进一步,所述步骤一中,建立视觉词汇字典的过程为:
步骤1.1:将彩色图像转换成灰度图像。
步骤1.2:在步骤1.1得到的灰度图像上获取训练图像集中的每张图像的特征向量表示集,用Fm表示,其中F1、F2、……Fm分别表示一张图像的特征向量表示集,m表示训练图像集中图像的数目;所述特征向量是多维的,其维度用N表示,N>2;
所述获取训练图像集中的每张图像的特征向量表示集的方法为SIFT算法;
步骤1.3:对于步骤1.2得到的特征表示集中的特征向量进行聚类并获取每个特征类别的代表特征向量,得到K个类别,K个代表特征向量,K为正整数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710479300.6/2.html,转载请声明来源钻瓜专利网。