[发明专利]基于逆向k近邻的图像搜索中高质量相关样本自动选取法有效

申请号：	201410503500.7	申请日：	2014-09-26
公开（公告）号：	CN104268227B	公开（公告）日：	2017-10-10
发明（设计）人：	冀中;于云龙	申请（专利权）人：	天津大学
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	天津市北洋有限责任专利代理事务所12201	代理人：	杜文茹
地址：	300072***	国省代码：	天津;12
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于逆向近邻图像搜索中高质量相关样本自动选取
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及一种在多媒体信息检索中自动选取高质量相关数据的方法。特别是涉及一种基于逆向k近邻的图像搜索中高质量相关样本自动选取法。

背景技术

目前，借助于文本搜索中的成熟技术，常用的商业搜索引擎已经能较好地解决海量文本的搜索问题。目前的视频和图像搜索技术主要也是通过索引和搜索其相关的文本信息，但是，“一幅图像胜过千言万语”，有限的文本信息不足以全面充分地描述图像丰富的视觉内容，因此基于文本的搜索结果往往不尽如人意,在搜索引擎返回的结果中，一些不相关或者相关度低的图像经常被排在搜索结果的前几位，图像和其文本信息之间的误匹配会造成一些不相关的图像错误地被返回；由于仅依赖于文本信息无法区分图像的相关程度，所以一些相关性较低的图像被返回给用户。为了解决基于文本的视频和图像搜索存在的缺点，一个可能的解决办法是基于内容的图像检索，该方法完全不用文本描述信息，只依赖于图像视觉信息，比如颜色，纹理，边缘等。该方法的缺点是要求用户提供图像样本实例，在web图像搜索中，用户更趋向于用关键字来进行搜索，而且通常情况下图像样本实例很难获得。

综上所述，针对文本和基于内容的搜索排序技术各有优缺点，如何解决他们各自存在的问题并利用他们各自的优点是重排序技术面临的一个挑战，目前一个成功的解决方案是先用基于文本的搜索方法快速从大规模的数据库中返回一个初始的查询结果，然后在初始查询结果的数据集上(规模小很多)充分利用图像的内容信息来重新排序得到一个更好的结果，该方法称作视觉搜索重排序技术，即：利用视觉信息改进初始查询结果的过程。

搜索重排序技术的性能与提供的训练样本的个数及质量有关。在训练排序模型时，相关样本的数目越多、质量越高，系统能够得到的用户查询意图信息就越丰富，重排序的性能就越好。反之重排序的效果就不尽如人意。这就是所谓的搜索系统和用户之间存在的“意图鸿沟”(Intent Gap)。常用的解决方法是引入相关反馈(Relevance Feedback)，以明确用户的特定搜索意图，返回用户需求的结果。

当前利用反馈技术进行重排序的方法大体分为三种：(1)显式的相关反馈技术：从初始的查询结果中手动地挑选出一些相关样本，这种方法通过与用户的交互来提高重排序的性能，具有一定局限性，例如Culetal等提出了IntentSearch模型，该模型允许用户从初始的搜索结果中挑选一幅图像作为正例，然后通过计算其它图像与这幅图像的相似性进行重排序，但是由于语义鸿沟的存在，很多情况下很难用一幅图像完整表达用户的搜索意图，尤其在搜索意图比较复杂的情况下。Tian等提出了主动重排序，该方法通过与用户交互不断地学习用户的真实搜索意图。(2)隐式的相关反馈技术：与显式的反馈相比，隐式的反馈技术不需要和用户进行交互，但容易受噪声的干扰。如Liu等提出了伪相关反馈模型，该模型基于初始的排序结果的前N幅图像是相关的这一假设，选取出前N幅图像样本建立模型，重新进行排序。这种方法简单，并且不需要和用户进行交互，但因为噪声的影响，效果并不是很理想。(3)点击数据：通过用户点击(Click-through)数据进行重排序的方法得到广泛关注，如Hua等利用用户的点击次数来缩小语义和意图之间的“意图鸿沟”，这种方法认为用户点击图像的次数为用户感兴趣的图像，也就是相关样本。如果一幅图像点击次数越多，就认为这幅图像与用户的查询意图越接近。但现实中，用户的点击次数的信息并不容易获得。

传统的伪相关反馈是基于初始的排序结果的前N幅图像都是相关的这一假设，选取出前N幅图像样本建立模型，重新进行排序。但初始排序结果的前N幅图像中有很多噪声，即有不相关样本的存在，受噪声的干扰，重排序的性能会受很大的影响。

发明内容

本发明所要解决的技术问题是，提供一种基于逆向k近邻的图像搜索中高质量相关样本自动选取法，只需要一次反馈，而且该次反馈只需标注一个相关样本，就可以自动找到足够多的高质量伪相关样本，不仅简单实用，还保证了重排序技术的性能。

本发明所采用的技术方案是：一种基于逆向k近邻的图像搜索中高质量相关样本自动选取方法，包括如下步骤：

1)在搜索引擎中输入查询关键词，得到初始的基于文本的搜索结果；

2)从初始的排序结果中标注相关样本，取出初始排序结果中排在前N幅图像样本作为待选样本集，其中N是大于1的整数；

3)利用逆向k近邻方法从待选样本集中挑选出与所有已挑出的相关样本都相似的样本作为相关样本；

4)利用所挑选的相关样本和学习得到的相关样本建立训练排序模型；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于天津大学，未经天津大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201410503500.7/2.html，转载请声明来源钻瓜专利网。