[发明专利]一种图像检索中基于文本的查询扩展与排序方法无效

专利信息
申请号: 201010184725.2 申请日: 2010-05-12
公开(公告)号: CN101901249A 公开(公告)日: 2010-12-01
发明(设计)人: 张玥杰;金城;薛向阳;岑磊;彭琳 申请(专利权)人: 复旦大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 上海正旦专利代理有限公司 31200 代理人: 包兆宜
地址: 20043*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 图像 检索 基于 文本 查询 扩展 排序 方法
【说明书】:

技术领域

发明属于多媒体信息检索领域,涉及一种特定媒体-图像的检索方法,具体涉及一种在图像检索中实现基于义类词典的查询扩展与排序的方法。该方法可用于配合基于内容的图像检索方法,提高图像搜索质量,改善用户搜索体验。

背景技术

近年来,随着Internet和社会信息化的发展,数字图像的容量正快速增长,每天都有海量的图像数据产生。如何快速而准确地查找、访问图像,并有效利用这些图像成为迫切需要解决的问题,这就是所谓的图像检索技术。最早主要采用基于文本的图像检索技术(Text-based Image Retrieval,TBIR);20世纪90年代以来,基于内容的图像检索(Content-based Image Retrieval,CBIR)的研究与应用得到长足的发展,进而又发展出基于语义的图像检索、基于反馈的图像检索以及基于知识的图像检索[1]。TBIR作为一种早期的技术,十分依赖于图像的标注结果,这是受限之处所在,但是基于文本的检索作为一种较为成熟的技术,其快速可靠的特点至今仍然十分突出。因此,TBIR仍然是一个值得研究的方面,如果能吸取其他方法的一些特点或是和其他几种方法交互使用,可以有不错的效果。

从图像数据本身来看,可分为两类。一类具有相关的文本说明信息,如新闻图像,通常记者在发回图像的同时附有简短的文字描述;而另一类则是无文字说明。对于“具有文本说明信息”的图像库,一般检索系统都是从图像的文本说明中提取关键词作为索引来实现图像检索。由于多年来针对文本检索的研究已取得不少成果,与单纯基于图像底层特征的检索系统相比,这类图像检索系统往往能更好地支持基于高级语义的检索。但是,有关图像的文本说明是图像作者从自身的理解与喜好角度出发对图像所做的简短描述,与针对检索目的对图像所进行的标注信息不同,则两者所描述的内容也必然存在差异。因此,从文本说明中提取出的关键词不同于专门用于检索目的的手工标注的关键词,不仅导致查准率下降,而且可能返回用户许多不相关的查询结果,使用户无所适从[2]。同时,在图像检索应用中,用户的真实信息需求到用户提交的查询请求之间、以及查询请求到系统理解的查询请求之间存在一定的偏差。这些偏差导致查询出来的相关图像与用户查询之间、乃至用户希望得到的信息之间存在不匹配。通过查询扩展优化用户查询,更准确、客观地表达用户的查询需求,帮助用户快速准确地获得所需要的信息,已经成为信息检索领域,特别是图像检索领域的重要研究热点[3,4]

目前的查询扩展方法大致可分成三类,即基于义类词典、基于全局分析以及基于局部分析[5,6,7]。基于义类词典的方法一般借助于语义知识词典[8,9,10],选择出与查询用词存在一定语义关联性的词来进行扩展,选择的依据通常为词之间的上下位关系与同义关系等[11,12,13,14,15,16]。该方法依赖于完备的语义体系,独立于待检索对象集[17,18,19]。基于全局分析的方法其基本思想是对全部检索对象中的词或者词组进行相关分析,将与查询用词关联程度最高的词或者词组加入初始查询以生成新的查询[20]。该方法虽然可以最大限度地探求词间关系,但在检索对象集合改变后的更新代价巨大,而且随着检索对象集合规模的递增在时空代价上也会存在不可行性。而基于局部分析的方法为两阶段查询,也就是首先对使用者的初始查询做第一次检索,根据检索结果选取前N个检索对象进行分析,找出其中重要性较高的词,与初始查询组成新的查询,然后利用新的查询进行第二次检索[20]。该方法容易存在“查询漂移”问题,当第一次检索结果不佳时,可能会选择与查询主题不相关的词而加入至初始查询,会严重降低查询精度,甚至低于未做查询扩展的情形。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010184725.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top