[发明专利]基于层次聚类的图像检索方法无效

专利信息
申请号: 200810240361.8 申请日: 2008-12-17
公开(公告)号: CN101751439A 公开(公告)日: 2010-06-23
发明(设计)人: 卢汉清;桂创华;刘静 申请(专利权)人: 中国科学院自动化研究所
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 中科专利商标代理有限责任公司 11021 代理人: 梁爱荣
地址: 100080 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 层次 图像 检索 方法
【说明书】:

技术领域

发明属于图像处理技术领域,涉及一种基于层次聚类的图像检索方法。

背景技术

随着互联网应用的普及和数字媒体技术的发展,图像作为信息传递的最重要载体,已经深入到人们日常生活的方方面面。每天都会有数以GB甚至TB的图像涌入互联网,如何对这些图像进行有效的组织和管理,让用户快速、准确的找到所需要的信息成为目前亟需解决的一大难题。

传统的图像搜索引擎如Google、Yahoo等,大都依据网络图像的相关文本信息与查询关键词的相关程度,经过排序,将检索结果呈现给用户。然而,由于关键字的多义性,检索结果中通常包含多个主题并且他们交互混叠在一起。如图1为关键字“apple”在Google图像搜索引擎中的前16个结果,与“apple””相关的词有“apple computer”、“apple fruit”、“applelogo”、“apple iPod”、“apple phone”等等。从这些主题混合的结果列表中找到自己需要的内容,将是一项费时费力的工作。

发明内容

本发明要解决的问题:是找到一种能自动对检索结果进行主题归类的方法,让用户方便找到自己需要的信息,为此,本发明的目的是提供一种基于层次聚类的图像检索方法。

为达成所述目的,本发明提供的基于层次聚类的图像检索方法,包括步骤如下:

步骤1:用关键字文本搜索,对得到的与关键字相关的文档进行分析,提取与关键字相关的短语,对这些短语从语义层面上聚类,获得语义的聚类;

步骤2:对图像检索结果从视觉特征层面上聚类,获得图像内容的聚类;

步骤3:在搜索引擎检索结果显示界面的基础上,添加一个层次聚类导航栏,用于便捷高效的层次聚类导航显示。

本发明的实施例,从所述语义层面上聚类提取图像检索结果的相关短语特征,对于任何一个给定的关键字,先通过文本搜索引擎得到与关键字相关的文档;然后从这些文档中提取与关键字相关的短语,同时记录下文档中短语出现的频率、包含短语的文档比率、短语的长度信息;最后使用回归学习模型综合这些信息,转换为对这些短语相关性的评分,这样,前n个短语是要找的与关键字最相关的相关性短语。

本发明的实施例,从所述语义层面上聚类提取短语之间的相似性程度,使用基于k-line的方法进行聚类,对短语之间的相似性程度NGD(x,y)用如下公式来衡量:

NGD(x,y)=(max{logf(x),logf(y)}-logf(x,y))/(logN-min{logf(x),logf(y)})

其中f(x)和f(y)分别表示单独用短语x或者y在Google搜索引擎中检索返回的结果页数,f(x,y)表示将短语x和y一起放到Google搜索引擎中检索返回的结果页数,两个短语越相似联合出现的概率越大,相似性程度NGD(x,y)越小,这样再使用基于K-line的方法聚类就能把相关性很大的短语聚集到一组中来,形成一个主题,就能够按照主题的重要性分类显示给用户,让用户方便找到自己需要的信息。

本发明的实施例,从所述视觉特征层面上的聚类是在语义聚类的基础上进行,首先检索得到与每个短语相关的图像,然后提取他们的视觉特征,并计算得到各图像之间的相关性,最后利用这些信息进行图像内容的聚类。

本发明的实施例,所述高效的层次聚类导航显示,在传统搜索引擎检索结果显示界面的基础上,添加一个层次聚类导航栏,这个导航栏将与关键字相关的图像检索结果按照主题的重要性、按照视觉层面上的相关性,分门别类的显示给用户。这样的外观结构让用户很容易就聚焦到自己感兴趣的主题和自己需要的视觉效果上,帮助用户快速、高效地从主题混叠的检索结果中找到自己所需要的目标图像。

本发明的有益效果:本发明与传统图像搜索引擎不同,是将聚类思想融入到图像检索中来。对关键字进行语义解析,形成不同的主题;同时对图像从视觉特征上加以分析,将相近的图像聚在一个类中,最后通过简洁清晰的界面分门别类地将检索结果显示给用户,从而帮助用户快速、有效地从主题混叠的检索结果中找到自己所需要的目标图像。

附图说明

图1现有技术关键字“apple”在谷歌Google图像搜索引擎中的前16个结果;

图2为本发明整体构架流程图;

图3为本发明提取关键字的相关短语的流程图;

图4系统用户交互界面;

图5“macbook pro”的视觉聚类显示;

图6本发明与微软IGroup系统和谷歌系统Google对比效果;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200810240361.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top