[发明专利]基于层次聚类的图像检索方法无效
| 申请号: | 200810240361.8 | 申请日: | 2008-12-17 |
| 公开(公告)号: | CN101751439A | 公开(公告)日: | 2010-06-23 |
| 发明(设计)人: | 卢汉清;桂创华;刘静 | 申请(专利权)人: | 中国科学院自动化研究所 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 梁爱荣 |
| 地址: | 100080 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 层次 图像 检索 方法 | ||
1.一种基于层次聚类的图像搜索方法,其特征在于,包括步骤如下:
步骤1:用关键字文本搜索,对得到的与关键字相关的文档进行分析,提取与关键字相关的短语,对这些短语从语义层面上聚类,获得语义的聚类;
步骤2:对图像检索结果从视觉特征层面上聚类,获得图像内容的聚类;
步骤3:在搜索引擎检索结果显示界面的基础上,添加一个层次聚类导航栏,用于便捷高效的层次聚类导航显示。
2.根据权利要求1所述的图像搜索方法,其特征在于,从所述语义层面上聚类提取图像检索结果的相关短语特征,对于任何一个给定的关键字,先通过文本搜索引擎得到与关键字相关的文档;然后从这些文档中提取与关键字相关的短语,同时记录下文档中短语出现的频率、包含短语的文档比率、短语的长度信息;最后使用回归学习模型综合这些信息,转换为对这些短语相关性的评分,这样,前n个短语是要找的与关键字最相关的相关性短语。
3.根据权利要求1所述的图像搜索方法,其特征在于,从所述语义层面上聚类提取短语之间的相似性程度,使用基于k-line的方法进行聚类,对短语之间的相似性程度NGD(x,y)用如下公式来衡量:
NGD(x,y)=(max{logf(x),logf(y)}-logf(x,y))/(logN-min{logf(x),logf(y)})
其中f(x)和f(y)分别表示单独用短语x或者y在Google搜索引擎中检索返回的结果页数,f(x,y)表示将短语x和y一起放到Google搜索引擎中检索返回的结果页数,两个短语越相似联合出现的概率越大,相似性程度NGD(x,y)越小,这样再使用基于K-line的方法聚类就能把相关性很大的短语聚集到一组中来,形成一个主题,就能够按照主题的重要性分类显示给用户,让用户方便找到自己需要的信息。
4.根据权利要求1所述的图像搜索方法,其特征在于,从所述视觉特征层面上的聚类是在语义聚类的基础上进行,首先检索得到与每个短语相关的图像,然后提取他们的视觉特征,并计算得到各图像之间的相关性,最后利用这些信息进行图像内容的聚类。
5.根据权利要求1所述的所述的图像搜索方法,其特征在于,所述高效的层次聚类导航显示,在传统搜索引擎检索结果显示界面的基础上,添加一个层次聚类导航栏,这个导航栏将与关键字相关的图像检索结果按照主题的重要性、按照视觉层面上的相关性,分门别类的显示给用户。这样的外观结构让用户很容易就聚焦到自己感兴趣的主题和自己需要的视觉效果上,帮助用户快速、高效地从主题混叠的检索结果中找到自己所需要的目标图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810240361.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种牡荆素鼠李糖苷的制备方法
- 下一篇:一种水飞蓟素的制备方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





