[发明专利]一种实现图像搜索排序的方法和装置在审

专利信息
申请号: 201410203700.0 申请日: 2014-05-14
公开(公告)号: CN103995857A 公开(公告)日: 2014-08-20
发明(设计)人: 陶哲 申请(专利权)人: 北京奇虎科技有限公司;奇智软件(北京)有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京润泽恒知识产权代理有限公司 11319 代理人: 苏培华
地址: 100088 北京市西城区新*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 实现 图像 搜索 排序 方法 装置
【说明书】:

技术领域

发明涉及图像数据处理的技术领域,具体涉及一种实现图像搜索排序的方法和装置。

背景技术

随着互联网和多媒体技术的飞速发展,互联网上的资源也日益丰富,从网络上获取资源也变得越来越容易;搜索引擎即是一种在网络上应用的软件系统,其能以一定的方式在网络上实现信息的搜索和发现,并在对搜索到的信息进行处理后显示出搜索结果。

而目前,随着搜索引擎技术的日益成熟,能够提供给用户的搜索结果已经不再只是根据用户输入命令搜索到的文本信息搜索结果,还可以根据用户需求对网络图片进行搜索,并将搜索出的图片结果呈献给用户。

然而,在目前现有技术的图片搜索方案中,呈献给用户的搜索结果往往没有任何规律,而只是将所有可能相关的图片简单罗列,其图片的搜索结果中并没有任何优先级顺序,这就会使输出的图片搜索结果显示无序状态,进而大大降低了搜索的准确性,从而影响了搜索效率。

发明内容

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种实现图像搜索排序的方法和相应的一种实现图像搜索排序的装置。

依据本发明的一个方面,提供了一种实现图像搜索排序的方法,包括:创建多个源图像对应的图像族;计算每个图像族的引用权值;根据所述各图像族的引用权值的大小作为搜索查询反馈的搜索结果排序的参数。

可选的,所述创建多个源图像对应的图像族包括:从资源站点抓取所述源图像对应的网页;通过解析所述网页页面获取所述源图像对应的多张图像;获取所述源图像对应的多张图像间的传播关系;利用所述多张图像间的传播关系建立多个图像族。

可选的,所述获取所述源图像对应的多张图像间的传播关系包括:通过所述网页页面解析获取网页统一资源定位符URL和多张图像URL的对应关系;如果多个网页URL与同一图像URL对应,则确定包含该图像的多个网页与所述图像为转载关系。

可选的,所述获取所述源图像对应的多张图像间的传播关系包括:计算通过解析网页页面获取的多张图像的信息摘要MD5值;如果多张图像的MD5值相同,则确定所述MD5相同的多张图像之间为复制关系。

可选的,所述获取所述源图像对应的多张图像间的传播关系包括:计算通过解析网页页面获取的多张图像的MD5值;如果多张图像的MD5值不同,则通过近似拷贝方式确定所述MD5值不同的多张图像间是否为修改关系。

可选的,所述计算每个图像族的引用权值包括:预设所述资源站点及不同传播关系的权值;利用同一图像族中所述资源站点及所述不同传播关系权值计算该图像族的引用权值。

根据本发明的另一方面,提供了一种实现图像搜索排序的装置,包括:创建单元,适于创建多个源图像对应的图像族;计算单元,适于计算每个图像族的引用权值;排序单元,适于根据所述各图像族的引用权值的大小作为搜索查询反馈的搜索结果排序的参数。

可选的,所述创建单元包括:抓取模块,适于从资源站点抓取所述源图像对应的网页;解析模块,适于通过解析所述抓取模块抓取的网页页面获取所述源图像对应的多张图像;获取模块,适于获取所述源图像对应的多张图像间的传播关系;建族模块,适于利用所述多张图像间的传播关系建立多个图像族。

可选的,所述获取模块还包括:第一处理模块,适于通过接收所述解析模块的解析结果,并根据所述解析结果获取网页统一资源定位符URL和图像URL的对应关系;第一比较模块,适于比较所述多个网页URL与多张图像URL的对应关系,并当所述多个网页URL与同一图像URL对应时,确定包含该图像的多个网页与所述图像为转载关系。

可选的,所述获取模块还包括:第二处理模块,适于计算所述解析模块解析出的多张图像的信息摘要MD5值;第二比较模块,适于比较所述多张图像的MD5值,并当多张图像的MD5值相同时,确定所述MD5相同的多张图像之间为复制关系。

可选的,所述获取模块还包括:第三处理模块,适于计算所述解析模块解析出的多张图像的信息摘要MD5值;第三比较模块,适于比较所述多张图像的MD5值,并当多张图像的MD5值不同时,通过近似拷贝方式确定所述MD5值不同的多张图像间是否为修改关系。

可选的,所述计算单元包括:设置模块,适于预设所述抓取模块抓取网页的资源站点及获取模块获取到的所述不同传播关系的权值;比配模块,适于利用同一图像族中所述资源站点及所述不同传播关系权值计算该图像族的引用权值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410203700.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top