[发明专利]一种图片搜索方法及装置在审
申请号: | 201710527201.0 | 申请日: | 2017-06-30 |
公开(公告)号: | CN107451194A | 公开(公告)日: | 2017-12-08 |
发明(设计)人: | 李贤;付立波;李棱;陈雨;龙斌;郭蔚林 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙)11412 | 代理人: | 袁媛 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图片 搜索 方法 装置 | ||
1.一种图片搜索方法,其特征在于,包括:
接收搜索词;
根据所述搜索词从图片数据库和图集数据库中获取搜索结果项;
对所述搜索结果项进行混合排序;
展示所述排序后的搜索结果项。
2.根据权利要求1所述的图片搜索方法,其特征在于,所述根据所述搜索词从图片数据库和图集数据库中获取搜索结果项包括以下子步骤:
在预先建立的图片倒排索引和图集倒排索引中进行搜索,获得与所述搜索词匹配的索引;
获得与所述搜索词匹配的索引对应的图片和图集,生成搜索结果项。
3.根据权利要求2所述的图片搜索方法,其特征在于,在接收所述搜索词之前,对网络图片进行抓取,建立倒排索引,包括以下子步骤:
对抓取的图片所在网页的结构化文本字段进行分析,获得所述图片的文本信息;
对抓取的图片进行挖掘,生成图集;
建立图集倒排索引。
4.根据权利要求3所述的图片搜索方法,其特征在于,所述对抓取的图片进行挖掘,生成图集包括:
将抓取的图片进行聚合,得到智能聚合图集。
5.根据权利要求3所述的图片搜索方法,其特征在于,所述对抓取的图片进行挖掘,生成图集包括:
将网址的构成特征相似且主题词相同的图片生成网页图集
6.根据权利要求1所述的图片搜索方法,其特征在于,所述对所述搜索结果项进行混合排序进一步包括以下子步骤:
对图片和图集进行特征提取;
将检索词与待排序的图片和图集的特征数据输入预先训练的排序模型,对各待排序图片和图集进行混合排序。
7.根据权利要求6所述的图片搜索方法,其特征在于,所述展示所述排序后的搜索结果项包括:
将图片和图集的缩略图按混合排序顺序展示在搜索结果页面上。
8.一种图片搜索装置,其特征在于,包括:
接收模块,用于接收搜索词;
搜索模块,用于根据所述搜索词从图片数据库和图集数据库中获取搜索结果项;
排序模块,用于对所述搜索结果项进行混合排序;
展示模块,用于展示所述排序后的搜索结果项。
9.根据权利要求8所述的图片搜索装置,其特征在于,所述搜索模块包括以下子模块:
索引获取子模块,用于在预先建立的图片倒排索引和图集倒排索引中进行搜索,获得与所述搜索词匹配的索引;
搜索结果项生成子模块,用于获得与所述搜索词匹配的索引对应的图片和图集,生成搜索结果项。
10.根据权利要求9所述的图片搜索装置,其特征在于,所述搜索模块还包括倒排索引建立子模块,用于在接收所述搜索词之前,对网络图片进行抓取,建立图集倒排索引,所述倒排索引建立子模块包括:
文本信息获取子模块,用于对抓取的图片所在网页的结构化文本字段进行分析,获得所述图片的文本信息;
图集生成子模块,用于对抓取的图片进行挖掘,生成图集;
图集倒排索引建立子模块,用于建立图集倒排索引。
11.根据权利要求10所述的图片搜索装置,其特征在于,所述图集生成子模块具体执行:
将抓取的图片进行聚合,得到智能聚合图集。
12.根据权利要求10所述的图片搜索装置,其特征在于,所述图集生成子模块具体执行:
将网址的构成特征相似且主题词相同的图片生成网页图集
13.根据权利要求8所述的图片搜索装置,其特征在于,所述排序模块包括以下子模块:
特征提取子模块,用于对图片和图集进行特征提取;
所述混合排序子模块,用于将检索词与待排序的图片和图集的特征数据输入预先训练的排序模型,对各待排序图片和图集进行混合排序。
14.根据权利要求13所述的图片搜索装置,其特征在于,所述展示模块具体执行:
将图片和图集的缩略图按混合排序顺序展示在搜索结果页面上。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710527201.0/1.html,转载请声明来源钻瓜专利网。