[发明专利]搜索方法及系统有效
| 申请号: | 201110084224.1 | 申请日: | 2011-04-02 |
| 公开(公告)号: | CN102737029B | 公开(公告)日: | 2017-01-18 |
| 发明(设计)人: | 李翔;黄斌强;李盛韬 | 申请(专利权)人: | 深圳市世纪光速信息技术有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 广州华进联合专利商标代理有限公司44224 | 代理人: | 何平,曾旻辉 |
| 地址: | 518057 广东省深圳市*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 搜索 方法 系统 | ||
1.一种搜索方法,包括以下步骤:
获取用户输入的查询字符;
对所述查询字符进行分类处理,得到查询字符的分类类别;
根据所述查询字符及所属的分类类别进行检索,得到检索结果。
2.根据权利要求1所述的搜索方法,其特征在于,所述对查询字符进行分类处理,得到查询字符的分类类别的步骤具体包括:
对信息站点进行数据内容抓取,提取分类关键词;
从所述查询字符中提取查询关键词;
将所述查询关键词与所述分类关键词进行匹配,得到所述查询关键词的分类类别。
3.根据权利要求1所述的搜索方法,其特征在于,还包括步骤:
对所述检索结果进行去重及排序处理;
展现所述去重及排序处理后的检索结果。
4.根据权利要求3所述的搜索方法,其特征在于,在对所述检索结果进行去重及排序处理的步骤之前还包括:
获取各个检索结果的点击次数;
将检索结果的点击次数与预定阈值比较,若大于所述预定阈值,则对所述检索结果的点击次数进行修正,若小于等于所述预定阈值,则保留所述检索结果的点击次数。
5.根据权利要求3所述的搜索方法,其特征在于,所述对检索结果进行去重及排序处理的步骤具体包括:
根据检索结果的网址、标题名称及信息完整度,从多个重复的检索结果中筛选出信息完整度最高的一个检索结果;
根据点击次数权重对经过去重处理的检索结果进行排序。
6.根据权利要求3所述的搜索方法,其特征在于,当搜索视频时,所述对检索结果进行去重及排序处理的步骤具体为:
计算检索得到的视频的来源地址指纹,记为第一指纹;
计算检索得到的视频缩略图的内容指纹,记为第二指纹;
对检索得到的视频的标题字符串进行去噪处理,将去噪后的标题字符串和第二指纹进行计算得到第三指纹;
根据第三指纹对检索得到的视频进行去重处理,删除重复的视频;
对去重后具有相同第一指纹和/或第二指纹的视频根据点击次数权重、时长权重及视频标题与查询字符匹配权重进行排序。
7.根据权利要求6所述的搜索方法,其特征在于,在所述对检索结果进行去重及排序处理的步骤之后还包括:
将视频的缩略图转换为灰度图,根据灰度图的灰度值分析得出视频的缩略图的质量;
根据视频的缩略图质量从高到低对视频进行排序。
8.一种搜索系统,其特征在于,包括:
信息获取模块,用于获取用户输入的查询字符;
分类模块,用于对所述查询字符进行分类处理,得到所述查询字符的分类类别;
检索模块,用于根据所述查询字符及所属的分类类别进行检索,得到检索结果。
9.根据权利要求8所述的搜索系统,其特征在于,所述信息获取模块还用于对信息站点进行数据内容抓取,所述分类模块还用于从抓取的数据内容中提取分类关键词;所述分类模块还用于从所述查询字符中提取查询关键词,将查询关键词与分类关键词进行匹配,得到所述查询关键词的分类类别。
10.根据权利要求8所述的搜索系统,其特征在于,还包括:
处理模块,用于对所述检索结果进行去重及排序处理;
展示模块,用于展现所述去重及排序处理后的检索结果。
11.根据权利要求10所述的搜索系统,其特征在于,还包括统计分析模块,所述统计分析模块用于获取各个检索结果的点击次数,将检索结果的点击次数与预定阈值比较,若大于所述预定阈值,则对所述检索结果的点击次数进行修正,若小于等于所述预定阈值,则保留所述检索结果的点击次数。
12.根据权利要求10所述的搜索系统,其特征在于,所述处理模块根据检索结果的网址、标题名称及信息完整度,从多个重复的检索结果中筛选出信息完整度最高的一个检索结果,根据点击次数权重对经过去重处理的检索结果进行排序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市世纪光速信息技术有限公司,未经深圳市世纪光速信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110084224.1/1.html,转载请声明来源钻瓜专利网。





