[发明专利]提供数据搜索的方法及装置有效
申请号: | 201210077802.3 | 申请日: | 2012-03-22 |
公开(公告)号: | CN103324631B | 公开(公告)日: | 2018-05-29 |
发明(设计)人: | 王犇;何军;杨志峰 | 申请(专利权)人: | 深圳市世纪光速信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 518057 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据搜索 关键词集合 页面内容 相关度 页面 排序 页面展示 搜索 多样性 | ||
1.一种提供数据搜索的方法,其特征在于,该方法包括:
接收用户输入的原始关键词,获取与原始关键词直接关联的页面内容数据,以及与原始关键词间接关联的页面推荐数据,所述页面推荐数据为搜索所述原始关键词的其他用户在后续搜索得到的数据;
从页面内容数据和页面推荐数据中提取关键词,组成关键词集合;
对关键词集合中的关键词进行相关度排序;
在排序中从相关度最高的关键词开始,提取出设定个数的关键词;
在页面展示页面内容数据、页面推荐数据和提取的关键词。
2.如权利要求1所述的方法,其特征在于,所述对关键词集合中的关键词进行相关度排序包括:
计算关键词集合中各关键词的关联度,按照关联度对关键词进行排序,所述关联度为所述相关度。
3.如权利要求1所述的方法,其特征在于,所述对关键词集合中的关键词进行相关度排序包括:
计算关键词集合中各关键词的关联度,将各关键词的关联度与搜索热度进行相乘,按照相乘结果进行排序,所述相乘结果为所述相关度。
4.如权利要求2或3所述的方法,其特征在于,所述计算关键词集合中各关键词的关联度包括:
确定关键词集合中各关键词的关联度;将相同关键词的关联度进行直接相加或加权相加,将相加结果作为该关键词最终的关联度。
5.如权利要求4所述的方法,其特征在于,确定关键词集合中各关键词的关联度时,将从页面内容数据中提取的关键词的关联度确定为1;
所述加权相加包括:将相同关键词中最高数值的关联度作为加数,将其它关联度分别乘以0.5,将得到的相乘结果作为被加数,用所述加数与所述被加数进行相加,得到的结果为所述相加结果。
6.如权利要求1、2或3所述的方法,其特征在于,在页面展示页面内容数据、页面推荐数据和提取的关键词之后,该方法还包括:
接收来自用户终端的搜索指令,所述搜索指令包含从页面选择的关键词;
由搜索指令包含的关键词搜索出数据,返回给用户终端。
7.一种提供数据搜索的装置,其特征在于,该装置包括关键词提取单元、排序单元和展示单元;
所述关键词提取单元,用于接收用户输入的原始关键词,获取与原始关键词直接关联的页面内容数据,以及与原始关键词间接关联的页面推荐数据,所述页面推荐数据为搜索所述原始关键词的其他用户在后续搜索得到的数据;从页面内容数据和页面推荐数据中提取关键词,组成关键词集合;
所述排序单元,用于对所述关键词集合中的关键词进行相关度排序;
所述展示单元,用于在所述排序中从相关度最高的关键词开始,提取出设定个数的关键词;在页面展示页面内容数据、页面推荐数据和提取的关键词。
8.如权利要求7所述的装置,其特征在于,所述排序单元包括第一排序子单元,用于计算关键词集合中各关键词的关联度,按照关联度对关键词进行排序,所述关联度为所述相关度。
9.如权利要求7所述的装置,其特征在于,所述排序单元包括第二排序子单元,用于计算关键词集合中各关键词的关联度,将各关键词的关联度与搜索热度进行相乘,按照相乘结果进行排序,所述相乘结果为所述相关度。
10.如权利要求7、8或9所述的装置,其特征在于,该装置还包括搜索单元,用于接收来自用户终端的搜索指令,所述搜索指令包含从页面选择的关键词;由搜索指令包含的关键词搜索出数据,返回给用户终端。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市世纪光速信息技术有限公司,未经深圳市世纪光速信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210077802.3/1.html,转载请声明来源钻瓜专利网。