[发明专利]搜索内容提供方法和搜索引擎在审

专利信息
申请号: 201410348072.5 申请日: 2014-07-21
公开(公告)号: CN104102723A 公开(公告)日: 2014-10-15
发明(设计)人: 孙连生;万伟;赵世奇 申请(专利权)人: 百度在线网络技术(北京)有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京清亦华知识产权代理事务所(普通合伙) 11201 代理人: 宋合成
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 搜索 内容 提供 方法 搜索引擎
【权利要求书】:

1.一种搜索内容提供方法,其特征在于,包括:

搜索引擎获取用户的搜索数据;

所述搜索引擎根据所述搜索数据获取与预设关键词具有关联关系的第一关联词集合和第二关联词集合;

所述搜索引擎根据所述搜索数据和所述预设关键词建立所述第一关联词集合中第一关联词与所述第二关联词集合中第二关联词的关联关系;以及

当接收到包括所述预设关键词的搜索请求时,所述搜索引擎根据所述关联关系提供搜索内容。

2.如权利要求1所述的搜索内容提供方法,其特征在于,所述搜索数据包括问答数据,所述搜索引擎根据所述搜索数据获取与预设关键词具有关联关系的第一关联词集合和第二关联词集合,具体包括:

所述搜索引擎根据所述搜索数据获取与所述预设搜索词具有关联关系的第一关联词集合;以及

所述搜索引擎根据所述问答数据获取与所述预设关键词具有关联关系的第二关联词集合。

3.如权利要求2所述的搜索内容提供方法,其特征在于,所述搜索引擎根据所述搜索数据获取与所述预设搜索词具有关联关系的第一关联词集合,具体包括:

所述搜索引擎对所述搜索数据进行分词以获取多个分词;

所述搜索引擎从所述多个分词中获取与所述预设关键词具有关联关系的分词,并分别获取每个与所述预设关键词具有关联关系的分词与所述预设关键词的相关度;

所述搜索引擎根据所述相关度筛选出候选词集合;

所述搜索引擎将所述候选词集合中同类别的候选词进行聚类,以获取包括多个第一关词类的所述第一关联词集合。

4.如权利要求3所述的搜索内容提供方法,其特征在于,所述搜索引擎将所述候选词集合中同类别的候选词进行聚类,具体包括:

所述搜索引擎获取所述候选词集合中每两个候选词之间的相似度;

所述搜索引擎对所述相似度进行回归映射,以获取每两个候选词之间的相似度的回归值;

所述搜索引擎根据所述回归值对所述候选词集合进行层次聚类。

5.如权利要求2所述的搜索内容提供方法,其特征在于,所述搜索引擎根据所述问答数据获取与所述预设关键词具有关联关系的第二关联词集合,具体包括:

所述搜索引擎根据预设问题模板对所述问答数据中的问题数据进行筛选,其中,所述预设问题模板包括所述预设关键词,以获取与所述预设关键词具有关联关系的多个第二关联词;

所述搜索引擎分别获取每个第二关联词与所述预设关键词的对应关系在所述问答数据中的出现次数;

所述搜索引擎根据所述每个第二关联词与所述预设关键词的对应关系在所述问答数据中的出现次数对所述多个第二关联词进行筛选,以获取所述第二关联词集合。

6.如权利要求3所述的搜索内容提供方法,其特征在于,所述搜索引擎根据所述搜索数据和所述预设关键词建立所述第一关联词集合中第一关联词与所述第二关联词集合中第二关联词的关联关系,具体包括:

所述搜索引擎获取所述问答数据中包括所述第二关联词集合中第二关联词的问题数据和包括所述第一关联词集合中的第二关联词的回答数据,并根据所述问答数据中的问题数据和回答数据的对应关系分别获取每个第一关联词与每个第二类关联词的对应关系;

所述搜索引擎根据所述每个第一关联词与每个第二类关联词的对应关系获取每个第一关联词类对应的第二关联词。

7.如权利要求2所述的搜索内容提供方法,其特征在于,还包括:

所述搜索引擎在所述问答数据中筛选出包括所述第一关联词的回答数据;

所述搜索引擎对包括所述第一关联词的回答数据进行分析,以获取所述包括所述第一关联词的回答数据中与对应的第一关联词同时出现的频率超过预设频率的共现词;

所述搜索引擎根据所述共现词更新所述第一关联词集合,并建立更新后的第一关联词集合中的第一关联词与所述第二关联词集合中的第二关联词的关联关系。

8.如权利要求1-7任一项所述的搜索内容提供方法,其特征在于,所述搜索引擎根据所述关联关系提供搜索内容,具体包括:

所述搜索引擎提供与所述预设关键词对应的所述第一关联词集合中第一关联词与所述第二关联词集合中第二关联词的关联关系。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410348072.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top