[发明专利]一种网络搜索方法和装置有效
| 申请号: | 201310633696.7 | 申请日: | 2013-11-29 |
| 公开(公告)号: | CN104679783B | 公开(公告)日: | 2019-08-02 |
| 发明(设计)人: | 张友书;余浩;张阔 | 申请(专利权)人: | 北京搜狗信息服务有限公司;北京搜狗科技发展有限公司 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F17/27 |
| 代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
| 地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 网络 搜索 方法 装置 | ||
本申请提供了一种网络搜索方法和装置,涉及网络搜索技术领域。其中的方法具体包括:搜索与输入的查询串相匹配的网页,得到网页结果;在知识库中检索得到所述查询串对应的实体结果;其中,所述知识库中存储全网中的实体对象;将所述实体结果分别在各网页结果对应的网页内容中进行分析匹配,筛选出每条网页结果对应的目标实体;将所述目标实体分别与匹配的网页结果进行对应展现。本申请将网页结果中与查询串相关的目标实体分别筛选出来,并简洁地、直观地展现给用户,无需用户点击查看即可判断当前网页结果对应的页面内容与查询串的相关性,进而判断当前网页结果中所包含的页面内容的可靠性,提高了信息查询的效率,能够提高信息查询的效率。
技术领域
本申请涉及网络搜索技术领域,特别是涉及一种网络搜索方法和装置。
背景技术
目前,数据搜索已经成为互联网最主要的应用之一。以典型的搜素引擎为例,其通常利用服务器的搜索机器人蜘蛛(Spider)程序,自动搜索互联网上大大小小的网站内容,按照网页相关性原理在每一个查询串和所有相关的网页之间建立一个对应关系,储存在其网络服务器的网页数据库中;用户只要输入查询串就可以找到符合该查询串特征的所有被搜索的网页,并且以超级链接的方式对搜索结果进行展现,点击相应的链接就可以访问相应的网页,从而找到所需信息。
现有的搜索结果中的结果项,通常仅简单地显示网页标题和文字摘要,并在文字摘要部分用红色字体标记出了与查询串中的分词相匹配的文字,以方便用户在浏览时快速定位。
然而,由于摘要的字数限制或者文本的结构特点,用户无法在搜索结果中看到网页中与查询串相关的所有内容,还需点击进入相应的网页仔细查看,因此,用户需要分别点击多个搜索结果的链接才能找到其想要搜索的信息,降低了信息查询的效率。
总之,需要本领域技术人员迫切解决的一个技术问题就是:如何能够提高信息查询的效率。
发明内容
本申请所要解决的技术问题是提供一种网络搜索方法和装置,能够提高信息查询的效率。
为了解决上述问题,本申请公开了一种网络搜索方法,包括:
搜索与输入的查询串相匹配的网页,得到网页结果;
在知识库中检索得到所述查询串对应的实体结果;其中,所述知识库中存储全网中的实体对象;
将所述实体结果分别在各网页结果对应的网页内容中进行分析匹配,筛选出每条网页结果对应的目标实体;
将所述目标实体分别与匹配的网页结果进行对应展现。
优选的,所述筛选出每条网页结果对应的目标实体的步骤,包括:在每条网页结果对应的网页内容中分别筛选出与所述实体结果相匹配的目标内容,并将所述目标内容对应的实体结果作为所述网页结果对应的目标实体。
优选的,所述在每条网页结果对应的网页内容中分别筛选出与所述实体结果相匹配的目标内容的步骤,包括:
对所述网页结果对应的网页正文进行分析;
依据网页正文对应的分析结果,提取所述网页正文中特征内容;所述特征内容包括标题、子标题、表格、摘要和加粗文字中的一项或多项;
将提取到的文字分别与各实体结果进行匹配,得到所述网页结果中与各实体结果相匹配的目标内容。
优选的,所述方法还包括:
依据所述与所述实体结果相匹配的目标内容分别在各所述网页结果中出现的频率和/或位置,以每条网页结果为单位对所述目标实体进行排序;
则所述将所述目标实体分别与匹配的网页结果进行对应展现的步骤为,依据目标实体的排序结果分别对所述网页结果匹配的各目标实体的标记进行对应展现。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗信息服务有限公司;北京搜狗科技发展有限公司,未经北京搜狗信息服务有限公司;北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310633696.7/2.html,转载请声明来源钻瓜专利网。





