[发明专利]将搜索结果分组为简档页面在审
| 申请号: | 201380005822.2 | 申请日: | 2013-01-10 |
| 公开(公告)号: | CN104067273A | 公开(公告)日: | 2014-09-24 |
| 发明(设计)人: | A.K.舒克;A.艾沃里;E.J.伯卡特;D.M.斯特克 | 申请(专利权)人: | 国际商业机器公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 郭定辉 |
| 地址: | 美国纽*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 搜索 结果 分组 页面 | ||
技术领域
本发明涉及搜索引擎的领域。更具体地,本发明涉及针对与其他实体共享共同名称的每一个唯一实体生成具体简档页面(profile page),并且呈现到每一个简档页面的链接作为响应于指定该共同名称的用户搜索字符串的搜索结果的列表。
背景技术
搜索引擎向计算机用户提供了几秒钟搜索在例如因特网的网络上可用的不断扩大的文档集合的方式。搜索引擎使用复杂的算法来评分并排序各个文档或页面,以响应于用户指定的搜索字符串呈现最相关和精确的结果。当用户搜索在多个实体(人、位置、组织或其他实体)之间共享的名称时,当前方法涉及大量数据集合的密集统计计算来确定用户在寻找多个实体中的哪个并且可能无法提供与该实体对应的完整和有意义的结果。
US20110106807公开了用于通过生成实体简档并且从多个文档提取信息以生成实体简档集合、使用相似性匹配算法确定实体简档集合内的等同(equivalence)并且将信息整合在相关实体中,消除实体的歧义的方法。
发明内容
这里公开的一个实施例包括计算机实现的方法,用于呈现响应于指定由多个实体共享的共同名称的搜索引擎搜索字符串生成的简档页面。操作一般可以包括:从用户接收指定作为由多个实体共享的共同名称的实体名称的第一搜索字符串;基于第一搜索字符串的结果生成多个查询;执行多个所生成查询的每一个来创建搜索结果的相应集合;分解(resolve)搜索结果的相应集合的每一个以使得每一个实体由单个集合的搜索结果代表;生成多个简档,每一个简档与分解后的搜索结果的集合之一对应;并且向输出装置呈现多个简档作为响应于第一搜索字符串的结果的集合。
这里公开的另一实施例提供计算机可读介质,包含当在包括处理器和存储器的系统上执行时进行大体包括如下的操作的程序:从用户接收指定作为由多个实体共享的共同名称的实体名称的第一搜索字符串;基于第一搜索字符串的结果生成多个查询;执行多个所生成查询的每一个来创建搜索结果的相应集合;分解搜索结果的相应集合的每一个以使得每一个实体由单个集合的搜索结果代表;生成多个简档,每一个简档与分解后的搜索结果的集合之一对应;并且向输出装置呈现多个简档作为响应于第一搜索字符串的结果的集合。
这里公开的另一实施例提供系统,该系统从用户接收指定作为由多个实体共享的共同名称的实体名称的第一搜索字符串。该系统基于第一搜索字符串的结果生成多个查询,执行多个所生成查询的每一个来创建搜索结果的相应集合,并且分解搜索结果的相应集合的每一个以使得每一个实体由单个集合的搜索结果代表。该系统生成多个简档,每一个简档与分解后的搜索结果的集合之一对应,并且向输出装置呈现多个简档作为响应于第一搜索字符串的结果的集合。
从第一方面来看,本发明提供用于将搜索结果分组为简档页面的计算机实现的方法,该方法包括:接收指定一个或多个搜索词语的第一搜索字符串,其中一个或多个搜索词语的至少一个是与多个实体对应的共享词语;基于接收到的第一搜索字符串生成多个搜索查询,每一个对应于多个实体中的相应实体;执行所生成的多个搜索查询的每一个来创建搜索结果的相应集合;分解搜索结果的集合,以使得多个实体的每一个由单个集合的搜索结果代表;生成多个简档,每一个简档与分解后的搜索结果的集合之一对应,其中多个简档中的每一个包括从分解后的搜索结果的对应集合中的至少一个文档获得的数据;并且呈现多个简档作为响应于第一搜索字符串的结果的集合。
优选地,本发明提供其中多个实体的每一个包括人、位置或组织中的至少一个的方法。
优选地,本发明提供其中基于响应于第一搜索字符串提供的相关搜索字符串的集合生成多个搜索查询的方法。
优选地,本发明提供该分解包括如下的方法:比较搜索结果的集合的每一个以检测相似性;并且当检测到相似性时合并搜索结果的集合。
优选地,本发明提供其中当检测到的相似性超出了指定相似性阈值时,该合并发生的方法。
优选地,本发明提供其中使用从搜索结果的对应集合检索到的传记信息生成多个简档中的每一个的方法。
优选地,本发明提供包括如下的方法:接收标记简档中的至少一个数据元素为与该简档相关或不相关的用户反馈。
优选地,本发明提供其中至少一个文档包括与该实体相关联的社交网络页面的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380005822.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:安全数据容器和数据访问控制
- 下一篇:原位处理器重新表征





