[发明专利]主题区讨论的自动发现聚集和组织有效

专利信息
申请号: 201110008374.4 申请日: 2011-01-05
公开(公告)号: CN102117321A 公开(公告)日: 2011-07-06
发明(设计)人: P·R·贝利;D·R·施瓦茨 申请(专利权)人: 微软公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 上海专利商标事务所有限公司 31100 代理人: 杨洁;钱静芳
地址: 美国华*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 主题 讨论 自动 发现 聚集 组织
【说明书】:

背景技术

用户通常对特定主题区感兴趣,并且想要深入地覆盖这些主题区内的事件和主题的讨论。然而,用户通常难以快速发现这些信息。在一些情况下,用户可以尝试采用搜索引擎来搜索给定主题区内的事件和主题的讨论。这需要用户向搜索引擎提交搜索查询以接收搜索结果。通常,搜索引擎返回大量文档或网页地址,并且随后将筛选文档、链接的这一列表以及相关联的信息来发现该主题区内的事件或主题的讨论留给用户处理。这一过程对用户而言是麻烦的、令人沮丧并且耗时,并且作为结果,对用户而言,这一过程是发现感兴趣的主题区内的事件和主题的讨论的低效方式。

当前存在着聚集主题区的事件和主题的讨论的多种服务。例如,诸如必应(BING)新闻垂直面和谷歌(GOOGLE)新闻垂直面等新闻垂直面将围绕给定事件的新闻故事聚集成聚类,从而允许用户查看特定新闻事件的不同讨论。然而,当前聚集服务一般在范围上很有限,只覆盖单个主题区或有限数量的主题区。例如,主题区是高级的,如政治、体育、科学/技术。另外,当前聚集服务通常需要来自负责开发和促进这样的聚集服务所提供的聚集的编辑人员的大量人类努力。或者,一些当前聚集服务从接收到同等的人类编辑努力的现有新闻服务中进行提取。

发明内容

提供本“发明内容”是为了以精简的形式介绍将在以下“具体实施方式”中进一步描述的一些概念。本“发明内容”不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。

本发明的各实施方式涉及基于一组种子搜索查询并充分利用搜索引擎数据来群集主题区内的事件和主题的web讨论的聚集服务。在各实施方式中,该聚集服务的编辑人员选择特定主题区并开发一组种子搜索查询,它可以是该编辑人员相信与该特定主题区相关的一小组搜索查询。作为替换或补充,该编辑人员标识与该编辑人员相信与该特定主题区相关的文档相对应的一组种子URL。如果提供了一组种子查询,则结合搜索引擎数据使用该组种子搜索查询来标识与该主题区相关的统一资源定位符(URL)的列表。如果提供了一组种子URL,则可通过算法确定相关的URL以标识与该特定主题区相关的附加URL。以给定的时间间隔爬行所标识的URL(并且在一些实施方式中,链接到这些URL的URL和从这些URL链接出去的URL)以标识各个内容项,每一内容项与来自所爬行的URL的事件或主题的讨论相对应。使用分类器来分析各内容项以标识与该主题区相关的内容项并过滤出与该主题区不相关的内容项。随后将相关内容项编组成内容项的聚类。每一个聚类包括围绕该主题区内的给定事件或主题的讨论。还将各个聚类进行排名以便于确定向最终用户呈现事件的次序。上述过程可以对各种不同的主题区执行。最终用户可以访问聚集服务并选择感兴趣的特定主题区。在最终用户选择特定主题区时,将所选主题区内的事件和/或主题的讨论的聚类呈现给最终用户。

附图说明

下面将参考附图详细描述本发明,附图中:

图1是适用于实现本发明的各实施方式的示例性计算环境的框图;

图2是示出其中可以使用本发明各实施方式的示例性系统的框图:

图3是根据本发明的一实施方式的示例性聚集服务器的框图;以及

图4是示出根据本发明的一实施方式的用于聚集给定主题区内的事件和主题的web讨论的方法的流程图。

具体实施方式

此处用细节来描述本发明的主题以满足法定要求。然而,该描述本身并非旨在限制本专利的范围。相反,发明人设想所要求保护的主题还可结合其他当前或未来技术按照其他方式来具体化,以包括不同的步骤或类似于本文中所描述的步骤的步骤组合。此外,尽管术语“步骤”和/或“框”可在此处用于指示所采用的方法的不同元素,但除非而且仅当明确描述了各个步骤的次序时,该术语不应被解释为意味着此处公开的各个步骤之中或之间的任何特定次序。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110008374.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top