[发明专利]按事件将文档编译到时间线中在审
| 申请号: | 201780054514.7 | 申请日: | 2017-08-30 |
| 公开(公告)号: | CN109690529A | 公开(公告)日: | 2019-04-26 |
| 发明(设计)人: | O·阿隆索;V·坎迪拉斯;S-E·特雷姆布莱 | 申请(专利权)人: | 微软技术许可有限责任公司 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/953;G06Q50/00 |
| 代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华 |
| 地址: | 美国华*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 时间线 文档 链接文档 媒体文档 文档编译 子集 条目 查询系统 基础支持 流行度 转向点 帖子 链接 捕获 集合 搜索 跟踪 话题 创建 分析 | ||
代表性实施例公开了将文档编译成跟踪话题随时间的演变的时间线文档的机制。社交媒体文档可以用于标识链接文档(即,社交媒体在帖子、推文等中分享的文档)的重要性或流行度。分析社交媒体文档的集合,并且将其用来标识一系列n元语法和链接文档的经排名列表。基于与一系列n元语法的相似性来选择经排名列表的子集。然后将子集连同基础支持数据一起汇总和捕获到时间线文档的条目中。可以链接不同时间线文档中的相关条目以创建允许用户从一个时间线跳到另一个时间线的转向点。可以将时间线文档用作由查询系统执行的搜索的一部分。
技术领域
本申请一般涉及信息技术。更具体地,本文公开的实施例收集多个文档并且将文档编译成时间线文档,该时间线文档随时间跟踪文档中话题的演变(evolution)和发展。
背景技术
随着更加互联的世界的到来,文档、新闻报道、文章和其他感兴趣的项目的数量成几何型爆发。对于任何个人而言,其难以标识不同的感兴趣项目之间的联系并跟踪感兴趣的话题如何随时间演变。虽然搜索引擎可以返回大量文档和大量信息,但是返回的信息主要表示时间上的单个快照,并且让用户对大量呈现的数据进行分类以标识感兴趣的项目。
虽然已经在组织信息以使其更易懂和更容易理解方面取得了一些进展,但是使任何这样的信息组织自动化的技术挑战是艰巨的。例如,计算机或其他系统很难标识用户可能感兴趣的内容。已经尝试过的一种方法是向用户呈现信息,并看哪些内容引起了用户的注意,然后尝试呈现性质相似的其他信息。然而,即使采用这种方法,所呈现的信息也很少能够以用户容易理解和吸收的方式被组织。随时间变化的信息只会加剧这个问题,并且系统几乎或根本没有能力跟踪信息随时间的变化。
在此上下文内出现了本实施例。
附图说明
图1图示出了将文档编译成时间线文档的系统的示例架构。
图2图示出了图示出时间线文档的创建的示例图。
图3图示出了时间线文档的示例呈现UI。
图4图示出了时间线文档的示例数据结构。
图5图示出了图示出特征选择的示例流程图。
图6图示出了图示出文档选择的示例流程图。
图7图示出了图示出标识针对文档的观点的示例流程图。
图8图示出了图示出标识并链接时间线文档之间的锚点的示例流程图。
图9图示出了适用于实现系统等或用于执行本文公开的方法的代表性机器架构。
具体实施方式
以下描述包括例示出了说明性实施例的说明性系统、方法、用用户界面、技术、指令序列和计算机程序产品。在以下描述中,出于解释的目的,阐述了许多具体细节以便提供对本发明主题的各种实施例的理解。然而,对于本领域技术人员显而易见的是,可以在没有这些具体细节的情况下实践本发明主题的实施例。通常,没有详细示出公知的指令实例、协议、结构和技术。
对于任何个体而言,其难以跟踪话题随时间的演变。一方面,各种突发新闻项目、最近的科学发现、新的科学论文和其他最近的项目会淹没用户。这些通常成团地到来,其可能太多对用户而言无法进行分类和吸收。这些项目通常很少被更新,相反,新的文章、论文等被编写。另一方面,网页(诸如维基百科)记录了事件和信息的“最终”状态,并且很少(如果有的话)被更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780054514.7/2.html,转载请声明来源钻瓜专利网。





