[发明专利]文本样本条目组制定有效

专利信息
申请号: 201480059862.X 申请日: 2014-10-27
公开(公告)号: CN105683958B 公开(公告)日: 2020-12-15
发明(设计)人: C·佩特克勒斯克;M·杜米特鲁;V·帕拉斯基夫;A·耐茨;P·J·桑德斯 申请(专利权)人: 微软技术许可有限责任公司
主分类号: G06F16/35 分类号: G06F16/35;G06F16/31;G06F16/33
代理公司: 上海专利商标事务所有限公司 31100 代理人: 顾嘉运
地址: 美国华*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文本 样本 条目 制定
【说明书】:

以可以快速搜索文本样本的方式存储文本样本。文本样本被分配文本样本标识符并且各自被解析以由此从文本样本中提取文本分量。具有相同内容的文本分量被分配相同的文本分量标识符。对于所解析的每一文本分量,创建文本分量条目,该文本分量条目包括所分配的文本分量标识符以及从中解析出该文本分量的文本样本的文本样本标识符。为每一文本样本创建文本样本条目组,该文本样本条目组按序包含对应于文本样本内发现的文本分量的文本分量条目。存储文本样本条目组以使得可以在将来搜索期间扫描。

背景

计算机和计算系统已经影响了现代生活的近乎每一个方面。计算系统正提供越来越复杂且精致的功能。这样的功能通常主要由底层软件驱动,该底层软件自身正变得越来越复杂。更精致的功能中的某些涉及使用网络相互通信的计算系统。例如,互联网是构成计算网络的世界范围的联盟,其允许计算系统完成世界范围的通信。

通信中的这一提高的能力已经允许信息被更容易地共享,并且是当代经常被称为“信息时代”的一大原因。提高的通信便利度有助于开发数据中心,即包含大量数据处理和存储能力的建筑物。由此对计算系统上的用户可用的信息量不再受限于计算系统的本地存储,而是扩展到该计算系统可以从全世界的其它计算系统和数据中心访问的几乎无限多种类的信息。

然而,人只对一些信息感兴趣,并且人的兴趣因人而异且随时间变化。因此,存在用于对大量信息进行分类并向用户提供更感兴趣的信息的机制。用于这样做的常规机制包括web浏览器、搜索引擎、社交网络等。

此处要求保护的主题不限于解决任何缺点或仅在诸如上述环境这样的环境中操作的各实施例。相反,提供该背景仅用于例示其中可实现所述一些实施例的一个示例性技术领域。

简要概述

本文描述的至少一些实施例涉及以可以快速搜索文本样本的方式对文本样本进行存储。文本样本被分配文本样本标识符并且各自被解析以由此从文本样本中提取文本分量。具有相同内容的文本分量被分配相同的文本分量标识符。对于所解析的每一文本分量,创建文本分量条目,该文本分量条目包括所分配的文本分量标识符以及从中解析出该文本分量的文本样本的文本样本标识符。为每一文本样本创建文本样本条目组,该文本样本条目组按序包含对应于文本样本内发现的文本分量的文本分量条目。存储文本样本条目组以使得可以在将来搜索期间扫描。

在搜索时,可只在单次扫描中扫描所存储的文本样本条目组。对文本分量序列的搜索可通过扫描文本分量条目来执行,并且在每一次遇到对应于序列中的第一文本分量的文本分量标识符时,验证后续文本分量标识符是否完成该序列。搜寻包括或排除特定文本分量的文本样本可通过扫描文本分量条目以寻找这些文本分量中的任一个来进行。

在一个实施例中,可为正由于被包括在文本样本中或被排除在文本样本外而被搜索的每一文本分量提供位图。在该情形中,该位图中的每一位或许对应于特定文本样本,并且用于记录是否在相应的文本样本中找到相应的文本分量。一旦遇到文本序列或文本分量,就评估对应的文本分量条目中所包括的文本样本标识符以确定文本样本并且标记对应位。可以对位图执行逐位逻辑操作以找到包括和/或排除特定文本分量的文本样本。

提供本概述以便以简化的形式介绍将在以下的详细描述中进一步描述的一些概念。本概述并非旨在标识出要求保护的主题的关键特征或必要特征,亦非旨在用作辅助确定要求保护的主题的范围。

附图简述

为了描述可获得本发明的上述和其它优点和特征的方式,将通过参考附图中示出的本发明的具体实施例来呈现以上简要描述的本发明的更具体描述。可以理解,这些附图只描绘了本发明的各典型实施例,并且因此不被认为是对其范围的限制,将通过使用附图并利用附加特征和细节来描述和解释本发明,在附图中:

图1示出了其中可采用本文中所描述的原理的示例计算系统;

图2示出了存储系统,该存储系统包括用于制定文本分量条目并将其提供给存储的存储机制以及本文描述的原理可以在其中操作的搜索机制;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201480059862.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top