[发明专利]用于处理大数据的属性和区间的系统和方法在审

专利信息
申请号: 201210435249.6 申请日: 2012-11-02
公开(公告)号: CN102930025A 公开(公告)日: 2013-02-13
发明(设计)人: R·巴盖;A·S·斯托贾维奇;H·J·M·梅杰;C·卡特-施文德勒;M·伊萨德 申请(专利权)人: 微软公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 上海专利商标事务所有限公司 31100 代理人: 陈斌
地址: 美国华*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 处理 数据 属性 区间 系统 方法
【说明书】:

技术领域

本公开涉及处理大数据,更具体地涉及用于处理大数据的属性和区间的系统和方法。

背景技术

传统地,在对给定情境有意义的任何粒度下对数据加时间戳的操作本质上将时间视为无差别的信息。例如,自一亿年前起有效的数据被视为与自10分钟前起有效的数据同等重要。然而,当数据集变得极大时,(例如大数据)时间的无差别表示意味着对时间的无差别处理。对时间的该无差别处理会是低效的,在时间关系很重要的情况下尤其如此(例如相对于绝对时间或相对时间差)。

在此方面,最开始随着时间流逝,与时间信息相关联的数据帮助数据变得更结构化,因为时间信息通知随后对数据的查询。例如,可以针对特定日期或日期范围上的薪酬信息,查询个人或一组个人的历史薪酬信息。然而,在某个时间点,数据变得如此庞大,以致该时间信息的增加会产生大量分扰信息,这些信息中的多数随时间变得无关,使得数据随时间而结构变差。在又一示例中,随着数据老化,当对当前薪酬信息进行查询时,雇员离开公司或得到加薪的事实使得较旧数据变得无关或有误导性。

例如,时间数据库可使数据与时间戳和/或有效性时间区间相关联。因此,例如,可在时间点查询(例如确定特定时间点时的雇员薪酬、特定时间点时的平均雇员薪酬等等)中采用时间戳和/或有效性时间区间。然而,这样的时间戳和/或有效性时间区间会被视为与所关联的数据相关的固定值或硬值。即,这样的时间戳和/或有效性时间区间不会改变,直到该数据被更新。

因此,时间戳和/或有效性时间区间通常被用于时间点查询,其中这些查询在其有用性方面有限,因为它们仅对在该给定时间处查询的特定信息有效,且仅在时间戳和/或有效性时间区间的固定值或硬值上有效。时间戳和/或有效性时间区间必须被更新以计入对相关数据的更新,而且查询依赖于时间戳和/或有效性时间区间的固定值或硬值。

显然,随着数据集合变得如此大,相关联的时间戳和/或有效性时间区间可能无法充分地计入针对特定查询的数据变化、集合中的数据的正常老化或考虑、和/或数据集合的最近添加部分的相对重要性。即,数据集合随时间的结构损失会降低该集合的效用、会需要经更新的查询计入最近的改变、而且无法计入与这些查询的有效性有关的外围相关数据的出现(除非特别查询),等等。

处理大数据时的上述缺点仅旨在提供常规系统的一些问题的概览,并且不旨在是穷尽性的。在仔细阅读了以下详细描述后,现有技术的其他问题和各非限制性性实施例的对应好处可变得显而易见。

发明内容

本文提供了简化的发明内容以帮助能够对以下更详细的描述和附图中的示例性、非限制性实施例的多方面有基本或大体的理解。然而,本发明内容并不旨在是详尽的或穷尽的。相反,本发明内容的唯一目的在于,以简化的形式提出与一些示例性、非限制性实施例相关的一些概念,作为以下各实施例的更详细的描述的序言。

在示例实施例中,一种数据管理方法包括:分析由计算设备接收的数据以确定该数据的一个或多个属性;基于该分析向该一个或多个属性分配区间;以及使策略与该一个或多个属性或区间相关联以便于对数据的管理。属性和/或区间能用于影响数据老化策略、数据保持策略、数据组织策略、数据排名策略、以及数据管理的其它功能。此外,该数据管理方法可进一步包括:确定与其它数据的一个或多个关系;基于该一个或多个属性、区间和/或策略产生和/或存储与该数据有关的近似结果。

在另一示例实施例中,一种计算设备包括:分析组件,配置成解释由计算设备接收的数据以确定该数据的一个或多个先前未知或未确定的属性,以创建该数据的一个或多个属性;区间组件,配置成基于该数据的该一个或多个属性将区间分配给该一个或多个属性,或使该区间与该一个或多个属性相关联;以及策略组件,配置成使策略与该一个或多个属性或区间相关联,以便于对数据的管理。

在另一示例实施例中,一种计算机可读存储介质包括计算机可读指令,计算机可读指令响应于执行使计算设备执行操作,这些操作包括解释由计算设备接收的数据以确定该数据的一个或多个先前未知或未确定的属性,以创建该数据的一个或多个属性,以及基于该解释使区间关联至该一个或多个属性。这些操作进一步包括确定与该一个或多个属性或区间有关的策略,以便于对数据的管理。

以下更详细地描述其他实施例和各非限制性性示例、场景和实现。

附图说明

参考附图进一步描述多个非限制性实施例,在附图中:

图1示出流程图,示出了采用向量时钟作为辅助来进一步描述多个实施例的示例过程;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210435249.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top