[发明专利]用于处理大数据的属性和区间的系统和方法在审
| 申请号: | 201210435249.6 | 申请日: | 2012-11-02 |
| 公开(公告)号: | CN102930025A | 公开(公告)日: | 2013-02-13 |
| 发明(设计)人: | R·巴盖;A·S·斯托贾维奇;H·J·M·梅杰;C·卡特-施文德勒;M·伊萨德 | 申请(专利权)人: | 微软公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 陈斌 |
| 地址: | 美国华*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 处理 数据 属性 区间 系统 方法 | ||
技术领域
本公开涉及处理大数据,更具体地涉及用于处理大数据的属性和区间的系统和方法。
背景技术
传统地,在对给定情境有意义的任何粒度下对数据加时间戳的操作本质上将时间视为无差别的信息。例如,自一亿年前起有效的数据被视为与自10分钟前起有效的数据同等重要。然而,当数据集变得极大时,(例如大数据)时间的无差别表示意味着对时间的无差别处理。对时间的该无差别处理会是低效的,在时间关系很重要的情况下尤其如此(例如相对于绝对时间或相对时间差)。
在此方面,最开始随着时间流逝,与时间信息相关联的数据帮助数据变得更结构化,因为时间信息通知随后对数据的查询。例如,可以针对特定日期或日期范围上的薪酬信息,查询个人或一组个人的历史薪酬信息。然而,在某个时间点,数据变得如此庞大,以致该时间信息的增加会产生大量分扰信息,这些信息中的多数随时间变得无关,使得数据随时间而结构变差。在又一示例中,随着数据老化,当对当前薪酬信息进行查询时,雇员离开公司或得到加薪的事实使得较旧数据变得无关或有误导性。
例如,时间数据库可使数据与时间戳和/或有效性时间区间相关联。因此,例如,可在时间点查询(例如确定特定时间点时的雇员薪酬、特定时间点时的平均雇员薪酬等等)中采用时间戳和/或有效性时间区间。然而,这样的时间戳和/或有效性时间区间会被视为与所关联的数据相关的固定值或硬值。即,这样的时间戳和/或有效性时间区间不会改变,直到该数据被更新。
因此,时间戳和/或有效性时间区间通常被用于时间点查询,其中这些查询在其有用性方面有限,因为它们仅对在该给定时间处查询的特定信息有效,且仅在时间戳和/或有效性时间区间的固定值或硬值上有效。时间戳和/或有效性时间区间必须被更新以计入对相关数据的更新,而且查询依赖于时间戳和/或有效性时间区间的固定值或硬值。
显然,随着数据集合变得如此大,相关联的时间戳和/或有效性时间区间可能无法充分地计入针对特定查询的数据变化、集合中的数据的正常老化或考虑、和/或数据集合的最近添加部分的相对重要性。即,数据集合随时间的结构损失会降低该集合的效用、会需要经更新的查询计入最近的改变、而且无法计入与这些查询的有效性有关的外围相关数据的出现(除非特别查询),等等。
处理大数据时的上述缺点仅旨在提供常规系统的一些问题的概览,并且不旨在是穷尽性的。在仔细阅读了以下详细描述后,现有技术的其他问题和各非限制性性实施例的对应好处可变得显而易见。
发明内容
本文提供了简化的发明内容以帮助能够对以下更详细的描述和附图中的示例性、非限制性实施例的多方面有基本或大体的理解。然而,本发明内容并不旨在是详尽的或穷尽的。相反,本发明内容的唯一目的在于,以简化的形式提出与一些示例性、非限制性实施例相关的一些概念,作为以下各实施例的更详细的描述的序言。
在示例实施例中,一种数据管理方法包括:分析由计算设备接收的数据以确定该数据的一个或多个属性;基于该分析向该一个或多个属性分配区间;以及使策略与该一个或多个属性或区间相关联以便于对数据的管理。属性和/或区间能用于影响数据老化策略、数据保持策略、数据组织策略、数据排名策略、以及数据管理的其它功能。此外,该数据管理方法可进一步包括:确定与其它数据的一个或多个关系;基于该一个或多个属性、区间和/或策略产生和/或存储与该数据有关的近似结果。
在另一示例实施例中,一种计算设备包括:分析组件,配置成解释由计算设备接收的数据以确定该数据的一个或多个先前未知或未确定的属性,以创建该数据的一个或多个属性;区间组件,配置成基于该数据的该一个或多个属性将区间分配给该一个或多个属性,或使该区间与该一个或多个属性相关联;以及策略组件,配置成使策略与该一个或多个属性或区间相关联,以便于对数据的管理。
在另一示例实施例中,一种计算机可读存储介质包括计算机可读指令,计算机可读指令响应于执行使计算设备执行操作,这些操作包括解释由计算设备接收的数据以确定该数据的一个或多个先前未知或未确定的属性,以创建该数据的一个或多个属性,以及基于该解释使区间关联至该一个或多个属性。这些操作进一步包括确定与该一个或多个属性或区间有关的策略,以便于对数据的管理。
以下更详细地描述其他实施例和各非限制性性示例、场景和实现。
附图说明
参考附图进一步描述多个非限制性实施例,在附图中:
图1示出流程图,示出了采用向量时钟作为辅助来进一步描述多个实施例的示例过程;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210435249.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:天线元件及MIMO天线装置
- 下一篇:一种EVA在线裁切装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





