[发明专利]基于时间度量数据实时查询服务的优化实现方法及系统有效
申请号: | 201310226273.3 | 申请日: | 2013-06-07 |
公开(公告)号: | CN103353873B | 公开(公告)日: | 2016-11-09 |
发明(设计)人: | 江伟;李欣;李东泽;张勇;储诚栋 | 申请(专利权)人: | 上海携程商务有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京英特普罗知识产权代理有限公司 11015 | 代理人: | 林彦之 |
地址: | 200335 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 时间 度量 数据 实时 查询 服务 优化 实现 方法 系统 | ||
技术领域
本发明涉及基于时间的度量数据查询服务的优化设计,特别适用于大中型网站的实时运营监控、故障预警、快速排障、容量规划、以及性能调优等诸多领域。涉及一种基于时间度量数据实时查询服务的优化实现方法及系统。
背景技术
随着一些大中型互联网企业内部的应用增多,对于实时监控整个网站的服务质量提出了越来越高的要求。为了做到实时掌握整个网站的运行情况,以不断优化系统性能,就需要收集各个应用的不同层面的实时度量数据,并对其进行有效地分析和利用。
为了随时支持高效地排障、调优,就需要保存大量的历史度量数据。随着这些度量数据不断累积,使得系统存储的压力会随之也不断加大。与此同时,对这些度量数据大量的并发查询需求,进一步提高了实现度量数据查询服务的难度。
一般的基于传统数据库的解决方案,既无法支撑基于时间的海量度量数据的存储,也无法支持高并发的查询。这基本需要涉及专门的TSD(time series database,参见http://en.wikipedia.org/wiki/Time_series_database)实现。然而基于大数据的分布式TSD实现,同样也受到Brewer的CAP分布式理论(参见http://www.cs.berkeley.edu/~brewer/cs262b-2004/PODC-keynote.pdf)的制约。著名的TSD开源实现,如opentsdb(参见http://opentsdb.net/)不支持大数据、高吞吐的度量数据查询。
发明内容
本发明的目的在于提供一种基于时间度量数据实时查询服务的优化实现方法及系统,能够支持度量数据的任意水平扩展,同时查询服务能够承受高并发、高吞吐下的实时查询压力。
为解决上述问题,本发明提供一种基于时间度量数据实时查询服务的优化实现方法,包括对查询数据库作如下操作:
存储不同的度量,每个度量包括多个度量数据点,每个度量数据点包括度量值和标签集合,所述标签集合中的每个标签由一个key/value对组成,不同的度量中的度量数据点有不同的key的集合,但同一度量中的度量数据点的key的集合是相同的,将属于同一度量,且将含有相同key/value对的组合的数据点归为一个基础时间度量序列并记录在元数据表中。
进一步的,在上述方法中,还包括对查询数据库如下操作:
利用不同的命名空间对不同的度量进行分片,即将同一类的度量归为同一个命名空间,一个度量只能属于一个命名空间,每个命名空间包含多个度量,将同一个命名空间的所有度量保存在同一张Hbase表中,同一个命名空间中的所有度量数据的生命周期相同。
进一步的,在上述方法中,还包括对查询数据库作如下操作:
当发现某类查询的查询时间跨度长、查询开销超过阈值,且查询的频率达到一预设定频率,则定期启动的map/reduce批处理任务对该类查询的相关度量进行周期性的计算获取降采样数据,并预先将降采样数据插入到HBase表中。
进一步的,在上述方法中,还包括对查询服务器作如下操作:
采用多台查询服务器同时对外提供度量的查询服务,每台查询服务器定期以一定时间间隔同步元数据表,并将其缓存在各自内存中,当任何一台查询服务器的度量元数据发生变化时,首先会和其缓存中的元数据表进行比对和更新,若如果比对成功,则更新成功;否则,更新也就失败,则该查询服务器进行冲突解决,并决定是否需要再次提交更新;
每台查询服务器对度量元数据的更新提交成功后,就更新其内存缓存。
进一步的,在上述方法中,还包括对查询服务器作如下操作:
采用基于时间分段的缓存策略,通过后台的批处理线程定期将零散的数据缓存段进行合并。
根据本发明的另一面,提供一种基于时间度量数据实时查询服务的优化实现方法系统,包括查询数据库,用于存储不同的度量,每个度量包括多个度量数据点,每个度量数据点包括度量值和标签集合,所述标签集合中的每个标签由一个key/value对组成,不同的度量中的度量数据点有不同的key的集合,但同一度量中的度量数据点的key的集合是相同的,将属于同一度量,且将含有相同key/value对的组合的数据点归为一个基础时间度量序列并记录在元数据表中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海携程商务有限公司,未经上海携程商务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310226273.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置