[发明专利]一种高可用的云监控系统及监控方法在审
申请号: | 201710153557.2 | 申请日: | 2017-03-15 |
公开(公告)号: | CN106878111A | 公开(公告)日: | 2017-06-20 |
发明(设计)人: | 张建伟;高传集;孙思清 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | H04L12/26 | 分类号: | H04L12/26 |
代理公司: | 济南舜源专利事务所有限公司37205 | 代理人: | 刘晓政 |
地址: | 450000 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 可用 监控 系统 方法 | ||
技术领域
本发明属于云计算技术领域;具体涉及一种高可用的云监控系统及监控方法。
背景技术
云资源监控系统是保证云平台正常运转的关键,旨在收集资源负载信息,是作业调度、负载均衡、事件预测、故障检测及恢复等的前提。
对云平台上动态、复杂的虚拟资源进行实时、有效的监控和管理是保证云平台可用性的关键。
现有云监控系统中,为实时反映云平台中的资源负载情况,监控组件需要大量收集资源负载信息,监控组件与被监控资源间存在频繁的数据传输,造成较大的通信开销,容易导致网络拥堵,很难做到监控信息的实时同步和监控系统的稳定可靠,并对云平台的运转造成干扰,影响云平台的正常使用,降低服务质量。此为现有技术的不足之处。
因此,针对现有技术中的上述缺陷,提供设计一种高可用的云监控系统及监控方法;以解决上述技术问题,是非常有必要的。
发明内容
本发明的目的在于,针对上述现有技术存在的缺陷,提供设计一种高可用的云监控系统及监控方法,以解决上述技术问题。
为实现上述目的,本发明给出以下技术方案:
一种高可用的云监控系统,它包括设置于各个待检测节点的agent模块;其特征在于,各agent模块将采集到的待检测节点的状态信息发送到agentCluster节点,agentCluster节点将采集到的数据发送至SERVER服务端;
所述的待检测节点包括物理主机和虚拟机。
优选地,各agent模块之间定期相互发送心跳信息。
本发明还给出一种高可用的云监控方法,包括以下步骤:
步骤1):在待监控主机中设置智能agent模块,并通过Server服务端以文件的形式将监控任务发送到待监控主机中;待监控主机包括物理主机以及虚拟机;
步骤2):将监控脚本(BAT或是SHELL形式)通过Server服务端传送到待监控物理主机以及虚拟机中;脚本传输完结束后向agent模块传送监控命令,agent模块收到命令后运行对应的脚本文件,采集监控数据;
步骤3):以物理主机中的agent模块作为agentCluster节点,虚拟机中的agent作为Cluster群集合的成员;Cluster群集合成员中的各agent模块之间以固定时间Theartbeating发送心跳数据报文,作为各agent模块存活的标志;
步骤4):各agent模块依据任务列表读取任务脚本,发送采集到的数据给agentCluster节点;初始监控周期为default_monitor_time(i),同时设置监控周期变化步长,采样的时间间隔的调整大小为原子时间atomic_time(i)的整数倍;
步骤5):agent分别为不同的监控指标建立对应的存储队列,并计算数据缓冲队列中的数据的偏差情况,其计算使用如下模型:
其中δ表示样本数据的标准差,Xi为采集到的第i个数据的状态信息;
步骤6):在步骤5)的基础上,定义第i个监控指标的数据偏差的上限为threshold(i);如果采集到的数据的变化趋势较为平稳即δ<threshold(i),则增大数据监控采样周期,如果监控采集到的数据的变化趋势较大,即δ>=threshold(i),则缩小数据监控采样周期的大小;
步骤7):agentCluster节点接收到数据之后,将监控数据通过消息队列发送给监控平台的Server服务端。
作为优选,所述步骤1)中,监控任务包括监控指标(cpu,内存,存储等)以及监控脚本的存放路径。
作为优选,所述步骤3)中还包括以下步骤:
当agent超过时间Theartbeating,没有发送心跳数据,则认为该agent已关闭;agentCluster节点负责定时报告成员agent的运行状态;当cluster群集合成员发现agentCluster关闭,则启动分布式选举算法Paxos,重新选择agentCluster节点。
作为优选,所述步骤6)中,增大数据监控采样周期的计算模型为:
monitor_time(i)=default_monitor_time(i)①
monitor_time(i)=monitor_time(i)+atomic_time(i)*f(δ,threshold(i))②
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710153557.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据流量的监控方法、装置及设备
- 下一篇:一种网关控制器、数据传输方法及装置