[发明专利]一种面向大规模云数据中心的服务器协同监控方法有效

专利信息
申请号: 201410166275.2 申请日: 2014-04-23
公开(公告)号: CN103944784B 公开(公告)日: 2019-03-05
发明(设计)人: 徐小龙;杨冠;章韵;李嘉豪;张凯;李爱群 申请(专利权)人: 南京邮电大学
主分类号: H04L12/26 分类号: H04L12/26;H04L12/24;H04L29/08
代理公司: 南京知识律师事务所 32207 代理人: 汪旭东
地址: 210000 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种面向大规模云数据中心的服务器协同监控方法,以服务器相互感知、彼此监视的方式来替代集中式架构的监控模式,提升服务器的自我管理能力,有效减轻监控服务器的监控负担,消除性能瓶颈和单点失效风险。发明给出了协同监控机制模型及功能组件,以及数据服务器加入系统时、单个数据服务器失效时、成片数据服务器失效时协同监控机制的工作步骤。本发明应用在大规模的云数据中心中,系统响应时间明显少于集中式监控机制的响应时间,有效实现了负载均衡,具有很低的更新开销,且无论数据服务器发生离散失效还是在服务器成片失效的情况下,均能够有效的将全部的失效服务器检测出来。
搜索关键词: 一种 面向 大规模 数据中心 服务器 协同 监控 方法
【主权项】:
1.一种面向大规模云数据中心的服务器协同监控方法,其基于服务器协同监控模型实现,服务器协同监控模型的主要部件包括监控服务器,消息路由器,数据服务器,消息队列,监控路由表,守护进程;面向大规模云数据中心的服务器协同监控的方法包括如下步骤:步骤一:所有数据服务器依次相连构成单向环形拓扑结构,每个数据服务器都有前继服务器和后继服务器且受后继服务器监控,数据服务器发生故障而失效时,由失效的数据服务器的后继服务器负责将失效数据服务器的失效情况汇报监控服务器;步骤二:当数据服务器加入系统时,面向大规模云数据中心的服务器协同监控方法为:重新建立包含该新加入的数据服务器的单向环形拓扑结构,监控服务器将新数据服务器加入系统的情况通告给任务调度器;当单个数据服务器发生故障而失效时面向大规模云数据中心的服务器协同监控方法为:该数据服务器的后继服务器负责发现并将这个情况报告给监控服务器,重新建立排除发生故障的数据服务器的单向环形拓扑结构,监控服务器将该数据服务器故障的情况通告给任务调度器,并继续进行监控;当成片数据服务器失效时面向大规模云数据中心的服务器协同监控方法为:步骤2‑1:在数据服务器DNi+1连续几个周期没有从Qi所标识的心跳队列中获得消息,则立刻向消息路由器发布一个主题为“故障”的消息包,该消息包将被填入消息路由器上的全局监控队列;步骤2‑2:监控服务器在全局监控队列中获得“故障”消息包时,从该消息包提取到发出故障信息的数据服务器为DNi+1,再由本地的监控路由表中发现DNi+1监控对象为DNi,则判定DNi故障;步骤2‑3:监控服务器更新监控路由表:首先将监控路由表中数据服务器DNi对应记录中的(PreNode,PreQID)信息(DNi‑1,Qi‑1)提取出来以更新DNi+1对应记录中的(PreNode,PreQID)信息,然后将DNi对应的记录删除;步骤2‑4:监控服务器按照DNi+1的IP地址将更新后的(PreNode,PreQID)信息再发送给数据服务器DNi+1,数据服务器DNi+1向消息路由器申请订阅标识为Qi‑1的心跳队列,DNi+1和DNi‑1建立起监控关系;步骤2‑5:监控服务器还需要将DNi故障的情况通告给任务调度器,后续再有新任务时,任务调度器将不会分配任务给DNi,除非DNi恢复正常在线状态并重新加入系统;步骤2‑6:由于DNi‑1也因故障而失效了,因此同样的,在数据服务器DNi+1连续几个周期没有从Qi‑1所标识的心跳队列中获得消息时,则又立刻向消息路由器发布一个主题为“故障”的消息包,该消息包将被填入消息路由器上的全局监控队列;步骤2‑7:监控服务器在全局监控队列中获得“故障”消息包时,从该消息包提取到发出故障信息的数据服务器为DNi+1,再由本地的监控路由表中发现DNi+1监控对象为DNi‑1,则判定DNi‑1故障;步骤2‑8:监控服务器更新监控路由表:首先将监控路由表中数据服务器DNi‑1对应记录中的(PreNode,PreQID)信息(DNi‑2,Qi‑2)提取出来以更新DNi+1对应记录中的(PreNode,PreQID)信息,然后将DNi‑1对应的记录删除;步骤2‑9:监控服务器按照DNi+1的IP地址将更新后的(PreNode,PreQID)信息再发送给数据服务器DNi+1,数据服务器DNi+1向消息路由器申请订阅标识为Qi‑2的心跳队列,DNi+1和DNi‑2建立起监控关系,单向环形网络拓扑也再次重建完成;步骤2‑10:监控服务器还需要将DNi‑1故障的情况通告给任务调度器,后续再有新任务时,任务调度器将不会分配任务给DNi‑1,除非DNi‑1恢复正常在线状态并重新加入系统;更多的数据服务器成片失效时,采用与步骤2‑6~步骤2‑9相同的流程来依次发现所有的失效数据服务器;PreNode是当前数据服务器的前继服务器,PreQID是指当前数据服务器的前继服务器的心跳队列的标识,DNi是数据服务器DNi的服务器标识,Qi是与数据服务器DNi对应的心跳队列标识,DNi‑1是数据服务器DNi‑1的服务器标识,Qi‑1是与数据服务器DNi‑1对应的心跳队列标识,DNi‑2是数据服务器DNi‑2的服务器标识,Qi‑2是与数据服务器DNi‑2对应的心跳队列标识,DNi+1是数据服务器DNi+1的服务器标识。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201410166275.2/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top