[发明专利]识别服务器系统中的热点和可能故障的方法、设备和系统在审
申请号: | 201210279582.2 | 申请日: | 2012-08-02 |
公开(公告)号: | CN103580903A | 公开(公告)日: | 2014-02-12 |
发明(设计)人: | 于昕 | 申请(专利权)人: | 人人游戏网络科技发展(上海)有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 吴立明 |
地址: | 200444 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 服务器 系统 中的 热点 可能 故障 方法 设备 | ||
技术领域
本发明的实施方式总体上涉及网络信息技术领域,更具体地,涉及以动态模式方式识别系统中的热点和可能故障的方法、设备和系统。
背景技术
在信息技术领域,特别是随着网络技术的发展,越来越多的计算设备以服务器的形式出现,这些服务器通过其上运行的应用来为其他设备(称为客户端设备)提供相应的服务和/或数据。作为示例,常见的服务器包括但不限于:游戏服务器、电子邮件(email)服务器、消息收发服务器、文件服务器、应用服务器、数据库服务器,等等。应当理解,在此使用的术语“服务器”意在表示能够通过网络向其他设备提供数据、信息、服务等的任何适当的计算设备,包括但不限于:主机计算机、个人计算机、膝上型计算机、移动计算设备、个人数字助理(PDA),等等。而且,还应理解,在此提及的“服务器”和“客户端”是相对的。特定的计算设备可能在某些情况下充当服务器,而在另一些情况下充当客户端。而且,计算设备同时充当服务器和客户端也是可能的。
在实际应用中,为了改善单个服务器的性能,通常将集群技术用于服务器中。因此,在某些情况下,往往将多个服务器组织起来进行协同工作,以模拟功能更强大解决问题的单个服务器。这种技术成为集群技术。将该集群(即计算机系统)中的每个计算机称为节点。这样,多个服务器以群集的方式组合成服务器集群(即服务器系统),并且相互协作以完成具体服务器的功能。例如,5个服务器以集群方式组合成服务器系统,以实现游戏服务器的功能。在实际应用中,可能存在如下情况,即服务器系统中的仅某一节点很繁忙,而其他节点不繁忙。则这一繁忙的节点可能为系统中的热点或者可能出现了故障。因此,识别该服务器系统中的热点和可能故障对于维持正常的网络服务和通信而言至关重要。
在现有技术中,监控设备使用固定的规则来识别系统中的热点和可能故障。例如,通过设置服务阈值,并且监控系统中的每个节点的负载(诸如CPU利用率、硬盘占用率、响应时间(即探测请求)等)是否超过该服务阈值,以判断在该节点的服务是否紧张、繁忙、是否需要扩展,即该节点是否为系统中的热点和可能故障。如果某一节点的负载超过阈值,则发出警示。例如,如果持续一段时间某一节点的CPU利用率超过90%、硬盘占用率超过80%或者响应时间超过300ms,则可以确定该节点的服务较繁忙,其可能为系统中的热点或者可能故障。然后可以通过增加节点(即服务器)来扩展该系统,或者在节点之间重新分配负载以使负载平衡来缓解服务繁忙状况,确保服务器系统的正常运行。
然而,现有技术的此类方案存在明显的缺陷。通过此类方案,只能确定节点的当前负载高于固定的阈值。但是,节点的当前负载超过阈值并不一定表明该节点为系统中的热点,也不能表明该服务器发生了故障。例如,节点的负载状况可能跟时间有关,例如在白天(例如,下午6-7点),系统中的节点由于大量的业务量都处于很繁忙的状态。因此,某一节点的负载超过阈值并不表明该节点为系统中的热点或者该节点处于故障状态。此外,在晚上,负载本该很低,但是某节点的负载明显高于其他节点的负载(但是可能还未超过所设置的阈值),则该节点可能已经出现故障。如果这种情况得不到及时有效地处理,则可能在某一时间,由于总体业务量较大,系统中的服务很繁忙,系统将在节点未出现故障的情况下不断发出警示。因此,服务器系统维护人员将需要查看服务器系统的运行日志来评估可能的热点或者故障,并采取相应的措施。这不利于快速、及时地识别系统中的热点和可能故障,并且将耗费可观的人力和物力成本。而在系统处于不繁忙状态时,某一节点的负载明显高于其他节点的负载(但是可能还未超过阈值),则也不能有效地将该节点识别为可能的热点和故障。此外,在某些情况下,系统中的服务器数目固定。因此,在多个服务器都繁忙的情况下,不可能通过增加节点数目而扩展服务器系统或者通过在节点之间重新分配负载来使负载均衡。因此,在这种情况下的警示是不必要的。
由此,本领域中需要一种动态的、更为有效、快速和准确的方式来识别系统中的热点和可能故障的方法和设备。
发明内容
为了克服现有技术中的上述缺陷,本发明的实施方式提供用于识别服务器系统中的热点和可能故障的方法、设备和系统。
在本发明的一个方面,提供一种用于识别服务器系统中的热点和可能故障的方法。该方法包括:收集所述服务器系统的每个节点处的运行负载数据;基于所收集的运行负载数据计算运行负载数据的分布;根据所计算的分布建立识别模式;以及使用所建立的识别模式将不符合所述模式的节点识别为所述服务器系统中的热点和可能故障。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于人人游戏网络科技发展(上海)有限公司,未经人人游戏网络科技发展(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210279582.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种微通道散热器
- 下一篇:一种室内采暖用热交换装置