[发明专利]基于主动探针的服务故障诊断系统及其方法无效
| 申请号: | 200710188015.5 | 申请日: | 2007-11-22 |
| 公开(公告)号: | CN101170447A | 公开(公告)日: | 2008-04-30 |
| 发明(设计)人: | 褚灵伟;邹仕洪;程时端;王文东 | 申请(专利权)人: | 北京邮电大学 |
| 主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/26 |
| 代理公司: | 北京博浩百睿专利代理事务所 | 代理人: | 宋子良 |
| 地址: | 100876北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 主动 探针 服务 故障诊断 系统 及其 方法 | ||
技术领域
本发明涉及服务故障管理领域,特别涉及一种基于主动探针的服务故障诊断系统及其方法。
背景技术
故障诊断需要根据故障监测得到的症状,使用一定的算法来得出故障假设。故障监测技术可以分为被动和主动两种。被动监测技术使用大量监测设施监听已存服务会话,一般基于服务用户端监测或者网络数据包收集并进行请求-响应重构,发现异常则发出告警通知管理系统。主动监测技术从特定点向服务发送探针获取应用级性能,一个探针可以监测一个或者多个系统组件的性能,根据多个探针的返回值可以判断出被监测组件的状况。
当前大多故障诊断是基于被动监测技术的,能够实时监测用户感知的服务性能,但是开销较大,基于主动监测技术的故障诊断能够减小监测开销,同样得到较好的诊断性能。
现有技术中如在The International Journal of Intelligence Controland Systems第2卷第2号2005年“Proactive Probing and Probing onDemand in Service Fault Localization”一文,该文献第107页——113页所公开的,基于主动探针对服务端系统组件状况进行监测,发现异常则利用确定性故障——探针依赖模型进一步选取探针,直到诊断出故障源为止,针对不确定性,采用简单的再次发送探针的方式进行确认,这种处理不确定性的方式过于简单。另外该文献并没有考虑传输网络对用户所感知的服务性能造成的影响。
现有技术中还有:在IEEE Transactions on Neural Networks(special issue on Adaptive Learning Systems in CommunicationNetworks)第16卷第5号2005年9月“Adaptive Diagnosis in DistributedSystems”一文,该文献第1088页——1109页所公开的,基于主动探针对分布式系统进行监测诊断。假设故障——探针依赖关系为近确定性,选择探针时采用确定性模型,诊断故障时采用概率推理技术,这种方式在选取探针时可能会选择过少探针,监测不到需要的症状。
发明内容
本发明的目的是针对上述现有技术中存在的问题提供一种基于主动探针的服务故障诊断方法,使用主动探针有效监测网络中的服务性能,保证在各个接入网内使用服务的性能;当监测发现异常时,根据监测到的症状快速准确地定位出故障根源。
本发明解决上述技术问题是通过以下技术方案来实现的:
一种基于主动探针的服务故障诊断系统,所述故障诊断系统包括:探针、管理主机、接口模块、管理/信息呈现模块、故障检测模块、故障诊断模块、依赖模型存储器、有效探针信息存储器、告警/故障信息存储器,所述探针部署在探针站上;所述管理主机和探针站通过接口模块与管理/信息呈现模块、故障检测模块、故障诊断模块相连;所述管理/信息呈现模块、故障检测模块、故障诊断模块和所述依赖模型存储器、有效探针信息存储器以及告警/故障信息存储器分别相连。
所述探针站可以位于用户主机上也可以位于其他专用监测主机上。
一种基于主动探针的服务故障诊断系统的诊断方法,包括以下步骤:
(1)选取故障监测阶段所需的探针;
(2)将步骤(1)所选探针部署在对应探针站上,周期性地监测服务性能;
(3)当监测到步骤(2)中发送的探针异常时,启动所述故障诊断模块,进一步选取探针观察服务性能;
(4)根据步骤(2)和(3)中监测到的症状,得出故障假设。
所述步骤(1)中为可能故障设置检测率门限值。
所述步骤(1)中基于不确定性故障——探针依赖模型选择监测探针集合的贪婪算法。
所述步骤(3)中选择可能故障对应的探针子集的差集作为诊断探针,进一步观察服务性能。
本发明基于主动探针的服务故障诊断系统及其方法具有以下优点:
本发明为可能发生的故障设置故障检测率门限,根据前述的故障——探针不确定性依赖模型和检测率门限建立监测探针集。这些探针从用户位于的接入网向服务发送应用层探针监测服务性能,以定义的检测率门限值发现异常。当监测探针集发现服务性能异常时,可以自动快速地选取诊断探针集来进一步观察服务状态,根据之前的观察结果推理得出故障假设。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710188015.5/2.html,转载请声明来源钻瓜专利网。





