[发明专利]一种网管系统自监控方法无效
申请号: | 201110458362.1 | 申请日: | 2011-12-31 |
公开(公告)号: | CN103188103A | 公开(公告)日: | 2013-07-03 |
发明(设计)人: | 周关力;廖昕;杨涛;陈松 | 申请(专利权)人: | 成都勤智数码科技股份有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/26 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610000 四川省成都市高*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网管 系统 监控 方法 | ||
技术领域
本发明涉及网络技术领域,尤其涉及一种网管系统自监控方法。
背景技术
随着通信技术的迅猛发展、网络环境日益复杂,为了实时掌握整个网络的运行状况,及时发现网络问题,优化网络性能和服务,网管系统顺势而生。网管系统及运维管理在多年的行业运作中有了自己一套完善理论基础及最佳实践方法,但作为网管自身的性能监控却没有一套可以支持的理论及方法,本发明公布了一种通用的网络管理系统自监控方法。
目前多数网管系统需要定期对网管系统进行重启,以释放由于长时间运行出现的系统占用较大内存、cup使用率过高等问题或者避免由于线程数过高或内存过高造成主程序卡死现象,无法满足7x24持续运行的客户需求。因为缺乏一套完善的自监控方法及措施,在网管系统发生异常时,很难进行故障排查及问题定位。
为了解决上述问题,保证网管系统的正常运行,就需要知道如下问题:系统内部具体的内存是如何分配?是否为合理占用?系统线程数是否过高?线程数过高是否合理?线程数是否一直持续上升?都哪些线程在启动?这其中哪些线程是应该关闭而未关?系统所在服务器是否存在网络问题?网管系统所监控的网络接口状态是否正常?是否可以正常接收网管信息?系统所在磁盘是否拥有充足的使用空间?所使用数据库是否正常可用。
只有掌握了这些问题的答案,当系统发生故障时我们才能快速定位问题所在:1、网管系统自身的问题;2、网管系统所在服务器性能无法满足系统正常运行;3、网管系统内部是否存在内存溢出;4、网管系统所在服务器的剩余空间是否足以存储系统运行所产生的信息;5、网管系统所在服务器是否存在网络问题造成网管系统无法进行正常网络管理等问题。
发明内容
本发明的目的在于提供一种网管系统自监控方法,通过监控网管系统运行中所产生的各种资源占用情况,监控网管系统所在服务器性能,不仅使得网管系统本身具有了自监控功能,能及时准确的监控网管系统的运行状态、详细告警故障信息,而且监控负载小、监控效率高,采用这种方法的系统可以帮助运维工程师更快的解决问题和对服务器进行优化。
本方法建议对自监控功能进行可配置操作,在系统试运行阶段进行全面自监控,在正式运行时采用部分自监控模式,避免由于全面自监控的资源消耗而影响网管系统的正常性能。
为了实现上述目的,本方法采用如下方案:一种网管系统自监控方法,该方法包括以下步骤。
A、网管系统对系统内部线程进行监控。
步骤A具体可以是,内部线程监控主要为三类:主线程监控、依存线程监控、临时线程监控。
主线程监控,监控网管系统中各模块主线程是否持续运行没有中断、卡死、重启等现象,监控方式采用心跳模式,连续3次未收到心跳信息,发送中级故障告警;连续15次未收到心跳信息,发送重大故障告警;线程心跳时断时续,但连续中断次数都不足3次,当此现象持续一定次数或时间后发送中级故障告警,说明该线程存在性能问题,具体次数可配。
依存线程监控,监控网管系统中各线程依附情况,记录各临时线程的上级线程及其与上级类依附状态;当某一线程关闭时,查看所有由该线程调用或开启并与其存在依附关系的下级线程,是否随线程的关闭而在规定的延迟时间内正常关闭。
临时线程监控,监控网管系统中所有临时开启的线程,记录并监控临时线程是否在规定的存活时间内正常关闭。
内部线程监控应记录并监控线程创建时间、关闭时间、上级线程、调用方法及其已存活时间,并记录网管系统线程总数。
线程类型:永久线程;临时线程。各模块主线程属于永久线程;临时线程可以设置线程存活时间阀值。
对线程监控应按照系统模块、线程类型进行分类,以便在发现问题是迅速定位及方便实际工作中监控权限设置。
B、监控网管系统所在服务器内存。
步骤B具体可以是,监控网管系统所在服务器内存;对监控网管系统所在服务器的内存利用率进行监控,并设置内存利用率阀值,监控内存利用率超过阀值发送告警,当内存利用率持续超过阀值一段时间后仍未处理,自动提升告警级别并发送新告警;根据实际情况对网管系统进行优化或者对设备内存进行扩容。
C、监控网管系统所在服务器CPU;
步骤C具体可以是,监控网管系统所在服务器CPU;对监控网管系统所在服务器CPU利用率进行监控,并设置CPU利用率阀值,监控CPU利用率超过阀值发送告警,当CPU利用率持续超过阀值一段时间后仍未处理,自动提升告警级别并发送新告警;根据实际情况对网管系统进行优化或者更换具有较高处理能力的宿主机器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都勤智数码科技股份有限公司,未经成都勤智数码科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110458362.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:COM接口设备转接器
- 下一篇:虚拟主机转接器