[发明专利]利用异构数据源进行IT运维排查的方法及装置在审
| 申请号: | 202211387391.8 | 申请日: | 2022-11-08 |
| 公开(公告)号: | CN115718899A | 公开(公告)日: | 2023-02-28 |
| 发明(设计)人: | 陈杨 | 申请(专利权)人: | 北京银信长远科技股份有限公司 |
| 主分类号: | G06F18/2431 | 分类号: | G06F18/2431;G06F11/34;H04L41/0631;H04L41/0677 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 利用 数据源 进行 it 排查 方法 装置 | ||
利用异构数据源进行IT运维故障排查的方法及装置涉及信息技术领域。本发明由历史数据采集器、实时数据采集器、数据分类器、数据整合器、特征提取器、梯度决策树生成器和多梯度决策树应用模块组成。通过整合异构数据源的数据,进行多梯度决策树计算,通过历史数据得出各种故障对应的决策树,从而当实时数据输入各决策树进行预测时,可以很快速的确定故障位置,无需人工参与判断,提高了自动化IT运维的效率。
技术领域
本发明涉及信息技术领域。
背景技术
IT运维的一般模式是数据采集单元将被监控的指标数据采集到运维监控系统中;数据传输单元将数据采集单元采集的指标数据传输到数据存储单元;数据存储单元将收集到的指标数据按照时间维度存放在时序数据库中;数据分析单元对时序数据库中的时间数列数据的季节特征、趋势进行预测;告警触发单元在指标超过设定的阈值或者依赖服务状态变为不可达时,及时发出报警通知服务管理员排查;应用单元,基于数据采集单元和数据分析单元实现IT运维系统的可视化监控和全链路监控。这种阈值驱动型的IT运维无法从主机监控数据,服务器监控数据,网络监控数据,环境监控数据中快速定义故障范围和故障来源,需要人为参与监控,基于人的经验来排查故障原因,有限的效率使得IT运维管理系统所能管理的设备网段区域和设备数量受到限制。
现有技术中有申请号为CN202111288447X,名称为一种IT运维优化方法的专利申请,具有如下步骤:S1、获取系统历史运维数据,对数据进行预处理;S2、生成决策树,获取步骤S1中预处理的数据,对数据进行处理,利用归纳算法生成可读的规则和决策树;S3、决策树生成以后由运维平台为决策树的每个节点绑定自动化功能。与现有技术相比,通过对IT运维的历史数据进行分类处理,生成决策树,并将系统中提供的各种监听、告警、自动化配置等功能,与决策树节点进行绑定,提高IT服务效率和质量,后期通过新数据不断优化迭代决策树,使其无需人工参与,实现智能化运维。该专利没有对决策树生成进行详细论述,进行决策树节点跟处理规则的绑定需要决策树的节点和处理规则都是经常性发生的故障,适用范围为常规性故障及其特定解决方案。
IT运维的故障来源有主机故障、网络故障、机房环境故障几个方面,其中主机故障又分为操作系统故障、应用程序故障、硬件故障。已知的现有技术主要依靠各分类的阈值产生的告警来分别对各种故障进行反馈,当出现真实故障时,同时会有多个故障来源进行告警,需要进行逐一排查。针对现有技术的不足本发明的利用异构数据源进行IT运维排查的方法及装置提出一种针对各种故障来源产生的故障信息进行异构数据源的人工智能分析方法和装置,通过对异构数据的极度梯度提升树运算,自动分析出告警产生时的多源异构故障数据的最优特征和最优切分点,并计算出多个梯度的最优特征和最优切分点。每个最优特征在事先对应一种解决方案的前提下,本发明可以提供梯度化的最优故障解决方案集。
发明内容
针对现有技术的不足,本发明的利用异构数据源进行IT运维故障排查的方法及装置由历史数据采集器、实时数据采集器、数据分类器、数据整合器、特征提取器、梯度决策树生成器和多梯度决策树应用模块组成;
历史数据采集器通过IT运维监控设备获取IT运维的历史数据,IT运维的历史数据包括:主机操作系统故障时采集的数据、主机硬件故障时采集的数据、主机应用软件故障时采集的数据、网络设备故障时采集的数据和机房环境故障时采集的数据以及无任何故障时采集的数据;采集的数据包括:主机操作系统监控数据、主机硬件监控数据、主机应用监控数据、网络设备监控数据和机房环境监控数据,采集的数据为通过异构数据源采集的多源异构数据;历史数据采集器将IT运维的历史数据发送给数据分类器;
数据分类器将IT运维的历史数据分类为:主机操作系统故障时采集的数据并加主机操作系统故障标识,主机硬件故障时采集的数据并加主机硬件故障标识,主机应用软件故障时采集的数据并加主机应用软件故障标识,网络设备故障时采集的数据并加网络设备故障标识,机房环境故障时采集的数据并加机房环境故障标识,无任何故障时采集的数据并加无故障标识,生成分类的IT运维历史数据;数据分类器将分类的IT运维历史数据发送给数据整合器;标识由设备编号和故障类别组成,故障类别包括故障和无故障;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京银信长远科技股份有限公司,未经北京银信长远科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211387391.8/2.html,转载请声明来源钻瓜专利网。





