[发明专利]基于因果网络挖掘和图注意力网络的告警根因识别方法有效
申请号: | 202011084942.4 | 申请日: | 2020-10-12 |
公开(公告)号: | CN112217674B | 公开(公告)日: | 2021-12-28 |
发明(设计)人: | 张和先;杨树森;杨煜乾;田晓慧;王楠斌;徐宗本;秦刚 | 申请(专利权)人: | 西安交通大学;华为技术有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;G06N3/04;G06N3/08 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 闵岳峰 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 因果 网络 挖掘 注意力 告警 识别 方法 | ||
1.基于因果网络挖掘和图注意力网络的告警根因识别方法,其特征在于,该方法结合最大最小爬山算法以及图注意力算法来对告警数据进行准确的根因告警识别;前者用于挖掘告警之间的因果关系网络,后者则结合已有因果图,以及告警数据的特征对模型进行训练与学习;该方法具体包括以下步骤:
1)数据清洗以及数据分组处理:
对上报的原始告警数据进行缺失值以及无效值处理,并对处理后的告警数据进行分组预处理;
2)特征处理模型训练之word2vec模型:
即通过word2vec模型对步骤1)处理后的告警数据中alarm name属性中的词进行特征的初步提取,即将步骤1)处理后的告警数据中alarm name属性中涉及的每一个单词表示为40维的词向量;
3)特征处理模型训练之seq2seq模型:
即使用LSTM学习训练seq2seq模型并将最终训练得到的Encoder作为特征提取模型,得到步骤1)处理后的告警数据中所有alarm name属性的特征表示;
4)因果网络挖掘之最大最小爬山法:
首先使用步骤1)处理后的告警数据,将其处理为0、1形式的向量;其次通过最大最小爬山法挖掘告警之间的因果关系网络,最终得到告警之间因果关系的矩阵表示,最大最小爬山法以下简称为MMHC,其中使用搜索算法为禁忌搜索,使用的评分函数为AIC评分,并设置相应的置信水平为0.05;
5)根因识别之注意力神经网络模型:
使用步骤2)以及步骤3)最终得到的所有alarm name属性的特征表示以及通过步骤4)挖掘出的因果关系网络,对注意力神经网络模型进行训练与学习,注意力神经网络模型简称为GAT。
2.根据权利要求1所述的基于因果网络挖掘和图注意力网络的告警根因识别方法,其特征在于,步骤1)的具体操作为:对上报的原始告警数据进行缺失值以及无效值处理,对缺失值进行补零操作,对无效值进行删除操作;并对数据进行分组预处理,具体以p告警为中心截取前后五分钟内上报的告警为一组告警样本,用于对告警数据的alarm name属性进行处理;并设置滑动窗口为一分钟,截取原始告警数据,将每分钟内的告警看作一个样本,用于因果网络挖掘。
3.根据权利要求1所述的基于因果网络挖掘和图注意力网络的告警根因识别方法,其特征在于,步骤2)的具体操作为:对所有告警数据的alarm name属性进行处理,将所有的alarm name进行分词操作并将涉及的所有词作为一个语料库;设置滑动窗口为默认值,遍历语料库并使用输入数据对skip-gram模型进行训练与学习,最终得到语料库中每个单词的特征表示向量并保存训练模型;用作下一步特征提取。
4.根据权利要求1所述的基于因果网络挖掘和图注意力网络的告警根因识别方法,其特征在于,步骤3)的具体操作为:建立seq2seq模型,其中Encoder使用LSTM模型,Decoder使用另外一个LSTM模型;对于原始告警数据的alarm name属性,每个告警由唯一的alarmname属性来标识,将每个alarm name 中涉及的词对应的词向量特征表示依次作为LSTM的输入,设置默认超参数学习并训练模型,最终得到的Encoder作为最终的特征提取模型。
5.根据权利要求1所述的基于因果网络挖掘和图注意力网络的告警根因识别方法,其特征在于,步骤4)的具体操作为:首先使用步骤1)按照滑动窗口一分钟截取的分组数据样本,将每个告警名称看作变量,并将每一组数据看作一个样本;然后将样本变为长度为L的向量,L为原始数据涉及的所有变量的总数,其中向量的值表示在此样本中对应位置的变量是否出现,出现则为1,否则为0;其次MMHC算法分为两个阶段:第一阶段:利用MMPC算法构建贝叶斯网络的框架即无向图;第二阶段:执行评分搜索确定网络结构的边以及边的方向;
其中第一阶段MMPC算法由算法和额外的对称校验组成,算法贪婪的求得每个变量的父节点以及子节点;对称校验即如果变量T不在变量X的候选父子节点集CPC中,则从目标变量T的候选父子节点集CPC中去除X;最终得到网络的初始框架图即无向图;第二阶段通过搜索算法并设置相应参数来调整边的方向生成变量间的因果关系图;将得到的因果关系图转换为告警之间因果关系的矩阵表示。
6.根据权利要求1所述的基于因果网络挖掘和图注意力网络的告警根因识别方法,其特征在于,步骤5)的具体操作为:对于每个包含多个alarm name的样本,依次使用训练好的word2vec模型以及seq2seq模型得到样本的特征矩阵作为GAT的输入;同时使用步骤4)得到的全量告警之间的因果关系图的邻接矩阵作为输入;通过图注意力网络来更新每个样本中告警序列对应的子图上每个告警的特征表示,并通过attention机制来有选择的处理邻居节点的特征对自身的影响;最终得到传播后的每个告警的特征表示,将其输入softmax层并得到每个告警是根因告警的概率,取概率最大的告警为根因告警。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学;华为技术有限公司,未经西安交通大学;华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011084942.4/1.html,转载请声明来源钻瓜专利网。