[发明专利]一种基于对比对抗训练的日志序列异常检测方法在审
申请号: | 202111468162.4 | 申请日: | 2021-12-03 |
公开(公告)号: | CN114138973A | 公开(公告)日: | 2022-03-04 |
发明(设计)人: | 张秀国;王乔正;王雪洁;曹志英;李旺旺 | 申请(专利权)人: | 大连海事大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30;G06K9/62;G06N3/08 |
代理公司: | 大连东方专利代理有限责任公司 21212 | 代理人: | 李馨 |
地址: | 116026 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 对比 对抗 训练 日志 序列 异常 检测 方法 | ||
1.一种基于对比对抗训练的日志序列异常检测方法,其特征在于,包括训练阶段和检测阶段;
所述训练阶段包括:
S1、获取日志数据集,并对日志数据集中的日志数据进行解析获取结构化的日志模板;
S2、按会话ID或滑动窗口由所述日志模板获取日志序列以及日志序列对应的标签从而构建训练数据集合,所述日志序列中包括正样本日志序列和负样本日志序列;
S3、判断检测模型的损失是否趋于稳定,如果还未趋于稳定则将所述训练数据集合中的部分日志序列输入到BERT异常检测模型,对所述BERT异常检测模型进行有监督训练后,再次执行步骤S3,如果检测模型的损失趋于稳定,则执行步骤S4;
S4、获取模型训练过程中的梯度数据,并使用FGM进行对抗训练扰动BERT的嵌入层;
S5、将正样本日志序列和负样本日志序列输入到被扰动的BERT异常检测模型中,生成被扰动的语义向量后取消对嵌入层的扰动并且再次生成未被扰动的语义向量;
S6、使用对比学习并且继续保持原本的有监督训练任务来对模型进行训练;
S7、判断训练集中是否已经没有日志序列,如果训练集中已经没有了需要训练的日志序列则停止训练,得到训练后的异常检测模型,否则,转步骤S4;
所述检测阶段包括:
S8、将待检测的日志序列输入到训练后的异常检测模型,查看模型的输出,根据输出结果判断日志序列是否异常。
2.根据权利要求1所述的一种基于对比对抗训练的日志序列异常检测方法,其特征在于,对日志数据集中的日志数据进行解析获取结构化的日志模板,包括使用Drain算法提取日志条目中的日志模板。
3.根据权利要求1所述的一种基于对比对抗训练的日志序列异常检测方法,其特征在于,将所述训练数据集合中的部分日志序列输入到BERT异常检测模型,对所述BERT异常检测模型进行有监督训练,包括:
设一个batch的日志序列训练集为其中N为一个batch的大小,xi为训练集中第i个日志序列,yi为与之对应的真实标签,训练的损失函数为:
其中,f为模型的forward函数,θ为模型参数,fθ(xi)即为模型的预测结果,训练阶段通过调整模型参数,使损失函数达到最小。
4.根据权利要求1所述的一种基于对比对抗训练的日志序列异常检测方法,其特征在于,使用FGM进行对抗训练扰动BERT的嵌入层,包括:
设训练时产生的梯度为g,则根据FGM算法对嵌入层产生的扰动大小为:
radv=ε·g/||g||2
其中ε为超参数,||g||2代表对梯度求二范数。
5.根据权利要求1所述的一种基于对比对抗训练的日志序列异常检测方法,其特征在于,将正样本日志序列和负样本日志序列输入到被扰动的BERT异常检测模型中,生成被扰动的语义向量后取消对嵌入层的扰动并且再次生成未被扰动的语义向量,包括:
选取出当前batch中的日志序列中获取正样本日志序列构建一个正样本集合;
获取嵌入层被扰动的BERT生成的日志序列和正负样本日志序列集合的语义向量;
取消对BERT嵌入层的扰动;
获得原嵌入层生成的日志序列和正负样本日志序列集合的语义向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连海事大学,未经大连海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111468162.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种负极材料及包括该负极材料的电池
- 下一篇:一种喷丸介质