[发明专利]结合双向切片GRU与门控注意力机制日志异常检测方法有效
申请号: | 202110549223.3 | 申请日: | 2021-05-20 |
公开(公告)号: | CN113553245B | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 顾士景;马超;张闻彬;王高洲;殷齐林;郭爽爽;黄振;刘荫;韩圣亚;汤琳琳;于航;徐浩;张悦;王惠剑;郑海杰;张凯;刘培顺 | 申请(专利权)人: | 中国海洋大学;国网山东省电力公司信息通信公司 |
主分类号: | G06F11/34 | 分类号: | G06F11/34;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京汇捷知识产权代理事务所(普通合伙) 11531 | 代理人: | 盛君梅 |
地址: | 266100 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 结合 双向 切片 gru 门控 注意力 机制 日志 异常 检测 方法 | ||
1.一种结合双向切片GRU与门控注意力机制日志异常检测方法,其特征在于,所述结合双向切片GRU与门控注意力机制日志异常检测方法包括:使用spell在线解析日志,通过提取日志的log key,将日志解析为结构化序列,引入双向切片与门控注意力机制构建日志异常检测模型,并将解析到得到的特征序列作为日志异常检测模型的输入进行日志异常检测模型训练,利用训练好的日志异常检测模型进行日志异常检测;
所述结合双向切片GRU与门控注意力机制日志异常检测方法包括以下步骤:
步骤一,利用Spell从日志数据中解析出logkey,并利用Word2Vec工具训练log key向量;
步骤二,将logkey转换成固定长度的索引,每个索引对应一个logkey序列向量;将logkey序列向量拼接成logkey序列矩阵,作为模型的嵌入层权重;
步骤三,将日志解析出的logkey分别进行切片处理作为Bi-SSGRU-GA-Attention模型的输入;
步骤四,将log key最小子序列索引表示输入嵌入层,再输入Bi-SSGRU层,提取log key子序列层次特征;
步骤五,将每个子序列经过Bi-SSGRU提取到的特征输入到GA-Attention层,分配相应的logkey序列向量权重;
步骤六,经过多个网络层获取整个log key序列的特征表示,作为下一可能logkey概率表示;
步骤七,将logkey表按照输出的概率值从大到小排列,选取其中前b个组成集合;若系统当前时刻输出日志的logkey存在于集合中,则判断所述日志是正常的,否则即视为异常。
2.如权利要求1所述结合双向切片GRU与门控注意力机制日志异常检测方法,其特征在于,所述日志异常检测模型包括:
输入层、双向GRU层、GA-Attention层、第二GRU层、拼接层和softmax层;
输入层,用于用Word2Vec方法生成log key单词向量xm;并利用xij表示logkeyXi的第j个单词的词向量j∈[1,MaxKey];logkeyXi表示将所有的log key定义为Xi;j∈[1,MaxKey]表示每个log key的长度即为MaxKey;
双向GRU层,用于对经过Word2Vec方法生成的输入序列在两个方向分别进行处理;
GA-Attention层,用于为每个logkey中经过筛选的单词分配权重;
第二GRU层,用于对于GA-Attention层的输出序列在两个方向进行处理;
拼接层,用于将计算得到顶层输出与进行拼接;
softmax层,用于基于拼接结果计算得到一个n维向量,每一维度的值代表logkey表中的每个元素出现在当前位置的概率,并得到每个logkey出现的概率。
3.如权利要求2所述结合双向切片GRU与门控注意力机制日志异常检测方法,其特征在于,所述日志异常检测模型损失函数为:
Loss=-∑logpdj;
其中,d表示每条logkey,j表示标签;P为每个log key出现的概率。
4.如权利要求1所述结合双向切片GRU与门控注意力机制日志异常检测方法,其特征在于,步骤一中,所述利用Spell从日志数据中解析出logkey包括:
(1)初始化LCSObject、LCSseq、lineIds以及存放所有日志对象的列表LCSMap;
(2)流式读取日志,当读取到一个新的日志条目之后,遍历LCSMap,寻找该日志与所有LCSObject的最大公共子序列,如果子序列的长度大于日志序列长度的一半,则认为该日志与日志键匹配;如果找到匹配的日志对象,跳转步骤(4);如果没有,或者LCSMap为空,则跳转步骤(3);
(3)将该行日志初始化为一个新的LCSObject,放入列表LCSMap中;
(4)将该行日志更新到匹配的LCSObject的行数列表lineIds中,并且更新LCSseq;
(5)跳转至步骤(2),直到日志读取完毕。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国海洋大学;国网山东省电力公司信息通信公司,未经中国海洋大学;国网山东省电力公司信息通信公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110549223.3/1.html,转载请声明来源钻瓜专利网。