[发明专利]系统日志模板的在线提取方法和装置在审
申请号: | 202011476333.3 | 申请日: | 2020-12-14 |
公开(公告)号: | CN112463933A | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 孟伟彬;刘莹;裴丹;菲德利阁·扎特·特里尼达;何林 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/186;G06N3/08 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 王萌 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 系统 日志 模板 在线 提取 方法 装置 | ||
1.一种系统日志模板的在线提取方法,其特征在于,包括以下步骤:
获取待处理日志,将所述待处理日志在预设的日志模板库中进行匹配;
在没有匹配到日志模板的情况下,使用已训练的单词分类器对所述待处理日志中的每一个单词做分类,获取模板单词和变量单词;
将所述变量单词替换成目标标识符,将所述目标标识符和所述模板单词组合成文本生成新日志模板,并存储在所述日志模板库中。
2.如权利要求1所述的系统日志模板的在线提取方法,其特征在于,还包括:
获取多个历史日志,并从所述多个历史日志中提取多个日志模板;
将所述多个日志模板进行存储,构建所述日志模板库。
3.如权利要求2所述的系统日志模板的在线提取方法,其特征在于,还包括:
对所述多个日志模板来每个单词进行分类,获取模板词汇样本和变量词汇样本;
将所述模板词汇样本和所述变量词汇样本作为标签输入神经网络训练,获取所述单词分类器。
4.如权利要求3所述的系统日志模板的在线提取方法,其特征在于,还包括:
对所述新日志模板中的错误分类进行分类正确结果标记;
将分类正确结果反馈到所述神经网络。
5.如权利要求1所述的系统日志模板的在线提取方法,其特征在于,还包括:
在匹配到日志模板的情况下,获取匹配日志模板作为所述待处理日志的日志模板。
6.一种系统日志模板的在线提取装置,其特征在于,包括:
第一获取模块,用于获取待处理日志,将所述待处理日志在预设的日志模板库中进行匹配;
第一分类模块,用于在没有匹配到日志模板的情况下,使用已训练的单词分类器对所述待处理日志中的每一个单词做分类,获取模板单词和变量单词;
处理模块,用于将所述变量单词替换成目标标识符,将所述目标标识符和所述模板单词组合成文本生成新日志模板,并存储在所述日志模板库中。
7.如权利要求6所述的系统日志模板的在线提取装置,其特征在于,还包括:
第二获取模块,用于获取多个历史日志,并从所述多个历史日志中提取多个日志模板;
构建模块,用于将所述多个日志模板进行存储,构建所述日志模板库。
8.如权利要求7所述的系统日志模板的在线提取装置,其特征在于,还包括:
第二分类模块,用于对所述多个日志模板来每个单词进行分类,获取模板词汇样本和变量词汇样本;
训练模块,用于将所述模板词汇样本和所述变量词汇样本作为标签输入神经网络训练,获取所述单词分类器。
9.如权利要求8所述的系统日志模板的在线提取装置,其特征在于,还包括:
标记模块,用于对所述新日志模板中的错误分类进行分类正确结果标记;
反馈模块,用于将分类正确结果反馈到所述神经网络。
10.如权利要求6所述的系统日志模板的在线提取装置,其特征在于,还包括:
所述处理模块,还用于在匹配到日志模板的情况下,获取匹配日志模板作为所述待处理日志的日志模板。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011476333.3/1.html,转载请声明来源钻瓜专利网。