[发明专利]日志模板获取方法、装置、计算机设备及存储介质在审
| 申请号: | 202211705220.5 | 申请日: | 2022-12-28 |
| 公开(公告)号: | CN116029289A | 公开(公告)日: | 2023-04-28 |
| 发明(设计)人: | 隋毅;赵硕;王宇;范潇;李翔;肖莉 | 申请(专利权)人: | 中国电信股份有限公司 |
| 主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/216;G06F40/186;G06F16/31;G06F16/335 |
| 代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 孙宝海 |
| 地址: | 100033 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 日志 模板 获取 方法 装置 计算机 设备 存储 介质 | ||
本申请提供日志模板获取方法、装置、计算机设备及存储介质,应用于计算机技术领域,该方法包括:获取当前日志数据,并进行预处理,得到待处理日志数据;对待处理日志数据中的每条当前日志进行分词处理,得到每条当前日志对应的当前日志分词组;获取预设的词频统计信息,并根据预设的词频统计信息和每条当前日志对应的当前日志分词组对每条当前日志进行分组,得到多个日志分组,实现对当前日志进行准确分组,有效避免在变长变量日志场景下由于日志事件的当前日志的长度不同,造成当前日志分类不准确的问题,然后根据预设的词频统计信息、每个日志分组和预设的日志模板数据库,获取目标日志模板,从而提高日志模板提取的准确率。
技术领域
本申请属于计算机技术领域,具体涉及一种日志模板获取方法、装置、计算机设备及存储介质。
背景技术
计算机系统、云服务器以及智能手机、笔记本电脑等系统在运行时经常会出现故障和安全事件等异常情况,日志作为上述系统运行时的一部分,是人们获取上述异常情况的重要途径之一,而对日志模板进行提取是异常检测、故障诊断等运维工作不可或缺的重要手段。
目前,主要通过日志分词长度对日志进行分组聚合后,再对日志模板进行提取,而不同日志事件或者相同的日志事件产生的日志消息可能具有相同的日志消息长度,造成变长变量日志场景下日志模板的增加和重读,导致提取的日志模板准确率较低。
该背景技术部分中包括的信息仅用于增强对本公开的一般背景的理解,并且不能被视为对该信息构成本领域技术人员已知的现有技术的承认或任何形式的暗示。
发明内容
本申请提供一种日志模板获取方法、装置、计算机设备及存储介质,以提高日志模板提取的准确率。
一种日志模板获取方法,所述方法包括:
获取当前日志数据,并进行预处理,得到待处理日志数据;
对所述待处理日志数据中的每条当前日志进行分词处理,得到每条所述当前日志对应的当前日志分词组;
获取预设的词频统计信息,并根据所述预设的词频统计信息和每条所述当前日志对应的当前日志分词组对每条所述当前日志进行分组,得到多个日志分组;
根据所述预设的词频统计信息、所述日志分组和预设的日志模板数据库,获取目标日志模板。
一种日志模板获取装置,所述装置包括:
第一预处理模块,用于获取当前日志数据,并进行预处理,得到待处理日志数据;
第一分词处理模块,用于对所述待处理日志数据中的每条当前日志进行分词处理,得到每条所述当前日志对应的当前日志分词组;
日志分组模块,用于获取预设的词频统计信息,并根据所述预设的词频统计信息和每条所述当前日志对应的当前日志分词组对每条所述当前日志进行分组,得到多个日志分组;
模板确定模块,用于根据所述预设的词频统计信息、所述日志分组和预设的日志模板数据库,获取目标日志模板。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述日志模板获取方法。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述日志模板获取方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信股份有限公司,未经中国电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211705220.5/2.html,转载请声明来源钻瓜专利网。





