[发明专利]一种日志要素提取方法、装置、设备及存储介质在审
| 申请号: | 202211371379.8 | 申请日: | 2022-11-03 |
| 公开(公告)号: | CN115686853A | 公开(公告)日: | 2023-02-03 |
| 发明(设计)人: | 王洪福;康华阳 | 申请(专利权)人: | 北京优特捷信息技术有限公司 |
| 主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F16/17;G06F16/18 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 马迪 |
| 地址: | 100102 北京市朝阳区阜通*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 日志 要素 提取 方法 装置 设备 存储 介质 | ||
1.一种日志要素提取方法,其特征在于,包括:
对获取的原始日志数据进行多行合并生成合并日志数据;
构建正则分组,根据各所述正则分组对所述合并日志数据进行提取获得提取数据;
根据所述提取数据获得日志要素提取结果。
2.根据权利要求1所述的方法,其特征在于,所述对获取的原始日志数据进行多行合并生成合并日志数据,包括:
根据所述原始日志数据的开始标识和结束标识,确定所述原始日志数据中各日志事件的开始位置和结束位置;
将各相邻日志事件中前一日志事件的所述开始位置和后一日志事件的所述结束位置作为拼接点;
根据所述拼接点将各所述相邻日志事件包含的日志数据进行合并生成合并日志数据。
3.根据权利要求1所述的方法,其特征在于,所述构建正则分组,包括:
获取用户输入的日志提取要素,其中,所述日志提取要素包括字段名、分隔符和字段值;
根据校验规则对所述日志提取要素进行校验;
确定所述日志提取要素校验正确时,根据所述日志提取要素构建所述正则分组。
4.根据权利要求3所述的方法,其特征在于,所述根据所述日志提取要素构建所述正则分组,包括:
获取用户输入的各分组名,并确定所述分组名所在的行位置;
将位于同一所述行位置的各所述日志提取要素作为对应提取要素;
根据所述分组名和所述对应提取要素的对应关系构建所述正则分组。
5.根据权利要求4所述的方法,其特征在于,所述根据各所述正则分组对所述合并日志数据进行提取获得提取数据,包括:
按照所述行位置由前到后的顺序依次选择所述正则分组;
将所述正则分组中的各所述对应提取要素结合正则模板生成正则表达式;
根据所述正则表达式分别对所述合并日志数据进行提取获得提取数据。
6.根据权利要求5所述的方法,其特征在于,所述将所述正则分组中的各所述对应提取要素结合正则模板生成正则表达式,包括:
将各所述对应提取要素中字段名、分隔符和字段值结合对应的正则模板生成字段名正则、分隔符正则和字段值正则;
将所述字段名正则、所述分隔符正则和所述字段值正则依次拼接生成所述正则表达式。
7.根据权利要求1所述的方法,其特征在于,所述根据所述提取数据生成日志要素提取结果,包括:
根据过滤规则对所述提取数据中的字段进行过滤获得过滤结果,其中,所述过滤规则中包括保留字段和丢弃字段;
将所述过滤结果进行拼接生成所述日志要素提取结果。
8.一种日志要素提取装置,其特征在于,包括:
合并日志数据生成模块,用于对获取的原始日志数据进行多行合并生成合并日志数据;
提取数据获取模块,用于构建正则分组,根据所述正则分组对所述合并日志数据进行提取获得提取数据;
日志要素提取结果生成模块,用于根据所述提取数据生成日志要素提取结果。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京优特捷信息技术有限公司,未经北京优特捷信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211371379.8/1.html,转载请声明来源钻瓜专利网。





