[发明专利]用于在日志分析系统中实现日志解析器的方法和系统有效
| 申请号: | 201680029404.0 | 申请日: | 2016-04-01 |
| 公开(公告)号: | CN107660283B | 公开(公告)日: | 2021-12-28 |
| 发明(设计)人: | G·M·法拉尔 | 申请(专利权)人: | 甲骨文国际公司 |
| 主分类号: | G06F16/18 | 分类号: | G06F16/18;G06F16/21;G06F16/22;G06F16/2455;G06F16/248;G06F16/35;G06F40/205;H04L12/24;H04L12/26;G06F11/30 |
| 代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 李晓芳 |
| 地址: | 美国加*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 日志 分析 系统 实现 解析 方法 | ||
1.一种用于实现日志解析器的方法,包括:
生成将日志中的第一条目的第一多个元素映射到对应的元素类型的映射结构;
相对于所述映射结构,分析所述日志中的第二条目的第二多个元素,以识别至少以下内容:
在所述第一多个元素和所述第二多个元素中相同的公共元素;以及
在所述第一多个元素和所述第二多个元素之间不同的第一可变元素;
生成包括至少以下内容的正则表达式:
所述公共元素;以及
第一匹配模式,所述第一匹配模式(a)将所述第一可变元素限制为多个可能的数据类型中的第一数据类型,并(b)在所述第一多个元素和所述第二多个元素这两者中匹配所述第一可变元素;
生成被配置为基于所述正则表达式解析日志的日志解析器;
其中所述方法由包括处理器的至少一个设备执行。
2.如权利要求1所述的方法,其中相对于所述映射结构,分析所述第二多个元素包括:
遍历所述第二多个元素;
在遍历所述第二多个元素的同时:
确定在所述第二多个元素和所述映射结构之间相同的第一公共字符;
确定在所述第二多个元素和所述映射结构之间相同的第二公共字符;
确定所述第一公共字符和所述第二公共字符之间的一个或多个中间字符在所述第二多个元素和所述映射结构之间不匹配;以及
将包含所述一个或多个中间字符的字符范围标记为所述第一可变元素。
3.如权利要求1或2所述的方法,其中所述多个可能的数据类型包括字符串类型、整数类型、字母字符类型或字段规则类型中的一个或多个,其中所述字段规则类型与由规则定义的元素序列对应。
4.如权利要求1或2所述的方法,还包括:
将所述日志的多个行的内容分组在一起,作为用于相对于所述映射结构进行分析的第二条目。
5.如权利要求4所述的方法,其中将多个行的内容分组在一起包括形成包括所述内容的单个行。
6.如权利要求1或2所述的方法,还包括:
至少通过以下操作,识别所述公共元素是所述日志内的定界符:
识别所述第一条目和所述第二条目中的多个公共元素;
至少部分基于所述多个公共元素的各自位置以及一个或多个加权因子,对所述多个公共元素进行评分;以及
至少部分基于评分来选择所述公共元素作为所述定界符。
7.如权利要求6所述的方法,其中所述一个或多个加权因子中的至少一个加权因子包括与多个元素的组合对应的基于规则的加权因子。
8.如权利要求6所述的方法,其中为所述公共元素的位置计算总和或平均值。
9.如权利要求1或2所述的方法,其中通过以下操作从所述日志中提取键字段和值字段:
由识别第一键值分隔符以及迭代地识别行内的键值对分隔符来识别用于评估一个或多个键值对的范围;以及
迭代地遍历所述行,以从键值分隔符的实例的左侧提取所述键字段并且从键值分隔符的实例的右侧提取所述值字段。
10.如权利要求9所述的方法,还包括对所述日志进行预处理,以对所述日志的字段和值部分进行分类。
11.如权利要求9所述的方法,其中后处理被应用以校正内容向所述键字段或所述值字段的有问题的指派。
12.如权利要求1或2所述的方法,其中在基于云的日志分析系统中的日志处理流水线内采用所述日志解析器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于甲骨文国际公司,未经甲骨文国际公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680029404.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:处理多根系统中的分区复位
- 下一篇:用于选择性内容许可和安全回放的技术





