[发明专利]日志文件压缩包的解析方法、装置、设备及介质在审
| 申请号: | 202011399936.8 | 申请日: | 2020-12-02 |
| 公开(公告)号: | CN112491421A | 公开(公告)日: | 2021-03-12 |
| 发明(设计)人: | 李刚;谢永恒;石志中 | 申请(专利权)人: | 北京锐安科技有限公司 |
| 主分类号: | H03M7/30 | 分类号: | H03M7/30;G06F9/54;G06F16/18 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100044 北京市海淀区西小口*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 日志 文件 压缩 解析 方法 装置 设备 介质 | ||
1.一种日志文件压缩包的解析方法,其特征在于,包括:
通过基于日志收集系统Flume预先创建的文件读取类读取日志文件压缩包;其中,所述日志文件压缩包中包括多个bcp文件;
通过所述文件读取类中的自定义反序列化器,对所述日志文件压缩包进行行数据解析,并将解析结果存储到至消息队列中。
2.根据权利要求1所述的方法,其特征在于,通过所述文件读取类中的自定义反序列化器,对所述日志文件压缩包进行行数据解析,包括:
通过所述自定义反序列化器的构造函数将所述日志文件压缩包从所述文件读取类的文件读取接口传递至所述自定义反序列化器的反序列器接口;
通过所述自定义反序列化器从所述反序列器接口获取到所述日志文件压缩包之后,对所述日志文件压缩包进行解压得到所述多个bcp文件,并对所述多个bcp文件进行行数据解析。
3.根据权利要求2所述的方法,其特征在于,通过所述自定义反序列化器对所述多个bcp文件进行行数据解析,包括:
通过所述自定义反序列化器对所述多个bcp文件进行遍历,针对每个所述bcp文件,采用文件读取对象按行进行文件内容读取。
4.根据权利要求2所述的方法,其特征在于,在通过所述自定义反序列化器对所述日志文件压缩包进行解压得到所述多个bcp文件之前,还包括:
如果所述日志文件压缩包为加密压缩包,则通过所述自定义反序列化器获取Flume配置文件中的解压密码,并根据所述解压密码对所述日志文件压缩包进行解密。
5.根据权利要求1所述的方法,其特征在于,通过基于Flume预先创建的文件读取类读取日志文件压缩包,包括:
通过所述文件读取类获取Flume配置文件中的压缩包存储路径,并根据所述压缩包存储路径读取日志文件压缩包。
6.根据权利要求1所述的方法,其特征在于,所述消息队列为Kafka消息队列;在将解析结果存储到至消息队列中之后,还包括:
通过Kafka消费程序对所述Kafka消息队列中的解析结果进行实时分析。
7.根据权利要求6所述的方法,其特征在于,通过所述自定义反序列化器将解析结果存储到至消息队列中,包括:
通过所述自定义反序列化器获取Flume配置文件中的Kafka消息队列主题名称,根据所述Kafka消息队列主题名称将解析结果存储到至Kafka消息队列中。
8.一种日志文件压缩包的解析装置,其特征在于,包括:
日志文件压缩包读取模块,设置为通过基于Flume预先创建的文件读取类读取日志文件压缩包;其中,所述日志文件压缩包中包括多个bcp文件;
日志文件压缩包行数据解析模块,设置为通过所述文件读取类中的自定义反序列化器,对所述日志文件压缩包进行行数据解析,并将解析结果存储到至消息队列中。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京锐安科技有限公司,未经北京锐安科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011399936.8/1.html,转载请声明来源钻瓜专利网。





