[发明专利]结构化日志数据的加工方法和装置在审
申请号: | 201910974331.8 | 申请日: | 2019-10-14 |
公开(公告)号: | CN110874350A | 公开(公告)日: | 2020-03-10 |
发明(设计)人: | 王长进 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F16/18 | 分类号: | G06F16/18;G06F16/242;G06F16/2458 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 周嗣勇 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 结构 日志 数据 加工 方法 装置 | ||
本说明书提供一种结构化日志数据的加工方法,所述结构化日志数据为Java脚本对象表示法Json格式的数据,所述方法包括:接收处理指令和待加工的Json数据;所述处理指令包括用来表达数据加工方式的符号或关键字;基于预置符号集的语法规则和语法声明进行所述处理指令的解析,生成对所述Json数据的处理逻辑;所述预置符号集中包括语法规则和所述处理指令的符号和关键字的语法声明,所述语法声明中包括按照Json格式提取Json数据的实现;将对所述Json数据的处理逻辑运行结果作为加工后的日志数据,用于进行数据挖掘。
技术领域
本说明书涉及数据处理技术领域,尤其涉及一种结构化日志数据的加工方法和装置。
背景技术
随着互联网的发展和普及,各种基于网络进行的活动都在源源不断的产生数据。数据挖掘技术能够从大量的数据中发现有价值的知识、模式、规则等信息,为科学研究、商业决策、过程控制等提供辅助支持,成为数据利用的重要方式。
基于网络进行的活动通常被网络服务提供商的各个业务平台以日志的形式记录下来,成为用于挖掘的数据来源,例如用户行为日志、业务平台的运行日志等。这些日志数据通常要先经过数据清洗,经过数据一致性检查、处理无效值及缺失值等加工过程,才能用来进行数据挖掘。
然而,由于不同的网络服务器提供商、乃至同一网络服务提供商的不同业务平台所记录的日志数据都有各自的形式,在进行数据加工时,为每种形式的日志数据分别设计配置方案,花费了开发人员的大量时间精力,而且对该配置方案的使用者来说也需要耗费相当的理解成本。
发明内容
有鉴于此,本说明书提供一种结构化日志数据的加工方法,所述结构化日志数据为Java脚本对象表示法Json格式的数据,所述方法包括:
接收处理指令和待加工的Json数据;所述处理指令包括用来表达数据加工方式的符号或关键字;
基于预置符号集的语法规则和语法声明进行所述处理指令的解析,生成对所述Json数据的处理逻辑;所述预置符号集中包括语法规则和所述处理指令的符号和关键字的语法声明,所述语法声明中包括按照Json格式提取Json数据的实现;
将对所述Json数据的处理逻辑运行结果作为加工后的日志数据,用于进行数据挖掘。
本说明书还提供了一种结构化日志数据的加工装置,所述结构化日志数据为Java脚本对象表示法Json格式的数据,所述装置包括:
输入接收单元,用于接收处理指令和待加工的Json数据;所述处理指令包括用来表达数据加工方式的符号或关键字;
处理逻辑单元,用于基于预置符号集的语法规则和语法声明进行所述处理指令的解析,生成对所述Json数据的处理逻辑;所述预置符号集中包括语法规则和所述处理指令的符号和关键字的语法声明,所述语法声明中包括按照Json格式提取Json数据的实现;
结果输出单元,用于将对所述Json数据的处理逻辑运行结果作为加工后的日志数据,用于进行数据挖掘。
本说明书提供的一种计算机设备,包括:存储器和处理器;所述存储器上存储有可由处理器运行的计算机程序;所述处理器运行所述计算机程序时,执行上述结构化日志数据的加工方法所述的步骤。
本说明书还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器运行时,执行上述结构化日志数据的加工方法所述的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910974331.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置