[发明专利]一种日志文件解析方法及装置有效
| 申请号: | 201911060194.3 | 申请日: | 2019-11-01 |
| 公开(公告)号: | CN111026604B | 公开(公告)日: | 2022-11-22 |
| 发明(设计)人: | 胡飞;许健;周俊前;朱宏雷;高勇 | 申请(专利权)人: | 苏宁云计算有限公司 |
| 主分类号: | G06F11/30 | 分类号: | G06F11/30 |
| 代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 张慧娟 |
| 地址: | 210000 江苏省南*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 日志 文件 解析 方法 装置 | ||
本发明公开了一种日志文件解析方法及装置,属于计算机技术领域,方法包括:在RPA流程的日志文件中,将针对同一信息的多行文本解析合并成单行文本,以获得多个单行文本;对多个单行文本进行区域解析,生成包含至少一个区域对象的区域对象列表,其中,各个区域对象中均包含属于本区域的所有单行文本以及子区域对象列表;对每个单行文本进行解析得到关键字段,并记录至字段键值对列表中。本发明实施例通过对现有日志文件的二次加工,能够实现将任意格式的日志文件格式转化为标准化的数据格式,从而实现很友好地向非技术用户进行显示日志信息,以便在RPA流程发生异常时,快速定位到异常。
技术领域
本发明涉及计算机技术领域,特别涉及一种日志文件解析方法及装置。
背景技术
RPA(Robotic Process Automation,机器人流程自动化)是一种自动化工具,用于创建软件机器人的虚拟劳动力,从而优化和降低企业中端到端业务流程的成本。RPA可以翻译成机器人流程自动化,也可翻译成软件机器人、虚拟劳动者,是可以记录人在计算机上的操作,并重复运行的软件。
目前RPA设计器为流程中的每个组件定义了全局唯一的编号。在生成的RPA流程脚本中,该编号以入参的形式传递给相应的组件调用,RPA流程脚本的运行日志以文本形式写入到指定目录下。RPA设计器可以通过文件数据流的方式读取日志文件,实现进程间的信息交换。
然而,通过上述方式处理RPA流程状态信息时存在两方面的问题:一方面是由于这些日志信息包含了流程脚本运行时的堆栈信息,通常具有很强的技术性,无法很友好地向非技术用户进行显示;另一方面是日志文件中的行与RPA流程的组件并非一一对应关系,用户无法根据日志信息跳转到相应的RPA组件。
发明内容
本发明旨在至少解决现有技术或相关技术中存在的技术问题之一,为此本发明提供一种日志文件解析方法及装置。
本发明实施例提供的具体技术方案如下:
第一方面,提供了一种日志文件解析方法,所述方法包括:
在RPA流程的日志文件中,将针对同一信息的多行文本解析合并成单行文本,以获得多个单行文本;
对多个所述单行文本进行区域解析,生成包含至少一个区域对象的区域对象列表,其中,各个所述区域对象中均包含属于本区域的所有单行文本以及子区域对象列表;
对每个所述单行文本进行解析得到关键字段,并记录至字段键值对列表中。
进一步地,所述在RPA流程的日志文件中,将针对同一信息的多行文本解析合并成单行文本,以获得多个单行文本,包括:
逐行扫描所述日志文件,得到所述日志文件中的所有行文本;
对所述所有行文本分别进行剔除无效信息,并按照预设的行标志头,针对同一信息且剔除无效信息后的多行文本解析合并成单行文本,得到多个单行文本。
进一步地,所述对多个所述单行文本进行区域解析,生成包含至少一个区域对象的区域对象列表,包括:
按照预设的区域标志头,对多个所述单行文本进行区域解析,形成各个所述区域;
分别对各个所述区域内的单行文本进行区域解析,形成各个所述区域的子区域;
通过递归的方式继续对各个所述子区域内的单行文本进行区域解析,直至解析完成所有所述单行文本,生成所述区域对象列表。
进一步地,所述对每个所述单行文本进行解析得到关键字段,并记录至字段键值对列表中,包括:
对每个所述单行文本分别匹配到指定规则,其中,所述指定规则中包括预设的字段标志头和字段标志尾;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏宁云计算有限公司,未经苏宁云计算有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911060194.3/2.html,转载请声明来源钻瓜专利网。





