[发明专利]日志分类方法、装置及存储介质有效
申请号: | 201811300533.6 | 申请日: | 2018-11-02 |
公开(公告)号: | CN109408640B | 公开(公告)日: | 2021-04-20 |
发明(设计)人: | 孙木鑫 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/18 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张晓霞;刘芳 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 日志 分类 方法 装置 存储 介质 | ||
本发明提供一种日志分类方法、装置及存储介质,通过获取待分类日志的原始日志序列,对原始日志序列进行预处理,得到处理后的日志序列,将日志序列与预设的日志分类树结构进行比对,得到待分类日志的分类结果。上述方法实现系统对运行日志的自动分类,提高了日志分类的效率。
技术领域
本发明实施例涉及日志分类技术领域,尤其涉及一种日志分类方法、装置及存储介质。
背景技术
随着互联网服务的高速发展,互联网企业越来越重视服务系统的运营维护。应用服务器的运营维护直接影响到企业的用户体验,关系到企业的切身利益。在运营维护中排查应用服务问题主要参考系统日志,系统日志为最有效的判断系统运行状态的参考和排查文件,随着计算机服务器性能的提升和应用服务工程巨大化,企业应用服务每时每刻产生海量日志文件。因此,对应用服务器的运行日志进行分类显得尤为重要。
目前多数应用服务器出现问题时,往往采用人工排查日志的方式,对系统运行的日志进行分类。然而,随着企业应用日志数量的增加,人工排查日志、对日志进行分类的效率较低。因此,实现应用服务器对日志进行自动排查、分类尤为迫切。
发明内容
本发明提供的日志分类方法、装置及存储介质,实现系统对运行日志的自动分类,提高了日志分类的效率。
本发明第一方面提供一种日志分类方法,包括:
获取待分类日志的原始日志序列;
对所述原始日志序列进行预处理,得到处理后的日志序列;
将所述日志序列与预设的日志分类树结构进行比对,得到所述待分类日志的分类结果。
一种可能的实现方式中,所述日志分类树结构的创建过程,包括:
获取预设时段内系统生成的第一日志;
对所述第一日志进行预处理,得到第二日志;
根据预设排序规则对所述第二日志的日志序列进行重新排序,得到第三日志;
根据所述第三日志构建所述日志分类树结构。
一种可能的实现方式中,所述第二日志包括内容字段;所述根据预设排序规则对所述第二日志的日志序列进行重新排序,得到第三日志,包括:
统计所述内容字段中不同单词在所述预设时段内出现的频率;
将所述第二日志按照所述单词出现的频率进行重新排序,得到第三日志。
一种可能的实现方式中,所述根据所述第三日志构建所述日志分类树结构,包括:
根据所述第三日志构建初始日志分类树结构;
根据预设分支数对所述初始日志分类树结构进行剪枝,得到所述日志分类树结构。
本发明第二方面提供一种日志分类装置,包括:
获取模块,用于获取待分类日志的原始日志序列;
预处理模块,用于对所述原始日志序列进行预处理,得到处理后的日志序列;
分类模块,用于将所述日志序列与预设的日志分类树结构进行比对,得到所述待分类日志的分类结果。
一种可能的实现方式中,所述获取模块,还用于获取预设时段内系统生成的第一日志;
所述预处理模块,还用于对所述第一日志进行预处理,得到第二日志;
所述装置还包括:排序模块,用于根据预设排序规则对所述第二日志的日志序列进行重新排序,得到第三日志;
创建模块,用于根据所述第三日志构建所述日志分类树结构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811300533.6/2.html,转载请声明来源钻瓜专利网。