[发明专利]一种日志识别方法、装置、终端及存储介质在审
申请号: | 202010064044.6 | 申请日: | 2020-01-20 |
公开(公告)号: | CN111258853A | 公开(公告)日: | 2020-06-09 |
发明(设计)人: | 严月强 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30;G06F11/34 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 刘丽华;孙芬 |
地址: | 518052 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 日志 识别 方法 装置 终端 存储 介质 | ||
本发明提供一种日志识别方法,包括:接收用户输入的日志查询请求,其中,日志查询请求中携带有待查询的日志ID及关键日志行;获取与日志ID对应的存储日志;当全量识别存储日志中不包括关键日志行时,对所述关键日志行进行第一次切割,得到多个第一子日志;当识别存储日志中存在第一目标日志行时,输出所述日志查询请求结果。本发明还提供一种日志识别装置、终端及存储介质。本发明在全量识别不了存储日志中的关键日志行时,通过对关键日志行进行至少一次切割后再识别,提高了日志的识别精度。
技术领域
本发明涉及计算机运维技术领域,具体涉及一种日志识别方法、装置、终端及存储介质。
背景技术
目前为了提升定位的效率,避免多次重复定位,在通过查看服务器日志来定位后台出现的问题时,一般通过智能化识别程序去自动定位问题。现有技术采用监督的机器学习模型SVM(支持向量机)算法对大量的日志和人工标记的定位结论的样本进行训练,得到一个有效的模型来进行自动定位。此方法存在2个很大的问题,第一:需要大量的样本数量,一般情况下无法拿到大量的标记数据;第二:需要耗费很多资源,因为要训练的样本日志文本一般都比较长。故利用SVM算法去做智能定位,并不是很实用,现有的其它机器学习算法也都存在类似的问题。
此外,还有一种常见的解决方案,首先通过人工标记一些问题对应的关键日志,然后再由程序查找请求日志中是否存在关键日志,如果在请求日志中查找到关键日志,确定请求日志出现了此问题,但是,请求日志里存在较多的变量值,只要请求参数不同,变量值内容可能就不一样,同样日志行也会跟着标记的日志行有略微的差别,识别率较低。
发明内容
鉴于以上内容,有必要提出一种日志识别方法、装置、终端及存储介质,在全量识别不了存储日志中的关键日志行时,通过对关键日志行进行至少一次切割后再识别,提高了日志的识别精度。
本发明的第一方面提供一种日志识别方法,所述方法包括:
接收用户输入的日志查询请求,其中,所述日志查询请求中携带有待查询的日志ID及关键日志行;
获取与所述日志ID对应的存储日志;
全量识别所述存储日志中是否包括所述关键日志行;
当所述存储日志中不包括所述关键日志行时,对所述关键日志行进行第一次切割,得到多个第一子日志;
识别所述存储日志中是否存在第一目标日志行与所述多个第一子日志中的至少一个第一子日志一致;
当所述存储日志中存在所述第一目标日志行时,输出所述日志查询请求结果。
优选的,所述当所述存储日志中不包括所述关键日志行时,对所述关键日志行进行第一次切割,得到多个第一子日志包括:
计算所述关键日志行的长度;
当所述关键日志行的长度小于预设第一长度时,确定第一次切割的第一起始下标和对应所述第一起始下标的第一结束下标,并根据所述第一起始下标和所述第一结束下标对所述关键日志行进行第一次切割;
当所述关键日志行的长度大于或者等于所述预设第一长度时,确定第一次切割的第二起始下标和对应所述第二起始下标的第二结束下标,并根据所述第二起始下标和所述第二结束下标对所述关键日志行进行第一次切割。
优选的,所述确定第一次切割的第一起始下标和对应所述第一起始下标的第一结束下标包括:
确定所述第一起始下标为1,并在每轮第一次切割时将所述第一起始下标增加1作为新的第一起始下标;
在每轮第一次切割时将所述预设第一长度与预设第一切割比值的乘积进行取整得到第一取整数据,并确定所述第一起始下标和所述第一取整数据之和再减去1得到的值作为所述第一起始下标对应的第一结束下标;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010064044.6/2.html,转载请声明来源钻瓜专利网。