[发明专利]一种日志聚类处理方法及系统在审

申请号：	202111028390.X	申请日：	2021-09-02
公开（公告）号：	CN113723542A	公开（公告）日：	2021-11-30
发明（设计）人：	周暐;钱飞扬;巩珊珊	申请（专利权）人：	上海七牛信息技术有限公司
主分类号：	G06K9/62	分类号：	G06K9/62;G06F16/17;G06F16/18
代理公司：	上海硕力知识产权代理事务所(普通合伙) 31251	代理人：	杨松城
地址：	201203 上海市浦东新区中***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种日志处理方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开一种日志聚类处理方法和系统，所述方法包括:获取并切分日志数据；依次对每二条日志的相关性进行分析；对相关性强的日志数据进行聚类处理，获得各层聚类的结果；对各层聚类结果进行评价，获得聚类的最终评价结果。本发明采取的技术方案，不仅仅对聚类层级进行适当的抽象，得到足够合理的聚类数量，也能够提高了聚类的准确性。

技术领域

本发明涉及数据处理技术领域，尤其涉及一种日志聚类处理方法及系统。

背景技术

云计算的飞速发展，催生了大量的云平台的应用和服务，大量网络用户的信息都存储在各种各样的云平台上，随着用户的增加，各种云平台产生的日志数据也大规模的喷发，如何对这些海量的用户日志或者平台服务系统的日志进行分析和挖掘，是云平台所要面对和解决的技术问题之一。

聚类算法是目前解决这类海量日志的有效解决办法，对于日志行为的分析，目前主要的聚类算法主要有基于业务逻辑和先验知识，设计一些规则对日志进行聚类，还有一种是基于无监督学习的算法，对海量数据标签进行算法聚类。

基于不同的算法，或者不同的模型，或者设定不同的目标函数等等的差异，都会产生不同的聚类结果，每种聚类算法都有其特定的适用场景和优劣，没有一种万能的聚类算法是适合所有的场景和应用的。因此，如何评价哪种聚类结果是最佳或者最合适的的聚类，是目前业界需要解决的更深层技术问题。

发明内容

本发明为解决现有技术中存在的技术问题，提供一种日志聚类处理方法，包括以下步骤：

S1:获取并切分日志数据；

S2:依次对每二条日志的相关性进行分析；

S3:对相关性强的日志数据进行聚类处理，获得各层聚类的结果；

S4:对各层聚类结果进行评价，获得聚类的最终评价结果。