[发明专利]一种云平台日志的分析方法、系统、设备及介质有效
| 申请号: | 202110801817.9 | 申请日: | 2021-07-15 | 
| 公开(公告)号: | CN113254255B | 公开(公告)日: | 2021-10-29 | 
| 发明(设计)人: | 雷跃辉 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 | 
| 主分类号: | G06F11/07 | 分类号: | G06F11/07;G06F16/35;G06F40/279;G06K9/62 | 
| 代理公司: | 北京连和连知识产权代理有限公司 11278 | 代理人: | 刘小峰;杨帆 | 
| 地址: | 215000 江苏省苏州*** | 国省代码: | 江苏;32 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 平台 日志 分析 方法 系统 设备 介质 | ||
1.一种云平台日志的分析方法,其特征在于,包括以下步骤:
对云平台日志进行过滤重复和格式处理以使每条日志分为时间戳、日志地址、代码模块、日志等级和具体的日志内容五个部分,按照预设时间长度将日志记录的时间平均分成多个时间段,并统计每个时间段内的日志总数;
选取包括多个连续时间段的时间窗口,对所述时间窗口中的每个时间段根据相异度数值进行分类以得到异常类,并根据所述异常类中日志对应的时间确定发生故障的时间段,
其中所述对所述时间窗口中的每个时间段根据相异度数值进行分类以得到异常类包括:
从所述时间窗口中随机选取第一数量个时间段作为初始中心点;
依次计算每个剩余的时间段到所有初始中心点的相异度数值,并根据所述相异度数值将每个剩余的时间段分到对应的初始中心点以形成多个簇;以及
计算每个所述簇的误差平方和,基于所述误差平方和在所述簇中确定新的中心点,并基于新的多个中心点再次计算相异度数值并重复上述步骤直到满足聚类条件;
其中所述根据所述异常类中日志对应的时间确定发生故障的时间段包括:
获取每个类别中日志总数,并判断是否存在类别的日志总数小于阈值;
响应于不存在类别的日志总数小于阈值,根据日志总数最小的类别确定发生故障的时间段;以及
响应于存在类别的日志总数小于所述阈值,根据日志总数大于或等于所述阈值的类别中日志总数最小的类别和日志总数小于所述阈值的类别确定发生故障的时间段;
对发生故障的时间段的日志进行分词,并计算每个单词的词频和逆文本频率;以及
根据词频和逆文本频率的乘积确定发生故障的原因,其中所述根据词频和逆文本频率的乘积确定发生故障的原因包括:
计算每个单词的词频和逆文本频率的乘积,并按照所述乘积由大到小将对应的词进行排序;以及
根据排在前面的预设数量个单词确定发生故障的原因。
2.根据权利要求1所述的分析方法,其特征在于,所述根据所述相异度数值将每个剩余的时间段分到对应的初始中心点以形成多个簇包括:
确定待分的当前时间段对应的最低的相异度数值,并将所述当前时间段分到所述最低的相异度数值对应的初始中心点。
3.根据权利要求1所述的分析方法,其特征在于,所述重复上述步骤直到满足聚类条件包括:
判断是否存在簇的误差平方和的大小出现拐点;以及
响应于存在簇的误差平方和的大小出现拐点,停止重复上述步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110801817.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于图像二分标识的视频压缩方法
- 下一篇:一种结冰风洞供气系统和方法





