[发明专利]一种处理日志文件的方法及装置有效
| 申请号: | 200810118286.8 | 申请日: | 2008-08-12 |
| 公开(公告)号: | CN101339531A | 公开(公告)日: | 2009-01-07 |
| 发明(设计)人: | 金明 | 申请(专利权)人: | 杭州华三通信技术有限公司 |
| 主分类号: | G06F11/34 | 分类号: | G06F11/34;G06F17/30 |
| 代理公司: | 北京德琦知识产权代理有限公司 | 代理人: | 宋志强;麻海明 |
| 地址: | 310053浙江省杭州市高新技术产业*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 处理 日志 文件 方法 装置 | ||
1、一种处理日志文件的方法,其特征在于,该方法包括:
A1、在给定分析的日志文件中选择一条日志信息;
B1、以选择的日志信息为基准,分别计算其与其后M条日志信息的相关度;将相关度大于设置的阈值的日志信息合并入当前进行分析的日志信息;并以合并后的整体为基准,分别计算其与其后M条日志信息的相关度,将相关度大于阈值的日志信息合并入该整体;以再次合并的整体为基准,分别计算其与其后M条日志信息的相关度,将相关度大于阈值的日志信息合并入该整体;直至没有日志信息可再进行合并时,将合并得到的整体作为一事件模型加入事件模型库;其中,相关度表示两条日志信息以及整体和日志信息共同出现的频率,M为设置的分析条数;
C1、在给定分析的日志文件中选择另一未分析且未加入模型的日志信息,执行步骤B1,直至给定分析的日志文件中不存在未分析且未加入模型的日志信息;
根据建立的事件模型库,对给定处理的日志文件进行分析整理,得到以事件为整体记录的日志文件。
2、根据权利要求1所述的方法,其特征在于,所述设置阈值为:在给定分析的日志文件中选择属于同一事件的日志信息,计算各日志信息之间的相关度,将相关度的平均值设置为所述阈值。
3、根据权利要求1所述的方法,其特征在于,所述计算整体与日志信息之间的相关度为:
以整体中的各成员为基准分别计算与日志信息之间的相关度,将得到的最大相关度作为该整体与日志信息之间的相关度。
4、根据权利要求1、2或3所述的方法,其特征在于,所述计算日志信息与日志信息之间的相关度为:
依据计算日志信息与日志信息之间的相关度;
其中,为计算得到的相关度;k和η为设置的调整参数;α为两条日志信息行差平均值的倒数;β为C/A+B、C/A或C/B,其中A为作为基准的日志信息在给定分析的日志文件中出现的次数,B为另一日志信息在给定分析的日志文件中出现的次数,C为该另一日志信息在作为基准的日志信息之后M条日志信息之内出现的次数。
5、根据权利要求1、2或3所述的方法,其特征在于,将合并得到的整体作为一事件模型加入事件模型库之后,进一步包括:
查找所述事件在给定分析的日志文件中总共出现的次数以及该事件无间隔连续出现的次数,当连续出现的次数与总出现次数的比值大于或等于设置的重复出现阈值时,将该事件所包含的日志信息在给定分析的日志文件中删除,执行步骤C1。
6、根据权利要求1、2或3所述的方法,其特征在于,所述根据建立的事件模型库,对给定处理的日志文件进行分析整理,得到以事件为整体记录的日志文件为:
A2、在给定处理的日志文件中选择一条日志信息;
B2、在事件模型库中查找得到包含所选日志信息的模型,在给定处理的日志文件中查找所选日志信息的后N条日志信息内是否存在所述模型所包含的其他日志信息,如果存在,从所述日志文件中提取查找到的日志信息,作为整体记录;否则,执行C2;其中,N为设置的比较条数;
C2、在给定处理的日志文件中选择另一未处理的日志信息,执行步骤B2,直至给定处理的日志文件中不存在未处理的日志信息。
7、根据权利要求1、2或3所述的方法,其特征在于,该方法进一步包括:
设置与事件对应的事件说明;
根据设置的事件说明对以事件为整体记录的日志文件进行翻译,得到各事件对应的事件说明。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州华三通信技术有限公司,未经杭州华三通信技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810118286.8/1.html,转载请声明来源钻瓜专利网。





