[发明专利]基于层次聚类的日志审计方法有效
申请号: | 201610808905.0 | 申请日: | 2016-09-07 |
公开(公告)号: | CN106446076B | 公开(公告)日: | 2019-10-18 |
发明(设计)人: | 李千目;孙康 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06F16/18 | 分类号: | G06F16/18;G06F16/28 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 朱显国 |
地址: | 210094 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于层次聚类的日志审计方法。系统读入日志信息;根据所读入的日志信息,分析出其中关键字;根据所得的关键字将日志信息进行词向量转化;系统对所得的词向量进行聚类分析,并展示分析所得的小块异常信息。本发明避免了人工审计日志的繁重,并能够实现自动对异常日志信息的过滤,增强了用户体验效果。 | ||
搜索关键词: | 基于 层次 日志 审计 方法 | ||
【主权项】:
1.一种基于层次聚类的日志审计方法的工作方法,其特征在于包括以下步骤:步骤1:查找每条日志的关键字;步骤2:根据关键字构造词袋,构造集合包含所有关键字;步骤3:构造词向量空间,将每条日志用向量方法表示;针对半结构化的日志数据进行向量表示,半结构化日志存在固定属性项与可变描述项,日志向量的构造步骤如下:(1)选取关键字;(2)选取一定数量日志的可变描述项的集合V;(3)采用tf‑idf方法选取V的n个关键字的有序集合D,tf‑idf为一种关键字选取方法;(4)构造日志向量:(5)选取一条日志的可变描述项,构建可变项的向量;T=<t1,t2,…,tn>,对可变描述项进行分词,得到分词结果;W=<w1,w2,…,wm>,建立若wi=Dj,则记tj为1,否则tj为0;(6)提取当前日志的固定属性项<s1,s2,…,sm>,将其与可变项向量结合得到日志的向量表示如下:L=<s1,s2,…,sm,t1,t2,…,tn>;步骤4:采用最近邻链方法对日志进行聚类;(1)初始化簇:将每个簇划分为一点;(2)构建栈S,初始为空,用于存放当前激活点;(3)当集合中多余指定数目则循环执行以下步骤:(4)若S为空,随机选择一个激活点,加入S;(5)取S栈顶元素C;计算C与其它簇的距离,得到元素D为C的最近簇;(6)若D已经在S中,D必然是C在栈中的上一个元素,将CD出栈合并;否则将D加入S;步骤5:去除元素最多的类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610808905.0/,转载请声明来源钻瓜专利网。
- 上一篇:页面请求处理方法及装置
- 下一篇:一种对象上传方法和电子设备