[发明专利]一种数据库操作异常行为检测方法及可读存储介质在审
申请号: | 202211640823.1 | 申请日: | 2022-12-20 |
公开(公告)号: | CN115952067A | 公开(公告)日: | 2023-04-11 |
发明(设计)人: | 冯骏;刘硕;周子尧 | 申请(专利权)人: | 上海市大数据中心 |
主分类号: | G06F11/34 | 分类号: | G06F11/34;G06F16/21;G06F21/60;G06F21/57 |
代理公司: | 上海科律专利代理事务所(特殊普通合伙) 31290 | 代理人: | 赵颖 |
地址: | 200072 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据库 操作 异常 行为 检测 方法 可读 存储 介质 | ||
1.一种数据库操作异常行为检测方法,其特征在于,包括如下步骤:
S01)对数据库审计类日志数据进行解析、转换和采集;
S02)使用LOF算法检测异常点;
S03)采用四分位算法检测数据库操作异常行为;
S04)结合LOF算法和四分位算法的异常检测结果,联合检测输出异常,得出最终的数据库操作异常行为检测结果。
2.如权利要求1所述的数据库操作异常行为检测方法,其特征在于,所述步骤S01中的数据库审计类日志数据来源于堡垒机或数据库审计设备的SQL请求操作日志。
3.如权利要求1所述的数据库操作异常行为检测方法,其特征在于,所述步骤S2包括:
步骤S021,针对不同的用户实体行为异常分析场景快速选取相应的多维特征;
步骤S022,对选取的特征数据进行归一化处理;
步骤S023,采用LOF算法识别异常点。
4.如权利要求1所述的数据库操作异常行为检测方法,其特征在于,所述步骤S021针对SQL请求日志用户实体,选取如下多维特征:操作频次、访问设备端口数、操作类型数、操作表数、数据库风险操作次数、sql返回的总行数、session数、访问主机的平均持续时间和session的平均持续时间。
5.如权利要求1所述的数据库操作异常行为检测方法,其特征在于,所述步骤S022对选取的特征数据采用如下的最小最大化方法处理过程:对每一个用户实体操作特征量,按照x′=(x-minA)/(maxA-minA)进行计算;其中,x为上一步骤中挑选的某个操作特征量,minA为该操作特征量的最小值,maxA为该操作特征量的最大值,x′为处理之后的特征量。
6.如权利要求1所述的数据库操作异常行为检测方法,其特征在于,所述步骤S023包括:
S0231)用欧式距离计算待检测的特征数据集中数据点的第k距离;
S0232)通过所求的第k距离确定该点第k可达距离;
S0233)通过所求的第k距离确定该点第k距离邻域;
S0234)通过可达距离和第k距离邻域计算该点局部可达密度;
S0235)通过局部可达密度计算局部离群因子,获得异常程度得分。
7.如权利要求1所述的数据库操作异常行为检测方法,其特征在于,所述步骤S03包括获取与数据库敏感操作或者异常操作有关的关键特征值,并按如下算法检测异常:
S0321)根据分位数算法计算四分位数值;
S0322)根据四分位数计算异常边界阈值;
S0323)根据异常边界阈值判定异常。
8.如权利要求7所述的数据库操作异常行为检测方法,其特征在于,所述步骤S03选取的单维度关键特征为数据库风险操作次数,用cnt表示,四分位算子用clickhouse或spark-sql的quartile()算子来实现,异常边界阈值计算公式如下:
outlier_value=Q3+γ(Q3-Q1);
Q1为四分之一分位数,Q3为四分之三分位数;Q1=quartile(cnt,0.25),Q3=quartile(cnt,0.75),2≤γ≤8。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海市大数据中心,未经上海市大数据中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211640823.1/1.html,转载请声明来源钻瓜专利网。