[发明专利]一种在线文件非法下载检测方法和装置有效

专利信息
申请号: 201911068789.3 申请日: 2019-11-05
公开(公告)号: CN110879885B 公开(公告)日: 2022-04-05
发明(设计)人: 陶敬;郝传洲;郑宁;詹旭娜;王莞尔;陈奕光;常跃 申请(专利权)人: 西安交通大学
主分类号: H04L9/40 分类号: H04L9/40;H04L67/06;G06F21/55;G06K9/62
代理公司: 西安智大知识产权代理事务所 61215 代理人: 段俊涛
地址: 710049 陕*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 在线 文件 非法 下载 检测 方法 装置
【权利要求书】:

1.一种在线文件非法下载检测方法,包括:

获取目标服务器文件下载日志并提取特征以表征用户的文件下载行为;

基于聚类算法结合统计分析获取用户下载行为基线;

根据所述用户下载行为基线对用户下载行为的合法性进行检测;

其特征在于,

所述获取目标服务器文件下载日志并提取特征以表征用户的文件下载行为,包括:

以下载文件时产生的系统日志为数据源,其中,文件传输协议包括ftp、sftp、smb;

以日志中的客户端IP地址、文件大小、文件名、下载时间为特征来表征用户的文件下载行为;

所述基于聚类算法结合统计分析获取用户下载行为基线,包括:

以每台服务器上的每个客户端IP地址为分析单位,即以每台服务器上的IP所产生的文件下载日志作为训练数据,采用聚类算法进行聚类;

根据聚类结果,针对每个类簇进行统计分析得出用户下载行为基线,即合法下载时间段、合法文件大小区间和合法下载频次。

2.根据权利要求1所述在线文件非法下载检测方法,其特征在于,所述聚类算法进行聚类的具体步骤如下:

步骤1:将每个数据点即每台服务器上的每个客户端IP地址的每条文件下载日志当作一个类簇,并提取日志特征,其特征向量表示为:,其中,向量的各个维度分别表示文件下载时间、文件大小;

步骤2:计算两两类簇之间的距离;

步骤3:将距离最小的两个类簇合并为一个类簇;

步骤4:重复步骤2和步骤3,直至满足训练迭代终止条件。

3.根据权利要求2所述在线文件非法下载检测方法,其特征在于,所述计算两两类簇之间的距离,采用如下三种方式之一:

1)Single Linkage,计算方法是将两个组合数据点中距离最近的两个数据点间的距离作为这两个组合数据点的距离;

2)Complete Linkage,计算方法与Single Linkage相反,将两个组合数据点中距离最远的两个数据点间的距离作为这两个组合数据点的距离;

3)Average Linkage,计算方法是计算两个组合数据点中的每个数据点与其他所有数据点的距离,将所有距离的均值作为两个组合数据点间的距离;

所述训练迭代终止条件根据人为参与程度采用以下三种方式之一:

1)人为参与,针对每次聚类结果绘制聚类结果图,由专家挑选最符合文件下载行为分布的聚类结果;

2)全自动化,聚类结果的好坏由某种评估指标决定,包括轮廓系数、兰德指数、互信息、标准互信息等;

3)半自动化,基于全自动化结果,由专家挑选最符合文件下载行为分布的聚类结果。

4.根据权利要求1或2或3所述在线文件非法下载检测方法,其特征在于,所述根据聚类结果,针对每个类簇进行统计分析得出用户下载行为基线,即合法下载时间段、合法文件大小区间、合法下载频次,包括:

去除异常点,异常点的判别方法采用以下两点之一:

1)基于先验经验,确定某些文件下载日志记录为非法;

2)基于聚类结果,将异常类簇即该类簇距其它类簇距离较远且类簇中数据量少于一定值视为异常点;

针对每个类簇中的正常点,统计其合法下载时间段,粒度由粗到细分为小时、分钟、秒;

统计其合法文件大小区间,范围在最大最小值的一定范围内上下浮动;

统计其合法下载频次,时间粒度由粗到细分为小时、分钟、秒。

5.根据权利要求1所述在线文件非法下载检测方法,其特征在于,所述根据所述用户下载行为的基线对用户下载行为的合法性进行检测,包括:

对用户下载的文件进行涉敏检查,若为敏感文件则该下载行为视为非法;

针对非敏感文件进行基线比对,若不在基线范围内则将该下载行为视为非法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911068789.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top