[发明专利]基于用户行为和文档内容的数据防泄漏分析方法及系统在审

专利信息
申请号: 201711262779.4 申请日: 2017-12-04
公开(公告)号: CN108011809A 公开(公告)日: 2018-05-08
发明(设计)人: 魏效征;王志海;喻波;安鹏 申请(专利权)人: 北京明朝万达科技股份有限公司
主分类号: H04L12/58 分类号: H04L12/58;H04L29/06;G06F21/62
代理公司: 暂无信息 代理人: 暂无信息
地址: 100097 北京市海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 用户 行为 文档 内容 数据 泄漏 分析 方法 系统
【权利要求书】:

1.基于用户行为和文档内容的数据防泄漏分析方法,其特征在于,该方法包括以下步骤:

1)分别获取用户预定长时间段和预定短时间段的外发邮件行为相关数据,经过数据平均、归一化处理,分别得到该用户的长期行为数据向量和短期行为数据向量;

2)计算所述用户长期行为数据向量和短期行为数据向量间的向量间距离,根据计算得到的该向量间距离与预定向量距离阈值的比较结果,确定用户外发邮件行为是否存在异常,如果存在异常,跳转到步骤3),否则跳转到步骤5;

3)对于存在异常行为的用户外发邮件,提取邮件内容文档,并判定文档的主题类别;

4)根据文档主题类别选定与该类别关联的文本精确匹配策略规则,并采用该匹配策略规则确定文档中是否存在敏感数据;

5)结束。

2.根据权利要求1所述的方法,所述步骤1)中的外发邮件行为相关数据包括:邮件发送时间、邮件发件人地址、邮件发件人域、邮件收件人地址、邮件收件人域、邮件收件人顶级域名、邮件主题类型、发送的邮件数量、收到的邮件数量、邮件的大小、邮件客户端IP地址、邮件服务器IP地址。

3.根据权利要求1所述的方法,所述步骤2)中所述用户长期行为数据向量和短期行为数据向量间的向量间距离为马氏距离(Mahalanobis Distance),而向量距离阈值由卡方校验方法确定,如果所述向量间距离大于所述向量距离阈值,则判定用户外发邮件行为存在异常。

4.根据权利要求1所述的方法,所述步骤3)中,对提取的邮件文档内容进行分词,然后使用线性判别式分析LDA(Linear Discriminant Analysis)方法,根据文档包含的字词内容,判定文档的主题类别。

5.根据权利要求1所述的方法,所述步骤4)中的精确匹配策略规则包括正则表达式匹配策略规则和关键词匹配策略规则。

6.基于用户行为和文档内容的数据防泄漏分析系统,其特征在于,该系统包括:

数据向量建立模块,分别获取用户预定长时间段和预定短时间段的外发邮件行为相关数据,经过数据平均、归一化处理,分别得到该用户的长期行为数据向量和短期行为数据向量;

异常确定模块,计算所述用户长期行为数据向量和短期行为数据向量间的向量间距离,根据计算得到的该向量间距离与预定向量距离阈值的比较结果,确定用户外发邮件行为是否存在异常;

文档主题类别判定模块,对于存在异常行为的用户外发邮件,提取邮件内容文档,并判定文档的主题类别;

精确分析模块,根据文档主题类别选定与该类别关联的文本精确匹配策略规则,并采用该匹配策略规则确定文档中是否存在敏感数据。

7.根据权利要求6所述的系统,所述外发邮件行为相关数据包括:邮件发送时间、邮件发件人地址、邮件发件人域、邮件收件人地址、邮件收件人域、邮件收件人顶级域名、邮件主题类型、发送的邮件数量、收到的邮件数量、邮件的大小、邮件客户端IP地址、邮件服务器IP地址。

8.根据权利要求6所述的系统,所述用户长期行为数据向量和短期行为数据向量间的向量间距离为马氏距离(Mahalanobis Distance),而向量距离阈值由卡方校验方法确定;

如果异常确定模块确定所述向量间距离大于所述向量距离阈值,则判定用户外发邮件行为存在异常。

9.根据权利要求6所述的系统,文档主题类别判定模块先将待检测的邮件文档统一转换为txt文本文档格式,对提取的邮件文档内容进行分词,然后使用线性判别式分析LDA(Linear Discriminant Analysis)方法,根据文档包含的字词内容,判定文档的主题类别。

10.一种计算机可读存储介质,其特征在于,该介质包括计算机程序指令,通过执行所述计算机程序执行实现权利要求1-5之一所述的方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明朝万达科技股份有限公司,未经北京明朝万达科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711262779.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top