[发明专利]基于用户行为和文档内容的数据防泄漏分析方法及系统在审
申请号: | 201711262779.4 | 申请日: | 2017-12-04 |
公开(公告)号: | CN108011809A | 公开(公告)日: | 2018-05-08 |
发明(设计)人: | 魏效征;王志海;喻波;安鹏 | 申请(专利权)人: | 北京明朝万达科技股份有限公司 |
主分类号: | H04L12/58 | 分类号: | H04L12/58;H04L29/06;G06F21/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100097 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 用户 行为 文档 内容 数据 泄漏 分析 方法 系统 | ||
本发明公开了基于用户行为和文档内容的数据防泄漏分析方法及系统,该方法包括以下步骤:分别获取用户预定长时间段和预定短时间段的外发邮件行为相关数据,经过数据平均、归一化处理,分别得到该用户的长期行为数据向量和短期行为数据向量;根据所述用户长期行为数据向量和短期行为数据向量间的向量间距离与预定向量距离阈值的比较结果,确定用户外发邮件行为是否存在异常;对于存在异常行为的用户外发邮件,提取邮件内容文档,并判定文档的主题类别;根据文档主题类别选定与该类别关联的文本精确匹配策略规则,确定文档中是否存在敏感数据。通过本发明的技术方案,可以明显提高敏感数据外泄事件判断的准确程度,有效降低仅通过内容匹配进行判断的误报率。
技术领域
本发明涉及数据安全领域,具体涉及基于用户行为和文档内容的数据防泄漏分析方法及系统。
背景技术
企业数据防泄漏系统的主要功能是防止企业员工外发敏感数据。因此,准确判断员工外发的数据是否敏感,是数据防泄漏系统的关键。传统的手段是通过精确匹配的手段,例如关键词或正则表达式的命中次数来实现,往往容易产生很多误报。因此数据防泄漏系统迫切需要考虑更多的因素,来判定企业员工的外发数据行为是否安全事件。
对比文献1
公开号:105357217A,发明名称:基于用户行为分析的数据盗取风险评估方法和系统
该现有技术通过对内网终端用户的网络行为进行分析,发现存在风险操作的潜在终端,保护数据安全,提高内部网络的安全性。
该现有技术通过获取终端用户的操作行为对;根据所述操作行为对,获取危险操作行为对和危险操作行为对数,计算第一危险性系数;根据所述危险操作行为对,获取访问网站行为业务类型与注册业务类型的匹配数和不匹配数,计算第二危险性系数;根据拷贝行为,获取危险拷贝行为和危险拷贝文件数,计算第三危险性系数和第四危险性系数;根据所述第一危险性系数、第二危险性系数、第三危险性系数和第四危险性系数,采用预设的风险评估模型计算终端危险性系数。
上述现有技术根据终端的操作对计算危险系数,包括:拦截网络数据流;对所述网络数据流进行协议解析得到字符流;获取预设的与程序语言对应的检测字符串和/或语法分析库函数;根据所述检测字符串和/或语法分析库函数判断所述解析得到的字符流是否包含源码,若是,则阻断所述网络数据流。
上述专利文献存在以下缺点:
(1)通过用户在终端上的操作对来进行风险评估,依据风险评估后的值,进行危险性的判定,不考虑数据本身的内容,容易产生很大的误报率。
(2)真实的终端操作行为的异常,未必等价于数据盗取的安全事件。操作行为的异常,涉及到操作者的情绪、工作的临时变动等多重因素,因此不结合其他因素融合考虑,实用性必定不好。
发明内容
为解决上述技术问题,本发明提供了基于用户行为和文档内容的数据防泄漏分析方法,其特征在于,该方法包括以下步骤:
1)分别获取用户预定长时间段和预定短时间段的外发邮件行为相关数据,经过数据平均、归一化处理,分别得到该用户的长期行为数据向量和短期行为数据向量;
2)计算所述用户长期行为数据向量和短期行为数据向量间的向量间距离,根据计算得到的该向量间距离与预定向量距离阈值的比较结果,确定用户外发邮件行为是否存在异常,如果存在异常,跳转到步骤3),否则跳转到步骤5;
3)对于存在异常行为的用户外发邮件,提取邮件内容文档,并判定文档的主题类别;
4)根据文档主题类别选定与该类别关联的文本精确匹配策略规则,并采用该匹配策略规则确定文档中是否存在敏感数据;
5)结束。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明朝万达科技股份有限公司,未经北京明朝万达科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711262779.4/2.html,转载请声明来源钻瓜专利网。