[发明专利]敏感数据识别方法、装置、电子设备及存储介质在审
| 申请号: | 202010035825.2 | 申请日: | 2020-01-14 |
| 公开(公告)号: | CN111291044A | 公开(公告)日: | 2020-06-16 |
| 发明(设计)人: | 卢骏;康乾 | 申请(专利权)人: | 中移(杭州)信息技术有限公司;中国移动通信集团有限公司 |
| 主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/27;G06F16/16;G06F16/182;G06F21/62 |
| 代理公司: | 上海晨皓知识产权代理事务所(普通合伙) 31260 | 代理人: | 成丽杰 |
| 地址: | 310011 浙江省杭州*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 敏感数据 识别 方法 装置 电子设备 存储 介质 | ||
本发明实施例涉及大数据技术领域,公开了一种敏感数据识别方法。本发明中,获取大数据平台的数据表的信息;根据所述数据表的信息预判所述数据表是否存在敏感数据;获取对所述数据表的操作信息;根据所述数据表的操作信息校验所述预判,以确定所述数据表是否存在敏感数据。本发明还提出一种敏感数据识别装置以及一种计算机可读存储介质。本发明可以快速识别大数据平台中存在的敏感数据。
技术领域
本发明实施例涉及大数据技术领域,特别涉及一种敏感数据识别方法、装置、电子设备及计算机可读存储介质。
背景技术
伴随着大数据技术的兴起,越来越多的系统通过大数据平台集中存储数据,并且存储的数据也日渐增多。发明人发现,这些存储的数据中会存在相当一部分敏感数据,例如用户手机号、用户身份证等数据,识别大数据平台存在的敏感数据可以有利于对这些数据进行保护,而前并没有有效的方法快速度对大数据平台中的敏感数据进行识别。
发明内容
本发明实施方式的目的在于提供一种敏感数据识别方法、装置、电子设备及计算机可读存储介质,可以快速识别大数据平台中存在的敏感数据。
为解决上述技术问题,本发明的实施方式提供了一种敏感数据识别方法,所述方法包括:
获取大数据平台的数据表的信息;
根据所述数据表的信息预判所述数据表是否存在敏感数据;
获取对所述数据表的操作信息;
根据所述数据表的操作信息校验所述预判,以确定所述数据表是否存在敏感数据。
优选地,所述数据表的信息包括所述数据表的表结构信息,所述根据所述数据表的信息预判所述数据表是否存在敏感数据包括:
根据所述数据表的表结构信息确定所述数据表中是否存在敏感数据字段;
若是,预判所述数据表存在敏感数据;
所述根据所述数据表的操作信息校验所述预判,以确定所述数据表是否存在敏感数据包括:
从所述操作信息中获取对所述敏感数据字段的操作数据;
判断所述操作数据是否为敏感数据;
若所述操作数据为敏感数据,确定所述预判的结果为有效的。
优选地,所述获取大数据平台的数据表的信息包括:
获取大数据平台的元数据;
从所述大数据平台的元数据中获取所述大数据的数据表的信息。
优选地,所述获取对所述数据表的操作信息之前,所述方法还包括:
当时间阈值达到时,判断是否存在对所述数据表的操作信息;
若存在对所述数据表的操作信息,获取对所述数据表的操作信息;
若不存在对所述数据表的操作信息,直接读取所述数据表的数据内容,通过所述数据表的数据内容校验所述预判,确定所述数据表是否存在敏感数据。
优选地,所述根据所述数据表的表结构信息确定所述数据表中是否存在敏感数据字段之前,所述方法还包括:
根据所述表结构信息判断所述数据表的表结构命名是否为规范命名;
若所述表结构命名为规范命名,执行根据所述数据表的表结构信息确定所述数据表中是否存在敏感数据字段的操作;
若所述表结构命名不为规范命名,直接获取对所述数据表的操作信息,通过所述操作信息确定所述数据表中是否存在敏感数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中移(杭州)信息技术有限公司;中国移动通信集团有限公司,未经中移(杭州)信息技术有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010035825.2/2.html,转载请声明来源钻瓜专利网。





