[发明专利]一种数据脱敏方法、装置和系统在审

专利信息
申请号: 202210820816.3 申请日: 2022-07-12
公开(公告)号: CN115391813A 公开(公告)日: 2022-11-25
发明(设计)人: 宋海宾 申请(专利权)人: 阿里云计算有限公司
主分类号: G06F21/62 分类号: G06F21/62
代理公司: 北京思格颂知识产权代理有限公司 11635 代理人: 杨超
地址: 310000 浙江省*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据 方法 装置 系统
【说明书】:

发明公开了一种数据脱敏方法、装置和系统。所述方法包括:根据获取的源数据表结构信息和配置的数据脱敏策略,确定需脱敏处理的字段对应的源数据报文中的源码字段和脱敏处理方式,生成包括需脱敏的源码字段和对应的脱敏处理方式的快速脱敏列表;从源数据库中获取源数据,根据源数据的数据库协议格式、所述快速脱敏列表中包括的需脱敏的源码字段和对应的脱敏处理方式,对源数据中需脱敏处理的源码字段按所述对应的脱敏处理方式进行脱敏处理。对于大批量数据的脱敏处理,无需进行SQL解析,减少了数据解析的过程,减少了脱敏处理过程中的数据处理量和数据处理时间,大大提高了系统性能。

技术领域

本发明涉及数据处理技术领域,特别涉及一种数据脱敏方法、装置和系统。

背景技术

数据脱敏(Data Masking,DM)是指屏蔽敏感数据,对某些敏感信息(比如:身份标识、手机号、卡号、客户姓名、客户地址、邮箱地址、薪资等等)通过脱敏规则进行数据的变形,实现隐私数据的可靠保护。常见的脱敏规则有替换、重排、加密、截断、掩码,用户也可以根据期望的脱敏算法自定义脱敏规则。

目前常见的数据脱敏场景如图1所示,脱敏服务器、数据库管理员(DatabaseAdministrator,DBA)和WEB服务器的数据都会进入正式数据库,数据脱敏客户端连接正式数据库对数据进行脱敏处理,将脱敏处理后的数据写入脱敏数据库,脱敏数据库中的数据可以提供给开发系统、数据分析平台、产品测试平台等系统使用。数据脱敏的一般流程如图2所示,首先数据脱敏客户端通过select语句读取正式数据库中的数据,然后解析结构化查询语言(Structured Query Language,SQL)返回结果,对解析出的数据匹配脱敏策略以对敏感数据执行脱敏处理,脱敏后的数据重新组装为insert SQL语句,执行SQL语句,将脱敏后的数据写入脱敏数据库中。

发明内容

本申请发明人发现,现有的数据脱敏实现方案,在数据量不大的情况下,比如十万条数据以内,一般几十分钟就能脱敏完成,当数据量到千万或者上几十亿的情况下,脱敏的时间就非常长了,需要以小时为单位进行脱敏;随着数据量的爆发式的增长,数据库中数据量不断增大,数据量达到千万、亿级,甚至几十亿也很常见,很多数据库脱敏系统完成千万数据脱敏时间都在3小时以上,对于亿级甚至几十亿的数据脱敏处理需要的时间更长,长时间的数据脱敏处理严重影响了应用的使用,使系统性能受到极大影响。

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种数据脱敏方法、装置和系统。

本发明实施例提供一种数据脱敏方法,包括:

根据获取的源数据表结构信息和配置的数据脱敏策略,确定需脱敏处理的字段对应的源数据报文中的源码字段和脱敏处理方式,生成包括需脱敏的源码字段和对应的脱敏处理方式的快速脱敏列表;

从源数据库中获取源数据,根据源数据的数据库协议格式、所述快速脱敏列表中包括的需脱敏的源码字段和对应的脱敏处理方式,对源数据中需脱敏处理的源码字段按所述对应的脱敏处理方式进行脱敏处理。

在一些可选的实施例中,所述从源数据库中获取源数据,包括:

与源数据库建立访问链接,按照预设的获取数量,循环执行数据查询语句从源数据库中获取源数据,判断是否获取完所有的源数据;

若否,返回继续执行从源数据库中获取源数据的步骤;若是,结束获取数据的流程。

在一些可选的实施例中,根据获取的源数据表结构信息和配置的数据脱敏策略,确定需脱敏处理的字段对应的源数据报文中的源码字段和脱敏处理方式,建立包括需脱敏的源码字段和对应的脱敏处理方式的快速脱敏列表,包括:

从源数据库中获取源数据记录,对获取的源数据记录进行解析,以获取源数据表结构信息;或读取源数据酷中关于表结构的说明信息以获取源数据表结构信息;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里云计算有限公司,未经阿里云计算有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210820816.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top