[发明专利]一种基于中英敏感字典的可控并发数据脱敏方法和装置在审
申请号: | 202111617188.0 | 申请日: | 2021-12-27 |
公开(公告)号: | CN114239071A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 王强 | 申请(专利权)人: | 江苏苏宁银行股份有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 南京瑞华腾知识产权代理事务所(普通合伙) 32368 | 代理人: | 胡海 |
地址: | 210000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 敏感 字典 可控 并发 数据 方法 装置 | ||
1.一种基于中英敏感字典的可控并发数据脱敏方法,其特征在于,包括如下步骤:
获取元数据库的待脱敏数据,并将所述待脱敏数据的表结构同步至参数库中的元数据表,所述元数据表的字段列包括表名称列、表描述列、字段顺序列、字段名称列、字段类型列和字段描述列;
在所述参数库中配置中英文敏感字典表,所述中英文敏感字典表的字段列包括敏感类型列、敏感词列和敏感词类型列;
关联所述元数据表和中英文敏感字典表,获取存在敏感字段的所述元数据表的表名称并存储至文件A;
循环遍历所述文件A中的表名称,在sandbox库中创建与所述文件A对应的同构表,获取所述同构表的表结构并存储至文件B;
获取所述文件B中字段并与中英文敏感字典表比对,按照敏感词类型进行去敏感化转换,生成脱敏脚本;
输入并发参数,多并发执行所述脱敏脚本完成数据脱敏。
2.根据权利要求1所述的基于中英敏感字典的可控并发数据脱敏方法,其特征在于,还包括:在所述参数库中配置增量参数表,所述增量参数表的字段列包括表名称列、表描述列和脱敏天数列,则在所述生成脱敏脚本之后,还包括:
遍历所述文件A中的表名称,与所述增量参数表关联匹配;
若未匹配上,则结合所述脱敏脚本生成单分区脱敏脚本;
若匹配上,则获取所述增量参数表的脱敏天数,并结合所述脱敏脚本生成多分区脱敏脚本。
3.根据权利要求1所述的基于中英敏感字典的可控并发数据脱敏方法,其特征在于,所述中英文敏感字典表的敏感类型列包括中文类和英文类,则获取存在敏感字段的所述元数据表的表名称并存储至文件A,包括:
通过结构化查询语言,关联所述元数据表和中英文敏感字典表,敏感类型选择中文类,判断所述元数据表的字段名称列是否包含中英文敏感字典表的敏感词列中的敏感词,若是,则将所述元数据表的表名称导出至文件A,反之,进行下一步;
通过结构化查询语言,关联所述元数据表和中英文敏感字典表,敏感类型选择英文类,判断所述元数据表的字段名称列是否在中英文敏感字典表的敏感词列中存在,若是,则将所述元数据表的表名称导出至文件A,反之,不对所述元数据表进行脱敏。
4.根据权利要求1所述的基于中英敏感字典的可控并发数据脱敏方法,其特征在于,所述获取同构表的表结构并存储至文件B,还包括:通过正则表达式“sed‘s/[][]*/;/g’”,对所述同构表的表结构进行预处理后存储至文件B。
5.根据权利要求1所述的基于中英敏感字典的可控并发数据脱敏方法,其特征在于,所述获取文件B中字段并与中英文敏感字典表比对,包括:
循环读取所述文件B,获得每一行的原字段;
获取原字段中使用分号分割的第一个元素,得到字段名称列;
获取原字段中使用分号分割的第三个元素,得到字段描述列;
将所述字段名称列与中英文敏感字典表中的英文类敏感词列进行精确匹配,或将所述字段描述列与中英文敏感字典表中的中文类敏感词列进行模糊匹配,判断所述字段名称列或字段描述列是否为敏感字段,若是,则同步获取匹配的敏感词类型,反之,所述原字段无需脱敏直接映射。
6.根据权利要求1所述的基于中英敏感字典的可控并发数据脱敏方法,其特征在于,所述按照敏感词类型进行去敏感化转换,包括:
若所述敏感词类型为名称类,则按名称规则对所述字段列进行去敏感化改写,所述名称规则为将字段列截取第一位,并拼接“字段长度-1”个“*”;
若所述敏感词类型为证件类,则按证件规则对所述字段列进行去敏感化改写,所述证件规则为将该字段列截取前6位,中间拼接8个“*”,再截取最后4位拼接。
若所述敏感词类型为自定义类,则按自定义规则对所述字段列进行去敏感化改写。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏苏宁银行股份有限公司,未经江苏苏宁银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111617188.0/1.html,转载请声明来源钻瓜专利网。