[发明专利]数据脱敏的方法、装置、设备和计算机可读介质在审
| 申请号: | 202310266914.1 | 申请日: | 2023-03-14 |
| 公开(公告)号: | CN116244327A | 公开(公告)日: | 2023-06-09 |
| 发明(设计)人: | 孟宪文;李延伟;张强;孙宇涵;郑龙飞;谷丰收;代东哲 | 申请(专利权)人: | 京东科技控股股份有限公司 |
| 主分类号: | G06F16/242 | 分类号: | G06F16/242;G06F40/253;G06F21/62 |
| 代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 龙丹;张春晓 |
| 地址: | 100176 北京市大兴区北京经*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据 方法 装置 设备 计算机 可读 介质 | ||
本发明公开了数据脱敏的方法、装置、设备和计算机可读介质,涉及计算机技术领域。该方法的一具体实施方式包括:根据SQL抽象语法树中的用户标识,从Hive元数据库中,获取数据库的描述信息和数据表的描述信息,以筛选出敏感数据列;解析从所述Hive元数据库中获取的用户标识对应的脱敏配置信息,得到脱敏算法,并将所述脱敏算法集成到所述SQL抽象语法树中数据列的描述信息中;针对所述敏感数据列,按照所述SQL抽象语法树中数据列的描述信息中的脱敏算法生成脱敏子句,并将所述脱敏子句嵌入到所述SQL抽象语法树的执行计划树中。该实施方式能够针对不同数据采用对应的脱敏方式,提高数据安全性。
技术领域
本发明涉及计算机技术领域,尤其涉及一种数据脱敏的方法、装置、设备和计算机可读介质。
背景技术
Hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化和加载。Hive是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。
数据脱敏是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:现有数据仓库Hive的数据脱敏技术,对不同数据采用相同的脱敏方式,导致数据的安全性较低。
发明内容
有鉴于此,本发明实施例提供一种数据脱敏的方法、装置、设备和计算机可读介质,能够针对不同数据采用对应的脱敏方式,提高数据安全性。
为实现上述目的,根据本发明实施例的一个方面,提供了一种数据脱敏的方法,包括:
根据SQL抽象语法树中的用户标识,从Hive元数据库中,获取数据库的描述信息和数据表的描述信息,以筛选出敏感数据列;
解析从所述Hive元数据库中获取的用户标识对应的脱敏配置信息,得到脱敏算法,并将所述脱敏算法集成到所述SQL抽象语法树中数据列的描述信息中;
针对所述敏感数据列,按照所述SQL抽象语法树中数据列的描述信息中的脱敏算法生成脱敏子句,并将所述脱敏子句嵌入到所述SQL抽象语法树的执行计划树中。
所述从所述Hive元数据库中,获取数据库的描述信息和数据表的描述信息之前,还包括:
将所述用户标识对应的数据库的描述信息和数据表的描述信息,以及所述脱敏配置信息存储在所述Hive元数据库的表中。
所述根据SQL抽象语法树中的用户标识,从所述Hive元数据库中,获取数据库的描述信息和数据表的描述信息,以筛选出敏感数据列,包括:
根据SQL抽象语法树中的用户标识,从所述Hive元数据库中,获取数据库的描述信息和数据表的描述信息;
依据所述数据库的描述信息和所述数据表的描述信息,筛选敏感数据列。
所述获取数据库的描述信息和数据表的描述信息,以筛选出敏感数据列之后,还包括:
加密所述敏感数据列;
所述针对所述敏感数据列,按照所述脱敏算法生成脱敏子句之前,还包括:
解密所述敏感数据列。
所述解析从所述Hive元数据库中获取的用户脱敏配置信息,得到所述用户的脱敏算法,包括:
所述用户标识对应普通用户,解析从所述Hive元数据库中获取的普通用户脱敏配置信息,得到所述普通用户的脱敏算法;
所述用户标识对应超级用户,解析从所述Hive元数据库中获取的超级用户脱敏配置信息,得到所述超级用户的脱敏算法并解密所述敏感数据列。
所述将所述脱敏子句嵌入到所述SQL抽象语法树的执行计划树中,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东科技控股股份有限公司,未经京东科技控股股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310266914.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





