[发明专利]逆向解析的数据脱敏方法及装置在审
| 申请号: | 201911271280.9 | 申请日: | 2019-12-12 |
| 公开(公告)号: | CN111159754A | 公开(公告)日: | 2020-05-15 |
| 发明(设计)人: | 石佳;阳东;胡如一;吴美娟;纪德良;王澍;解林超;王仲锋;杨春晨;王永平;于亚丰;汪娟玉;丁雪花;姜震;蒋斌;徐宏伟;姜小建;吕旭芬;谭程文;李冰;方豪强 | 申请(专利权)人: | 浙江华云信息科技有限公司 |
| 主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F16/2452 |
| 代理公司: | 杭州华鼎知识产权代理事务所(普通合伙) 33217 | 代理人: | 方艳 |
| 地址: | 310008 浙江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 逆向 解析 数据 方法 装置 | ||
本发明公开了一种逆向解析的数据脱敏方法及装置,方法包括如下步骤:接收用户发送的查询数据的SQL语句;判断SQL语句是否含有涉及敏感数据的字段的目标列表达式,若不是则终止对SQL语句的处理;判断SQL语句是否有嵌套查询;由内到外逐层递归,直至含有涉及敏感数据的字段的目标列表达式位于SQL语句中最外层的嵌套查询;根据预先设置的脱敏转换规则对所述SQL语句的目标列表达式进行转换,使转换后的SQL语句访问到的敏感数据为脱敏数据;输出SQL语句所要查询的数据;并公开了相应的装置。本发明基于SQL语义逆向自动解析出字段演变足迹的方法,智能分析出最终数据结果是否脱敏处理。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种逆向解析的数据脱敏方法及装置。
背景技术
数据中台提供面向数据应用支撑的前提是保障数据安全。为了更好的保护以个人信息之类的敏感信息,对涉及敏感信息的数据进行脱敏处理是一个常用且有效的方法。
数据脱敏(Data Masking),又称数据漂白、数据去隐私化或数据变形。用户查询数据的查询SQL语句一般为SQL SELECT语句,表示为SELECT A FROM B,其中A为查询列表达式,B为数据表,即从数据表B中选取满足查询列表达式A的数据。当用户查询数据时,若目标列表达式中的字段涉及敏感数据,比如涉及到人的姓名、联系电话、身份证号、工资数额等个人信息,往往需要将这部分数据进行脱敏处理。
若为保障数据安全,可以在源头数据库的字段直接进行脱敏处理,但是这样处理容易引发一些问题,比如对客户姓名直接进行保留姓氏的脱敏处理,实现客户姓名唯一计数,统计结果就会出现明显差异。所以,不能在源头处理。
有时,对某些数据分析应用需要用复杂的查询SQL语句来支撑,而复杂的查询SQL语句往往涉及多表、嵌套、关联、联合、计算,需要智能识别字段演变足迹,对一些已知表中的敏感字段在最终结果的展现上判别出是否需要脱敏处理以及若需要处理如何转换处理。对此,传统的做法是人为识别一个个SQL语句,人为处理转换成新的SQL语句。这种方式,效率比较低,没有智能分析,不能批量处理和智能转换。
针对这一问题,目前普遍的做法是将SQL语句解析为抽象语法树,使用VISITOR模式去遍历,从根节点开始遍历,一直到最后一个叶子节点,在遍历的过程中,便不断地收集信息到一个上下文中,整个遍历过程完成后,对这棵树所表达的语法含义,已经被保存到上下文了。简单的说,解析SQL语句是自上到下、由外向内的过程,无法在已知表的字段的情况下,追溯其由内向外演变的过程,从而无法获取其最终的演变结果。
发明内容
本发明提出一种逆向解析的数据脱敏方法及装置以解决上述技术问题。
为了达到上述目的,本发明所采用的技术方案为:
根据本发明实施例的第一方面,提供了一种逆向解析的数据脱敏方法,包括如下步骤:
步骤101,接收用户发送的查询数据的SQL语句;
步骤102,判断SQL语句是否含有涉及敏感数据的字段的目标列表达式,若不是则终止对SQL语句的处理;
步骤103,判断SQL语句是否有嵌套查询,若没有则跳至步骤105;
步骤104,由内到外逐层递归,直至含有涉及敏感数据的字段的目标列表达式位于SQL语句中最外层的嵌套查询;
步骤105,根据预先设置的脱敏转换规则对所述SQL语句的目标列表达式进行转换,使转换后的SQL语句访问到的敏感数据为脱敏数据;
步骤106,输出SQL语句所要查询的数据。
作为优选,所述步骤101包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江华云信息科技有限公司,未经浙江华云信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911271280.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图像识别智能远传抄表方法
- 下一篇:一种高精度农作物病虫害图像的识别方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





