[发明专利]脱敏规则生成方法及装置有效
申请号: | 201810537732.2 | 申请日: | 2018-05-30 |
公开(公告)号: | CN108846292B | 公开(公告)日: | 2021-08-17 |
发明(设计)人: | 张金玲;龙岳;郭佳睿 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 杨泽;刘芳 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 规则 生成 方法 装置 | ||
本发明提供一种脱敏规则生成方法及装置,该方法通过获取脱敏片段,对脱敏片段进行分析,以学习获取与上述脱敏片段对应的脱敏规则和使用场景,进一步在确定所述脱敏规则库中不存在所述脱敏规则和使用场景,且确定所述脱敏片段与所述脱敏规则和使用场景匹配时,将所述脱敏规则和使用场景存储在所述脱敏数据库中。通过将机器学习方法应用于脱敏规则的生成中,大大减少手动输入脱敏规则的过程,解决了现有技术中生成脱敏规则需要大量人力成本,效率较低,且手动输入的脱敏规则结构单一的问题。
技术领域
本发明涉及计算机处理技术领域,尤其涉及一种脱敏规则生成方法及装置。
背景技术
随着互联网的发展,信息共享更加方便快捷,与此同时人们也越来越重视隐私信息的安全性,因此,在医疗、电力、金融、电信等诸多行业中,数据脱敏被广泛的应用。其中,数据脱敏(Data Masking),又称数据漂白、数据去隐私化或数据变形,是指对数据中包含的秘密或隐私信息按照数据脱敏规则进行特殊处理,达到数据变形的效果,使攻击者无法从数据中直接获取敏感信息,从而避免秘密或隐私信息的泄露。
现有技术中,数据脱敏时使用的脱敏规则是由人工手动输入预设的脱敏规则或算法,提交后由管理员进行审核,审核通过后脱敏规则才会生效。
现有技术的方法需要大量的人力成本,效率较低,且手动输入的脱敏规则结构单一内容简单。
发明内容
本发明提供一种脱敏规则生成方法及装置,以解决现有技术中生成脱敏规则时需要大量的人力成本,效率较低,且手动输入的脱敏规则结构单一的问题。
第一方面,本发明提供一种脱敏规则生成方法,该方法包括:
获取脱敏片段;
对所述脱敏片段进行分析,以学习获取与所述脱敏片段对应的脱敏规则和使用场景;
在确定所述脱敏规则库中不存在所述脱敏规则和使用场景,且确定所述脱敏片段与所述脱敏规则和使用场景匹配时,将所述脱敏规则和使用场景存储在所述脱敏数据库中。
进一步地,所述对所述脱敏片段进行分析,以学习获取与所述脱敏片段对应的脱敏规则和使用场景,包括:
分析获取所述脱敏片段对应的脱敏类型和使用场景;
获取所述脱敏片段中的脱敏数据,并学习获取所述脱敏数据对应的脱敏处理方式;
根据所述脱敏类型、所述脱敏数据和所述脱敏处理方式,获取所述脱敏片段对应的脱敏规则。
进一步地,所述获取脱敏片段包括:
采用网页爬虫技术,搜索获取所述脱敏片段。
进一步地,所述确定所述脱敏片段与所述脱敏规则和使用场景匹配,包括:
将所述脱敏片段和其对应的脱敏规则和使用场景发送给审批服务器,以供所述审批服务器判断所述脱敏片段和其对应的脱敏规则和使用场景是否匹配;
接收所述审批服务器发送的反馈信息,其中,所述反馈信息包括匹配结果,或者所述匹配结果和所述修改的脱敏规则和使用场景。
进一步地,若所述反馈消息中的所述匹配结果为不匹配,或者所述反馈消息中的所述匹配结果为不匹配,且反馈消息中还包括修改的脱敏规则和使用场景,则根据所述匹配结果,或者所述匹配结果和所述修改的脱敏规则和使用场景,重新学习获取与所述脱敏片段对应的脱敏规则和使用场景。
第二方面,本发明还提供一种脱敏规则生成装置,该装置包括:
获取模块,用于获取脱敏片段;
学习模块,用于对所述脱敏片段进行分析,以学习获取与所述脱敏片段对应的脱敏规则和使用场景;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810537732.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种硬件加密保护数据安全装置
- 下一篇:履历信息生成方法及装置