[发明专利]汉字数据的脱敏方法、装置、计算机设备和存储介质在审
| 申请号: | 202010901114.9 | 申请日: | 2020-09-01 |
| 公开(公告)号: | CN111985001A | 公开(公告)日: | 2020-11-24 |
| 发明(设计)人: | 许超俊 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
| 主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F21/60;G06F40/129 |
| 代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉;曹勇 |
| 地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 汉字 数据 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及数据处理领域,提供一种汉字数据的脱敏方法、装置、计算机设备和存储介质,方法包括:获取待脱敏汉字;根据待脱敏汉字,从预设的多级字库中查找出待脱敏汉字所属级别的第一指定字库;获取待脱敏汉字在第一指定字库内的第一指定字节码,获取第一指定字库中包含的所有汉字的第一数量,以及获取与待脱敏汉字对应的预设的第一加密字符串密钥码;对第一加密字符串密钥码进行转换求和处理,得到与第一加密字符串密钥码对应的第一指定数值;根据第一指定字节码、第一数量以及第一指定数值,按照第一预设规则确定出待脱敏汉字在第一指定字库中对应的脱敏后的第一汉字。本申请实现了生成的脱敏后的汉字数据能够保留待脱敏汉字本身所具有的特点。
技术领域
本申请涉及数据处理技术领域,具体涉及一种汉字数据的脱敏方法、装置、计算机设备和存储介质。
背景技术
随着大数据时代的到来,目前可以从海量数据中做数据挖掘分析,而且极有可能会从这些数据中挖掘出巨大的商业价值。但与此同时这些信息也包含了大量的个人隐私数据,其中又以个人姓名能指向更多具体的个人隐私数据为重中之重。类似姓名数据的这些敏感信息一旦泄露不但可能会给个人带来各种困扰,严重的还可能损害其个人声誉以及对人身和财产安全造成危害。目前通常会选择使用数据脱敏的方式来对个人的姓名数据进行隐私保护。数据脱敏是指对某些敏感数据通过脱敏规则进行数据的变形,即将敏感数据按照一定规则转换成不易泄密的非真实数据的过程,去除敏感性,实现敏感隐私数据的可靠保护。发明人发现,现有的对于姓名数据的脱敏方法,通常是直接将姓名数据置换成类似“张三”、“李四”这种常见姓名,这种方法会造成整个数据表中只有相同的几种姓名数据,无法看出数据的分布情况,且脱敏后的数据也丧失了姓名本身所具有的特点。
发明内容
本申请的主要目的为提供一种汉字数据的脱敏方法、装置、计算机设备和存储介质,旨在解决现有的对于汉字数据的脱敏方法,会造成整个数据表中只有相同的几种姓名数据,无法看出数据的分布情况,且脱敏后的数据也丧失了姓名本身所具有的特点的技术问题。
本申请提出一种汉字数据的脱敏方法,所述方法包括步骤:
获取待脱敏汉字;
根据所述待脱敏汉字,从预设的多级字库中查找出所述待脱敏汉字所属级别的第一指定字库;
获取所述待脱敏汉字在所述第一指定字库内的第一指定字节码,获取所述第一指定字库中包含的所有汉字的第一数量,以及获取与所述待脱敏汉字对应的预设的第一加密字符串密钥码;
对所述第一加密字符串密钥码进行转换求和处理,得到与所述第一加密字符串密钥码对应的第一指定数值;
根据所述第一指定字节码、所述第一数量以及所述第一指定数值,按照第一预设规则确定出所述待脱敏汉字在所述第一指定字库中对应的脱敏后的第一汉字。
可选地,所述对所述第一加密字符串密钥码进行转换求和处理,得到与所述第一加密字符串密钥码对应的第一指定数值的步骤,包括:
将所述第一加密字符串密钥码转换成对应的多个指定字符;
分别获取各所述指定字符对应的ASCII码值;
计算所有所述ASCII码值的和值;
将所述和值确定为所述第一指定数值。
可选地,所述根据所述第一指定字节码、所述第一数量以及所述第一指定数值,按照第一预设规则确定出所述待脱敏汉字在所述第一指定字库中对应的脱敏后的第一汉字的步骤,包括:
根据所述第一指定数值与所述第一数量,确定出在所述第一指定字库中,所述脱敏后的第一汉字相对于所述待脱敏汉字的第一偏移位置;
根据所述第一指定字节码、所述第一数量以及所述第一偏移位置,确定出所述脱敏后的第一汉字在所述第一指定字库中的第一编码位置;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010901114.9/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





