[发明专利]汉字数据的脱敏方法、装置、计算机设备和存储介质在审

专利信息
申请号: 202010901114.9 申请日: 2020-09-01
公开(公告)号: CN111985001A 公开(公告)日: 2020-11-24
发明(设计)人: 许超俊 申请(专利权)人: 深圳壹账通智能科技有限公司
主分类号: G06F21/62 分类号: G06F21/62;G06F21/60;G06F40/129
代理公司: 深圳市明日今典知识产权代理事务所(普通合伙) 44343 代理人: 王杰辉;曹勇
地址: 518000 广东省深圳市前海深港合作区前*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 汉字 数据 方法 装置 计算机 设备 存储 介质
【说明书】:

本申请涉及数据处理领域,提供一种汉字数据的脱敏方法、装置、计算机设备和存储介质,方法包括:获取待脱敏汉字;根据待脱敏汉字,从预设的多级字库中查找出待脱敏汉字所属级别的第一指定字库;获取待脱敏汉字在第一指定字库内的第一指定字节码,获取第一指定字库中包含的所有汉字的第一数量,以及获取与待脱敏汉字对应的预设的第一加密字符串密钥码;对第一加密字符串密钥码进行转换求和处理,得到与第一加密字符串密钥码对应的第一指定数值;根据第一指定字节码、第一数量以及第一指定数值,按照第一预设规则确定出待脱敏汉字在第一指定字库中对应的脱敏后的第一汉字。本申请实现了生成的脱敏后的汉字数据能够保留待脱敏汉字本身所具有的特点。

技术领域

本申请涉及数据处理技术领域,具体涉及一种汉字数据的脱敏方法、装置、计算机设备和存储介质。

背景技术

随着大数据时代的到来,目前可以从海量数据中做数据挖掘分析,而且极有可能会从这些数据中挖掘出巨大的商业价值。但与此同时这些信息也包含了大量的个人隐私数据,其中又以个人姓名能指向更多具体的个人隐私数据为重中之重。类似姓名数据的这些敏感信息一旦泄露不但可能会给个人带来各种困扰,严重的还可能损害其个人声誉以及对人身和财产安全造成危害。目前通常会选择使用数据脱敏的方式来对个人的姓名数据进行隐私保护。数据脱敏是指对某些敏感数据通过脱敏规则进行数据的变形,即将敏感数据按照一定规则转换成不易泄密的非真实数据的过程,去除敏感性,实现敏感隐私数据的可靠保护。发明人发现,现有的对于姓名数据的脱敏方法,通常是直接将姓名数据置换成类似“张三”、“李四”这种常见姓名,这种方法会造成整个数据表中只有相同的几种姓名数据,无法看出数据的分布情况,且脱敏后的数据也丧失了姓名本身所具有的特点。

发明内容

本申请的主要目的为提供一种汉字数据的脱敏方法、装置、计算机设备和存储介质,旨在解决现有的对于汉字数据的脱敏方法,会造成整个数据表中只有相同的几种姓名数据,无法看出数据的分布情况,且脱敏后的数据也丧失了姓名本身所具有的特点的技术问题。

本申请提出一种汉字数据的脱敏方法,所述方法包括步骤:

获取待脱敏汉字;

根据所述待脱敏汉字,从预设的多级字库中查找出所述待脱敏汉字所属级别的第一指定字库;

获取所述待脱敏汉字在所述第一指定字库内的第一指定字节码,获取所述第一指定字库中包含的所有汉字的第一数量,以及获取与所述待脱敏汉字对应的预设的第一加密字符串密钥码;

对所述第一加密字符串密钥码进行转换求和处理,得到与所述第一加密字符串密钥码对应的第一指定数值;

根据所述第一指定字节码、所述第一数量以及所述第一指定数值,按照第一预设规则确定出所述待脱敏汉字在所述第一指定字库中对应的脱敏后的第一汉字。

可选地,所述对所述第一加密字符串密钥码进行转换求和处理,得到与所述第一加密字符串密钥码对应的第一指定数值的步骤,包括:

将所述第一加密字符串密钥码转换成对应的多个指定字符;

分别获取各所述指定字符对应的ASCII码值;

计算所有所述ASCII码值的和值;

将所述和值确定为所述第一指定数值。

可选地,所述根据所述第一指定字节码、所述第一数量以及所述第一指定数值,按照第一预设规则确定出所述待脱敏汉字在所述第一指定字库中对应的脱敏后的第一汉字的步骤,包括:

根据所述第一指定数值与所述第一数量,确定出在所述第一指定字库中,所述脱敏后的第一汉字相对于所述待脱敏汉字的第一偏移位置;

根据所述第一指定字节码、所述第一数量以及所述第一偏移位置,确定出所述脱敏后的第一汉字在所述第一指定字库中的第一编码位置;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010901114.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top