[发明专利]一种姓名字段脱敏处理方法、系统、装置及存储介质在审

专利信息
申请号: 202210255989.5 申请日: 2022-03-15
公开(公告)号: CN114611147A 公开(公告)日: 2022-06-10
发明(设计)人: 孙翔宇 申请(专利权)人: 北京盛世信安科技有限公司
主分类号: G06F21/62 分类号: G06F21/62;G06F40/151;G06F40/126;G06F40/284
代理公司: 成都顶峰专利事务所(普通合伙) 51224 代理人: 何焦
地址: 100000 北京市门头沟区石*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 姓名 字段 处理 方法 系统 装置 存储 介质
【说明书】:

发明涉及信息处理技术领域,具体涉及一种姓名字段脱敏处理方法、系统、装置及存储介质。本发明通过对个人记录信息文本进行文本识别,提取出其中的文字字段,然后对各文字字段进行姓氏识别,判定各文字字段内是否存在姓氏文字,当判定文字字段内存在姓氏文字时,对姓氏文字后的文字进行相应的脱敏处理,最后将做过脱敏处理以及未做脱敏处理的各文字字段与保留的非文字字符进行还原组合,形成脱敏个人信息文本,可以有效排除非姓名字段及非文字字符的干扰,实现对个人记录信息中姓名字段的精准脱敏处理,提高脱敏处理后个人记录信息的适用性。

技术领域

本发明涉及信息处理技术领域,具体涉及一种姓名字段脱敏处理方法、系统、装置及存储介质。

背景技术

在个人隐私数据的共享交换之中,姓名信息是个人最重要的隐私信息,也是最直观的信息,虽然每个人的姓名可能会与他人重复,但若是再结合其他相关信息,就可以很容易地定位到现实生活中具体的某一个人,所以,对个人姓名信息的隐私保护显得至关重要。一般情况下,对个人姓名信息的隐私保护会采用数据脱敏的方式。

数据脱敏,又称为数据漂白、数据去隐私化或数据变形,指对某些敏感信息通过脱敏过程进行数据变形,实现敏感隐私数据的可靠保护,主要方法有算法转换、替代、混洗、数值变换、加密、模糊、截断等。相比于数据加密将一串明文加密成没有任何意义的一串字符,一种好的脱敏方法能尽可能的保留数据价值,同时消除原始数据的一些隐私痕迹,从而达到既能有效的保护数据,又能提高数据利用率的目的,并且,相较于加密算法的“笨重”,数据脱敏要简便许多,所涉及的算法时间复杂度也相对较低,转换速度快。

许多人在记录个人信息时,会把区域、姓名、单位和称谓等一种或者多种内容组合成一个比较长的词组,甚至还会在词组里面穿插使用一些隔离性或者标志性的非汉字字符。这种情况下,如果采用现有的数据脱敏处理方式简单的在姓名字段中穿插使用或者集中使用脱敏字符代替汉字,就会出现很多的脱敏字符,甚至不能把姓名部分有效脱敏处理,应用体验较差,如果不能准确地用脱敏字符代替需要脱敏的汉字部分,可能会出现展示出姓名全名的情形,导致个人隐私泄露。

发明内容

针对现有技术存在的不足,本发明提供了一种姓名字段脱敏处理方法、系统、装置及存储介质,其应用时,可以有效排除非姓名字段及非文字字符的干扰,实现对个人记录信息中姓名字段的精准脱敏处理,提高脱敏处理后个人记录信息的适用性。

第一方面,本发明提供一种姓名字段脱敏处理方法,包括:

获取个人记录信息文本,所述个人记录信息文本包括文字字段和非文字字符;

对个人记录信息文本进行文本识别,提取出其中的文字字段,保留非文字字符;

对各文字字段进行姓氏识别,判定各文字字段内是否存在姓氏文字;

在判定文字字段内存在姓氏文字时,以该姓氏的末位文字起,将向后设定顺位数的文字做脱敏处理;

将做过脱敏处理以及未做脱敏处理的各文字字段与保留的非文字字符进行还原组合,形成脱敏个人信息文本。

基于上述技术内容,通过对个人记录信息文本进行文本识别,提取出其中的文字字段,然后对各文字字段进行姓氏识别,判定各文字字段内是否存在姓氏文字,当判定文字字段内存在姓氏文字时,对姓氏文字后的文字进行相应的脱敏处理,最后将做过脱敏处理以及未做脱敏处理的各文字字段与保留的非文字字符进行还原组合,形成脱敏个人信息文本。其应用时,可以有效排除非姓名字段及非文字字符的干扰,实现对个人记录信息中姓名字段的精准脱敏处理,提高脱敏处理后个人记录信息的适用性。

在一个可能的设计中,所述对个人记录信息文本进行文本识别,提取出其中的文字字段,保留非文字字符,包括:

对个人记录信息文本的每个字符按其排列顺位赋予唯一字节编号;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京盛世信安科技有限公司,未经北京盛世信安科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210255989.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top