[发明专利]一种基于开放接口实时脱敏的方法、装置及系统有效
| 申请号: | 201910729161.7 | 申请日: | 2019-08-07 | 
| 公开(公告)号: | CN110704861B | 公开(公告)日: | 2023-03-24 | 
| 发明(设计)人: | 胡佳;吴荣富 | 申请(专利权)人: | 荣邦科技有限公司;中国银联股份有限公司 | 
| 主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F16/35;G06F16/31;G06F16/33 | 
| 代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 | 
| 地址: | 510075 广东省广*** | 国省代码: | 广东;44 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 基于 开放 接口 实时 方法 装置 系统 | ||
1.一种基于开放接口实时脱敏的方法,其特征在于,包括如下步骤:
S10服务器从现有脱敏词库、各网站敏感词列表采集敏感词,对其分类标记并持久化存储生成本地脱敏词库;
S20定义脱敏词库的脱敏工具类接口,其中脱敏工具类接口包括初始化接口、脱敏匹配接口、脱敏处理接口;
S30输入待脱敏文本至服务器的开放接口,调用脱敏词库系统底层接口,通过脱敏词库系统底层接口从本地脱敏词库提取敏感词,将所提取的敏感词按根对象对应多叉树的结构缓存至本地内存生成脱敏词库;
S40调用初始化接口,初始化敏感词缓存的根对象;
S50调用脱敏匹配接口选择脱敏算法执行器,将待脱敏文本基于脱敏词库遍历匹配,获取相匹配的敏感词;
S60将所获取的所有敏感词打包成无序无重复的敏感词集合,调用脱敏处理接口将敏感词集合在待脱敏文本中进行脱敏处理;
所述脱敏算法执行器包括确定有穷自动机DFA算法,所述DFA算法具有多叉树模型结构,所述多叉树模型是由根节点及其子节点模型组成,所述根节点是以根对象为节点,所述子节点模型是按其他字与当前字组词的亲近关系层层分解为根节点的叶节点构成,当脱敏算法执行器采用确定有穷自动机DFA算法时,所述S50调用脱敏匹配接口选择脱敏算法执行器,将待脱敏文本基于脱敏词库遍历匹配,获取相匹配的敏感词的方法具体为:
S501按文本的语句顺序读取文本,将读取到的当前字与多叉树模型的根节点进行敏感词匹配;
S502若匹配到了相应根节点,则获取相应根节点的第一层子节点且将之与所读取到的下一个字进行敏感词匹配;若第一层子节点与所读取到的下一个字相匹配,则判断当前字与所读取的下一个字是否为完整词语;若当前字与所读取的下一个字为完整词语,则视当前字与所读取的下一个字的组合为敏感词;若当前字与所读取的下一个字为非完整词语,则获取相应根节点的第二层子节点且将之与再读取的下一个字进行敏感词匹配,以此类推,止至读取不到与子节点模型相匹配的字,则视当前所读取的字段不包含敏感词,返回S501继续读取文本,且将读取到的字与多叉树模型的根节点重新开始敏感词匹配;
S503输出S502中所读取到的所有敏感词;
所述脱敏算法执行器还包括哈希桶HASH_BUCKET、多模式匹配算法DAT、结束符触发多模式算法TTMP或树型分词算法TIRE,不同的脱敏算法适配不同的业务场景,所述S501之前还包括:
S500根据不同的业务场景调用相应的脱敏匹配接口以选择适配的脱敏算法,DFA算法适配1M~500K文本量的业务场景;哈希桶HASH_BUCKET适配300K以下文本量的业务场景;多模式匹配法DAT适配300~500K文本量的业务场景;结束符触发多模式算法TTMP适配容许文本存在敏感词漏洞的业务场景;树型分词算法TIRE适配100K以下文本量的业务场景。
2.如权利要求1所述的基于开放接口实时脱敏的方法,其特征在于,所述脱敏工具类接口还包括敏感词匹配类型接口,所述敏感词匹配类型接口提供两种匹配类型:敏感词部分匹配和敏感词完整匹配,所述部分匹配,用于若文本匹配到敏感词后截止当前匹配,输出敏感词且忽略该敏感词所包含的其他敏感词,继续读取文本重新匹配;完整匹配,用于对文本全文匹配敏感词,输出所有匹配到的敏感词且包括该敏感词所包含的其他敏感词,所述S40之后,所述S50之前还包括:
S70调用敏感词匹配类型接口选择敏感词匹配的匹配类型,执行敏感词的脱敏匹配。
3.如权利要求1所述的基于开放接口实时脱敏的方法,其特征在于,所述脱敏工具类接口还包括敏感词添加接口,本方法还包括:
S80若发现新的敏感词,调用敏感词添加接口,添加新的敏感词至本地脱敏词库并持久化存储。
4.如权利要求1所述的基于开放接口实时脱敏的方法,其特征在于,所述脱敏处理接口包括敏感词高亮接口和敏感词替换接口,所述脱敏处理包括:
通过调用敏感词高亮接口将所匹配的敏感词用超级文本语言包裹后显亮该敏感词,或者是,通过调用敏感词替换接口将所匹配的敏感词用预定字符替换。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于荣邦科技有限公司;中国银联股份有限公司,未经荣邦科技有限公司;中国银联股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910729161.7/1.html,转载请声明来源钻瓜专利网。





