[发明专利]敏感词检测方法、装置、终端设备和计算机可读存储介质有效

专利信息
申请号: 201911344871.4 申请日: 2019-12-24
公开(公告)号: CN111159329B 公开(公告)日: 2023-09-08
发明(设计)人: 方曦;熊友军 申请(专利权)人: 深圳市优必选科技股份有限公司
主分类号: G06F16/31 分类号: G06F16/31;G06F16/33
代理公司: 深圳中一联合知识产权代理有限公司 44414 代理人: 刘永康
地址: 518000 广东省深圳市南山区*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 敏感 检测 方法 装置 终端设备 计算机 可读 存储 介质
【权利要求书】:

1.一种敏感词检测方法,其特征在于,包括:

获取待检测文本;

对所述待检测文本中的每一个待匹配字符执行字符匹配步骤,得到匹配结果;

根据所述匹配结果得到所述待检测文本的敏感词检测结果;

所述字符匹配步骤用于:

将所述待匹配字符与敏感词容器的根节点的字符进行比对,确定是否一致;

如果所述待匹配字符与所述根节点的字符一致,且敏感词结束标志位为预设数值,返回匹配成功结果;

如果所述待匹配字符与所述根节点的字符一致,且敏感词结束标志位不为预设数值,k=1,进入循环步骤:将所述待匹配字符后的第k个字符与所述根节点的第k个叶子节点的字符进行匹配,确定是否一致;

如果所述第k个字符与所述第k个叶子节点的字符一致,当敏感词结束标志位不为预设数值,k=k+1后返回所述循环步骤;当敏感词结束标志位为预设数值,返回匹配成功结果;

如果所述第k个字符与所述第k个叶子节点的字符不一致,返回匹配失败结果;

其中,所述敏感词容器包括至少一条存储分支,一条所述存储分支用于存储一个敏感词;所述存储分支包括至少一个节点,所述存储分支中的第一个节点为根节点,非第一个节点为叶子节点;一个节点对应一个存储对象;

所述存储对象的数据结构为键值对数据结构,所述存储对象包括key值和value值;在一条所述存储分支中,第m个节点的存储对象的value值存放有作为第m+1个节点的存储对象,所述存储分支对应的敏感词的各个字符依次存放各个存储对象的key值,m为大于或等于1的正整数;

若两个敏感词的前j个字符相同,第j+1个字符不相同,则对应的两条存储分支的前j个节点相同,第j+1个节点及其往后的节点均不相同,j大于或等于0,所述敏感词各个字符是嵌套递归地存储在敏感词容器中的。

2.如权利要求1所述的方法,其特征在于,所述存储对象为Map对象;

敏感词的存放方式如下:

所述敏感词的第m个字符存放在对应存储分支的第m个节点的Map对象的key值;第m个节点的Map对象的value值存放作为第m+1个节点的Map对象,m大于或等于1,且小于或等于所述敏感词的字符数量;

若新添加的敏感词的前j个字符与所述敏感词容器中已存放敏感词的前j个字符相同,第j+1个字符不同,则新建i个节点,将所述新添加的敏感词的第j+1个及其往后的字符依次存放在所述i个节点中,i等于所述新添加的敏感词的字符数减去j。

3.如权利要求2所述的方法,其特征在于,所述存储分支还包括用于存放结束标志信息的目标Map对象,所述目标Map对象存放在所述存储分支对应的敏感词最后一个字符对应的Map对象的value值中。

4.如权利要求2或3所述的方法,其特征在于,在获取待检测文本之前,还包括:

初始化敏感词数据,将所述敏感词数据加载至内存。

5.如权利要求4所述的方法,其特征在于,初始化敏感词数据,将所述敏感词数据加载至内存,包括:

获取所述敏感词数据;

构建所述敏感词容器;

执行单个敏感词添加步骤,所述单个敏感词添加步骤用于:从所述敏感词数据中读取一个敏感词作为待加载敏感词;依次将所述待加载敏感词的第m个字符存放在对应存储分支的第m个节点的Map对象的key值,第m个节点的Map对象的value值存放作为第m+1个节点的Map对象;所述待加载敏感词的字符添加完毕时,在目标Map对象中存储所述待加载敏感词的结束标志位信息,所述目标Map对象存放在所述待加载敏感词的最后一个字符对应的Map对象的value值中;

重复执行所述单个敏感词添加步骤,直至所述敏感词数据全部添加至所述敏感词容器。

6.如权利要求1所述的方法,其特征在于,根据所述匹配结果得到所述待检测文本的敏感词检测结果,包括:

获取所述匹配成功结果对应的敏感词,所述匹配成功结果对应的敏感词为所述待检测文本的敏感词。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市优必选科技股份有限公司,未经深圳市优必选科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911344871.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top