[发明专利]一种敏感词过滤方法、装置、存储介质及电子设备在审
| 申请号: | 202111562611.1 | 申请日: | 2021-12-20 |
| 公开(公告)号: | CN114266247A | 公开(公告)日: | 2022-04-01 |
| 发明(设计)人: | 杨浩;丁祎文 | 申请(专利权)人: | 中国农业银行股份有限公司 |
| 主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F16/35 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 李彩玲 |
| 地址: | 100005 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 敏感 过滤 方法 装置 存储 介质 电子设备 | ||
本发明实施例涉及人工智能,提供了一种敏感词过滤方法、装置、存储介质及电子设备,所述方法包括:获取待处理的文本数据;确定所述文本数据中包含的敏感词类别;将所述文本数据输入至与所述敏感词类别对应的字典树模型中,在所述文本数据中查找与所述字典树模型匹配的目标敏感词;过滤所述文本数据中的目标敏感词。本发明实施例的方案,可以准确、有效地对待处理的文本数据中的敏感词进行过滤。
技术领域
本发明实施例涉及人工智能技术领域,尤其涉及一种敏感词过滤方法、装置、存储介质及电子设备。
背景技术
近些年来,随着互联网和人工智能技术的高速发展,使得当下信息的生成、 传播和收集的速度和规模达到了空前绝后的水平,在这些过程中不可避免会出 现敏感词,需要把敏感词过滤掉。相关技术中,主要根据敏感词库对待检测文 本中的敏感词进行匹配、查找、替换,但是这种方式准确性低,而如何准确进 行敏感词的过滤变得至关重要。
发明内容
本发明实施例提供一种敏感词过滤方法、装置、存储介质及电子设备,可以准确地对文本数据中的敏感词进行过滤。
第一方面,本发明实施例提供了一种敏感词过滤方法,包括:
获取待处理的文本数据;
确定所述文本数据中包含的敏感词类别;
将所述文本数据输入至与所述敏感词类别对应的字典树模型中,在所述文本数据中查找与所述字典树模型匹配的目标敏感词;
过滤所述文本数据中的目标敏感词。
第二方面,本发明实施例还提供了一种敏感词过滤装置,包括:
文本数据获取模块,用于获取待处理的文本数据;
敏感词类别确定模块,用于确定所述文本数据中包含的敏感词类别;
敏感词查找模块,用于将所述文本数据输入至与所述敏感词类别对应的字典树模型中,在所述文本数据中查找与所述字典树模型匹配的目标敏感词;
敏感词过滤模块,用于过滤所述文本数据中的目标敏感词。
第三方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例提供的敏感词过滤方法。
第四方面,本发明实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如本发明实施例提供的敏感词过滤方法。
本发明实施例提供的敏感词过滤方案,获取待处理的文本数据;确定所述文本数据中包含的敏感词类别;将所述文本数据输入至与所述敏感词类别对应的字典树模型中,在所述文本数据中查找与所述字典树模型匹配的目标敏感词;过滤所述文本数据中的目标敏感词。通过本发明实施例提供的技术方案,可以准确、有效地对待处理的文本数据中的敏感词进行过滤。
附图说明
图1是本发明一实施例提供的一种敏感词过滤方法的流程图;
图2是本发明实施例提供的一种敏感词分类模型的结构示意图;
图3是本发明实施例提供的一种字典树模型的示意图;
图4是本发明实施例提供的一种敏感词过滤系统示意图;
图5是本发明另一实施例中的一种敏感词过滤装置的结构示意图;
图6是本发明另一实施例中的一种电子设备的结构示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业银行股份有限公司,未经中国农业银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111562611.1/2.html,转载请声明来源钻瓜专利网。





