[发明专利]一种智能敏感词过滤系统在审

专利信息
申请号: 201910233564.2 申请日: 2019-03-26
公开(公告)号: CN110096585A 公开(公告)日: 2019-08-06
发明(设计)人: 林峰 申请(专利权)人: 珠海鹏游网络科技有限公司
主分类号: G06F16/335 分类号: G06F16/335;G06F16/958
代理公司: 北京联瑞联丰知识产权代理事务所(普通合伙) 11411 代理人: 张清彦
地址: 519000 广东省珠海市香*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 敏感词 匹配算法 词库 预设 过滤系统 检测数据 内存空间 匹配 文本 储存 敏感信息 匹配处理 文本内容 用户过滤 智能识别 自动记录 智能 准确率 调出 过滤 证据 广告 配合
【说明书】:

发明提供一种智能敏感词过滤系统,包括:一预设词库,储存于内存空间内,用于匹配算法对检测数据进行敏感词匹配处理;一内存空间,用于储存预设词库,待匹配算法进行敏感词匹配时,调出预设词库与匹配算法配合;一匹配算法,对用户过滤文本进行获取,用于对过滤文本中检测数据进行敏感词匹配,与现有技术相比,本发明具有如下的有益效果:能智能识别文本内容里面的涉黄、广告、暴力、政治、脏话等敏感信息,然后会自动记录用户和敏感词信息,必要时可以作为关键证据。该系统的准确率达到99%,效率比普通方案提高50%。

技术领域

本发明是一种智能敏感词过滤系统,属于软件使用方法领域。

背景技术

敏感词一般是指带有敏感政治倾向、暴力倾向、不健康色彩的词或不文明词语。多数论坛、网站为了方便管理,都进行了敏感词设定,也有一些网站根据自身实际情况设定一些只适用于本网站的特殊敏感词。比如,要发布的帖子内容包含敏感词时,这个帖子不能发布。

随着使用某网络应用比如网络视频直播的用户数量的不断增加以及用户通过发表言论参与互动的程度的不断增长,应用服务器进行高并发大量言论的敏感词过滤的处理压力将会很大,处理效率很可能会很低。

发明内容

针对现有技术存在的不足,本发明目的是提供一种智能敏感词过滤系统,以解决上述背景技术中提出的问题。

为了实现上述目的,本发明是通过如下的技术方案来实现:一种智能敏感词过滤系统,包括:

一预设词库,储存于内存空间内,用于匹配算法对检测数据进行敏感词匹配处理;

一内存空间,用于储存预设词库,待匹配算法进行敏感词匹配时,调出预设词库与匹配算法配合;

一匹配算法,对用户过滤文本进行获取,用于对过滤文本中检测数据进行敏感词匹配。

进一步地,内存空间为主存储器空间或互联网系统为分配的网络内存空间。

进一步地,在预设词库中,首先建立敏感词数据,将需要匹配的敏感词以及其联想词输入至预设词库中。

进一步地,用户过滤文本为用户输入的数据,该用户过滤文本在输入至互联网网站前,先经过匹配算法进行敏感词匹配。

进一步地,用户输入的数据在输入至互联网网站前,先经过匹配算法进行敏感词匹配,具体的讲,当用户输入数据后,则匹配算法从内存空间中读取预设词库,将用户输入的数据的字符与预设词库中的字符进行匹配,若匹配到用户输入的数据的字符与预设词库中的字符相同,则过滤掉该字符,如果匹配不成功,将用户输入的数据进行字符拆分,将字符拆分成字符组,判断字符组中的所有元素是否同时出现在该信息中,若出现,则对用户输入的数据进行重组,将字符组中相邻的字符进行交叉配对,进行上下文重组过滤,判断过滤后的字符组是否与预设词库中的字符相同,若相同,则过滤掉该字符组,确认用户输入的数据为垃圾信息进行拦截,否则,发布所述信息。

本发明的有益效果:本发明的一种智能敏感词过滤系统,能智能识别文本内容里面的涉黄、广告、暴力、政治、脏话等敏感信息,然后会自动记录用户和敏感词信息,必要时可以作为关键证据。该系统的准确率达到99%,效率比普通方案提高50%。

具体实施方式

为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本发明。

本发明提供一种技术方案:一种智能敏感词过滤系统,包括:

一预设词库,储存于内存空间内,用于匹配算法对检测数据进行敏感词匹配处理;

一内存空间,用于储存预设词库,待匹配算法进行敏感词匹配时,调出预设词库与匹配算法配合;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海鹏游网络科技有限公司,未经珠海鹏游网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910233564.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top