[发明专利]基于敏感词库构建的敏感词监控方法及装置有效
申请号: | 202011582688.0 | 申请日: | 2020-12-28 |
公开(公告)号: | CN112926301B | 公开(公告)日: | 2023-02-14 |
发明(设计)人: | 李森和 | 申请(专利权)人: | 广州坚和网络科技有限公司 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F21/62 |
代理公司: | 广州专理知识产权代理事务所(普通合伙) 44493 | 代理人: | 沈素芹 |
地址: | 510000 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 敏感 词库 构建 监控 方法 装置 | ||
本发明涉及基于敏感词库构建的敏感词监控方法,包括以下:加载敏感词匹配规则;获取目标监控文本;读取并按照敏感词匹配规则调用预建立的敏感词库对目标文本进行敏感词监控;输出监控结果。本发明通过预建立敏感词库,并针对敏感词库设定敏感词匹配规则,在对目标监控文本进行监控时,读取加载的敏感词匹配规则,并调用预建立的敏感词库以对目标监控文本进行敏感词匹配,最终得到监控结果,全程智能监控,无需人工,且设置有多重匹配规则,监控精度高。本发明还提出基于敏感词库构建的敏感词监控装置,在运行时,通过调用装置中的相关模块,也能够实现本发明的方法所能带来的有益效果。本发明应用于数据安全领域。
技术领域
本发明涉及信息安全领域,尤其涉及基于敏感词库构建的敏感词监控方法及装置。
背景技术
大部分论坛,为了方便管理,都进行了关于敏感词的设定。在多数网站,敏感词一般是指不文明语。
也有一些网站根据自身实际情况,设定一些只适用于本网站的特殊敏感词,例如很多电子商务网站会将一些涉及侵犯知识产权,不宜销售的商品,例如“山寨”、“水货”、“盗版”、“刻录”等设置为敏感词,在商品简介中这些词是发不出来的。竞争对手的名称在一些电商网站也是无法发出的敏感词。
敏感词设定功能在贴吧或论坛中都被广泛应用。
但是当今市场的敏感词监控手段往往较为单一,甚至存在人工比对的方式进行排查,这无疑是一项十分繁重的工作,且排查的精度难以保证。
发明内容
本发明的目的是为了至少解决现有技术的不足之一,提供基于敏感词库构建的敏感词监控方法及装置。
为了实现上述目的,本发明采用以下的技术方案:
具体的,提出基于敏感词库构建的敏感词监控方法,包括以下:
加载敏感词匹配规则;
获取目标监控文本;
读取并按照敏感词匹配规则调用预建立的敏感词库对目标文本进行敏感词监控;
输出监控结果。
进一步,所述敏感词库具体包括,
多个敏感词匹配存储单元,所述敏感词匹配存储单元存储有匹配关键词、敏感词列表以及严重等级三个要素,其中匹配关键词要素允许为空,其他要素不能为空,所述严重等级用于表明该敏感词匹配存储单元的匹配严重程度。
进一步,上述按照敏感词匹配规则调用预建立的敏感词库对目标文本进行敏感词监控的方法具体包括以下,
将目标监控文本,与每一个敏感词匹配存储单元进行一一匹配,得到匹配结果;
若存在与目标监控文本匹配的敏感词匹配存储单元,则读取该敏感词匹配存储单元的严重等级作为该目标监控文本的敏感词严重等级;
若不存在与目标监控文本匹配的敏感词匹配存储单元,则判定该目标监控文本安全。
进一步,所述将目标监控文本,与每一个敏感词匹配存储单元进行一一匹配,得到匹配结果中的一一匹配的方法具体包括以下,
判断匹配关键词是否为空;
若是则通过敏感词列表与目标监控文本进行匹配,若目标监控文本中的文字与敏感词列表中的敏感词匹配成功,则判断目标监控文本与该敏感词匹配存储单元相匹配,若否则不与该敏感词匹配存储单元相匹配,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州坚和网络科技有限公司,未经广州坚和网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011582688.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:沼肥深施多路分配除杂系统
- 下一篇:一种垃圾压缩机及使用方法