[发明专利]基于矩阵的敏感词过滤方法、装置、电子设备、存储介质在审
申请号: | 201911389334.1 | 申请日: | 2019-12-30 |
公开(公告)号: | CN111241389A | 公开(公告)日: | 2020-06-05 |
发明(设计)人: | 王瑛;王龙 | 申请(专利权)人: | 陕西数字基地出版传媒集团有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9536;G06Q50/00 |
代理公司: | 北京金宏来专利代理事务所(特殊普通合伙) 11641 | 代理人: | 许振强 |
地址: | 710038 陕西省西安市浐*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 矩阵 敏感 过滤 方法 装置 电子设备 存储 介质 | ||
1.基于矩阵的敏感词过滤方法,其特征在于,包括:
获取敏感词并根据敏感词构建相关词库,该相关词库列举包括敏感词但与敏感词意义不同的词语,所有敏感词及其相关词库构成相关矩阵;
根据敏感词对目标文本进行检测,若出现敏感词,则进一步判断该敏感词所在句子是否存在该敏感词相关词库中的词语,若不存在,则过滤掉该敏感词,否则保留该敏感词。
2.如权利要求1所述的基于矩阵的敏感词过滤方法,其特征在于,所述获取敏感词之前还包括:
根据目标文本的题材对敏感词进行分类,所述获取敏感词具体为获取与目标文本的题材相对应的敏感词。
3.如权利要求1或2所述的基于矩阵的敏感词过滤方法,其特征在于,所述根据敏感词对目标文本进行检测具体为:根据敏感词的优先级对目标文本进行检测,所述进一步判断该敏感词所在句子是否存在该敏感词相关词库中的词语具体为:根据相关词库中词语的优先级来进一步判断所在句子是否存在该敏感词相关词库中的词语,所述敏感词的优先级可根据敏感词出现的次数实时动态调整,所述相关词库词语的优先级可根据词语出现的次数实时动态调整。
4.如权利要求3所述的基于矩阵的敏感词过滤方法,其特征在于,所述根据敏感词对目标文本进行检测还可是:将敏感词根据优先级进行分段;选择敏感词区段;根据所选择的敏感词区段对目标文本进行检测;所述敏感词的优先级可根据敏感词出现的次数实时动态调整。
5.如权利要求4所述的基于矩阵的敏感词过滤方法,其特征在于,所述根据敏感词构建相关词库包括为敏感词设计替换词;所述过滤掉该敏感词可为用替换词替换掉敏感词。
6.如权利要求5所述的基于矩阵的敏感词过滤方法,其特征在于,所述敏感词可进行字符串间符号扩展,所述根据敏感词对目标文本进行检测具体为根据字符串间符号扩展后的敏感词对目标文本进行检测,所述符号不具备实际意义。
7.基于矩阵的敏感词过滤装置,其特征在于,包括:
构建单元,用于获取敏感词并根据敏感词构建相关词库,该相关词库列举包括敏感词但与敏感词意义不同的词语,所有敏感词及其相关词库构成相关矩阵;
检测单元,根据敏感词对目标文本进行检测,若出现敏感词,则进一步判断该敏感词所在句子是否存在该敏感词相关词库中的词语,若不存在,则过滤掉该敏感词,否则保留该敏感词。
8.如权利要求7所述的基于矩阵的敏感词过滤装置,其特征在于,所述装置还包括:
分类单元,用于在获取敏感词之前,根据目标文本的题材对敏感词进行分类,所述获取敏感词具体为获取与目标文本的题材相对应的敏感词。
9.如权利要求7或8所述的基于矩阵的敏感词过滤装置,其特征在于,所述检测单元具体用于根据敏感词的优先级对目标文本进行检测,所述进一步判断该敏感词所在句子是否存在该敏感词相关词库中的词语具体为:根据相关词库中词语的优先级来进一步判断所在句子是否存在该敏感词相关词库中的词语,所述敏感词的优先级可根据敏感词出现的次数实时动态调整,所述相关词库词语的优先级可根据词语出现的次数实时动态调整。
10.如权利要求9所述的基于矩阵的敏感词过滤装置,其特征在于,所述检测单元还用于将敏感词根据优先级进行分段;选择敏感词区段;根据所选择的敏感词区段对目标文本进行检测;所述敏感词的优先级可根据敏感词出现的次数实时动态调整。
11.如权利要求10所述的基于矩阵的敏感词过滤装置,其特征在于,所述构建单元还用于为敏感词设计替换词;所述过滤掉该敏感词可为用替换词替换掉敏感词。
12.如权利要求11所述的基于矩阵的敏感词过滤装置,其特征在于,所述敏感词可进行字符串间符号扩展,所述检测单元还用于根据字符串间符号扩展后的敏感词对目标文本进行检测,所述符号不具备实际意义。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西数字基地出版传媒集团有限公司,未经陕西数字基地出版传媒集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911389334.1/1.html,转载请声明来源钻瓜专利网。