[发明专利]一种敏感资讯检测方法、装置、设备及系统在审
申请号: | 201911406504.2 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111159354A | 公开(公告)日: | 2020-05-15 |
发明(设计)人: | 赵庆;李瑞男;狄潇然 | 申请(专利权)人: | 中国银行股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/30;G06K9/62;G06Q40/06 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 周达;刘飞 |
地址: | 100818 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 敏感 资讯 检测 方法 装置 设备 系统 | ||
1.一种敏感资讯检测方法,其特征在于,包括:
获取资讯信息;
判断所述资讯信息中是否存在预设敏感词库包括的敏感词;
确定不存在时,将所述资讯信息输入预先构建的资讯检测模型中,所述资讯检测模型基于不符合信息规范的资讯文本训练获得;
获取所述资讯检测模型输出的资讯检测结果。
2.如权利要求1所述的方法,其特征在于,所述判断所述资讯信息中是否存在预设敏感词库包括的敏感词,包括:
利用AC自动机对资讯信息进行逐字扫描,获得扫描结果;
将所述扫描结果与预设敏感词库进行对比,确定所述资讯信息中是否存在敏感词。
3.如权利要求1所述的方法,其特征在于,所述判断所述资讯信息中是否存在敏感词,还包括:
确定存在时,将所述资讯信息标记为敏感资讯;
将所述敏感资讯不显示或将所述敏感资讯转交人工审核。
4.如权利要求1所述的方法,其特征在于,所述预先构建的资讯检测模型包括采用下述方式得到:
获取不符合信息规范的资讯文本,所述不符合信息规范的资讯文本不包括敏感词;
将所述不符合信息规范的资讯文本进行向量化处理,获得资讯词向量;
将所述资讯词向量输入预先建立的朴素贝叶斯模型进行训练,获取训练结果;
基于所述训练结果,对所述朴素贝叶斯模型进行校正,获得资讯检测模型。
5.如权利要求1所述的方法,其特征在于,所述确定不存在时,将所述资讯信息输入预先构建的资讯检测模型中,包括:
确定不存在时,将所述资讯信息进行向量化处理,获得与资讯信息对应的词向量;
将所述词向量输入预先构建的资讯检测模型中。
6.一种敏感资讯检测装置,其特征在于,包括:
资讯信息获取模块,用于获取资讯信息;
判断模块,用于判断所述资讯信息中是否存在预设敏感词库包括的敏感词;
输入模块,用于确定不存在时,将所述资讯信息输入预先构建的资讯检测模型中,所述资讯检测模型基于不符合信息规范的资讯文本训练获得;
检测结果获取模块,用于获取所述资讯检测模型输出的资讯检测结果。
7.如权利要求6所述的装置,其特征在于,所述判断模块,包括:
扫描单元,用于利用AC自动机对资讯信息进行逐字扫描,获得扫描结果;
对比单元,用于将所述扫描结果与预设敏感词库进行对比,确定所述资讯信息中是否存在敏感词。
8.如权利要求6所述的装置,其特征在于,所述判断模块,还包括:
标记单元,用于确定存在时,将所述资讯信息标记为敏感资讯;
处理单元,用将所述敏感资讯不显示或将所述敏感资讯转交人工审核。
9.如权利要求6所述的装置,其特征在于,所述预先构建的资讯检测模型,包括:
不合规资讯获取模块,用于获取不符合信息规范的资讯文本,所述不符合信息规范的资讯文本不包括敏感词;
向量化处理,用于将所述不符合信息规范的资讯文本进行向量化处理,获得资讯词向量;
训练模块,用于将所述资讯词向量输入预先建立的朴素贝叶斯模型进行训练,获取训练结果;
检测模型获得模块,用于基于所述训练结果,对所述朴素贝叶斯模型进行校正,获得资讯检测模型。
10.如权利要求6所述的装置,其特征在于,所述输入模块,包括:
词向量获得单元,用于确定不存在时,将所述资讯信息进行向量化处理,获得与资讯信息对应的词向量;
输入单元,用于将所述词向量输入预先构建的资讯检测模型中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银行股份有限公司,未经中国银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911406504.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:语音信息处理方法及装置
- 下一篇:一种KS引导自动化批量装机的方法及系统