[发明专利]一种敏感资讯检测方法、装置、设备及系统在审

申请号：	201911406504.2	申请日：	2019-12-31
公开（公告）号：	CN111159354A	公开（公告）日：	2020-05-15
发明（设计）人：	赵庆;李瑞男;狄潇然	申请（专利权）人：	中国银行股份有限公司
主分类号：	G06F16/33	分类号：	G06F16/33;G06F40/30;G06K9/62;G06Q40/06
代理公司：	北京三友知识产权代理有限公司 11127	代理人：	周达;刘飞
地址：	100818 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种敏感资讯检测方法装置设备系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种敏感资讯检测方法，其特征在于，包括：

获取资讯信息；

判断所述资讯信息中是否存在预设敏感词库包括的敏感词；

确定不存在时，将所述资讯信息输入预先构建的资讯检测模型中，所述资讯检测模型基于不符合信息规范的资讯文本训练获得；

获取所述资讯检测模型输出的资讯检测结果。

2.如权利要求1所述的方法，其特征在于，所述判断所述资讯信息中是否存在预设敏感词库包括的敏感词，包括：

利用AC自动机对资讯信息进行逐字扫描，获得扫描结果；

将所述扫描结果与预设敏感词库进行对比，确定所述资讯信息中是否存在敏感词。

3.如权利要求1所述的方法，其特征在于，所述判断所述资讯信息中是否存在敏感词，还包括：

确定存在时，将所述资讯信息标记为敏感资讯；

将所述敏感资讯不显示或将所述敏感资讯转交人工审核。

4.如权利要求1所述的方法，其特征在于，所述预先构建的资讯检测模型包括采用下述方式得到：

获取不符合信息规范的资讯文本，所述不符合信息规范的资讯文本不包括敏感词；

将所述不符合信息规范的资讯文本进行向量化处理，获得资讯词向量；

将所述资讯词向量输入预先建立的朴素贝叶斯模型进行训练，获取训练结果；

基于所述训练结果，对所述朴素贝叶斯模型进行校正，获得资讯检测模型。

5.如权利要求1所述的方法，其特征在于，所述确定不存在时，将所述资讯信息输入预先构建的资讯检测模型中，包括：

确定不存在时，将所述资讯信息进行向量化处理，获得与资讯信息对应的词向量；

将所述词向量输入预先构建的资讯检测模型中。

6.一种敏感资讯检测装置，其特征在于，包括：

资讯信息获取模块，用于获取资讯信息；

判断模块，用于判断所述资讯信息中是否存在预设敏感词库包括的敏感词；

输入模块，用于确定不存在时，将所述资讯信息输入预先构建的资讯检测模型中，所述资讯检测模型基于不符合信息规范的资讯文本训练获得；

检测结果获取模块，用于获取所述资讯检测模型输出的资讯检测结果。

7.如权利要求6所述的装置，其特征在于，所述判断模块，包括：

扫描单元，用于利用AC自动机对资讯信息进行逐字扫描，获得扫描结果；

对比单元，用于将所述扫描结果与预设敏感词库进行对比，确定所述资讯信息中是否存在敏感词。

8.如权利要求6所述的装置，其特征在于，所述判断模块，还包括：

标记单元，用于确定存在时，将所述资讯信息标记为敏感资讯；

处理单元，用将所述敏感资讯不显示或将所述敏感资讯转交人工审核。

9.如权利要求6所述的装置，其特征在于，所述预先构建的资讯检测模型，包括：

不合规资讯获取模块，用于获取不符合信息规范的资讯文本，所述不符合信息规范的资讯文本不包括敏感词；

向量化处理，用于将所述不符合信息规范的资讯文本进行向量化处理，获得资讯词向量；

训练模块，用于将所述资讯词向量输入预先建立的朴素贝叶斯模型进行训练，获取训练结果；

检测模型获得模块，用于基于所述训练结果，对所述朴素贝叶斯模型进行校正，获得资讯检测模型。

10.如权利要求6所述的装置，其特征在于，所述输入模块，包括：

词向量获得单元，用于确定不存在时，将所述资讯信息进行向量化处理，获得与资讯信息对应的词向量；

输入单元，用于将所述词向量输入预先构建的资讯检测模型中。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国银行股份有限公司，未经中国银行股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201911406504.2/1.html，转载请声明来源钻瓜专利网。

上一篇：语音信息处理方法及装置
下一篇：一种KS引导自动化批量装机的方法及系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种敏感资讯检测方法、装置、设备及系统在审

专利文献下载