[发明专利]一种基于信息识别的网络安全系统及方法在审
| 申请号: | 202010631609.4 | 申请日: | 2020-07-03 |
| 公开(公告)号: | CN113887207A | 公开(公告)日: | 2022-01-04 |
| 发明(设计)人: | 黄健 | 申请(专利权)人: | 上海祁昕信息技术有限公司 |
| 主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/30 |
| 代理公司: | 上海宏京知识产权代理事务所(普通合伙) 31297 | 代理人: | 崔巍 |
| 地址: | 201501 上海市浦东新区万*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 信息 识别 网络安全 系统 方法 | ||
本发明公开了一种基于信息识别的网络安全系统及方法,涉及网络安全技术领域,所述系统包括:文本信息提取模块,用于接收目标信息,提取所述目标信息中包含的文本信息;识别模块,用于对文本信息进行识别,得到文本语义分析和相似度;敏感信息判定模块,用于根据所述相似度和/或对所述文本信息进行语义分析判定所述目标信息为敏感信息。具有结构简单、安全性高和识别效率高的优点。
技术领域
本发明涉及网络安全技术领域,特别是涉及一种基于信息识别的网络安全系统及方法。
背景技术
在现有的web2.0的互联网社交应用中,应用的内容不再由服务器发布和推送,而是更多 的由用户自行发布和交互。例如,用户可通过手机拍照分享到网络上发送给其他用户,可以 编辑论坛主题、博客、论坛发帖、微博等文本内容分享给其他用户。然而,用户分享的内容 可能存在违法或者不符合道德规范的风险,例如,粗口、暴力、淫秽、诈骗等内容,因此, 需要对用户发布的内容进行敏感信息的识别和拦截。
对敏感信息的识别和拦截有助于改善网络环境,提升网络安全性,避免违法信息的渗透 和传播。但现有的网络敏感信息识别方法往往采用机械的匹配识别,其识别效率低,如果敏 感词稍有变化,则导致识别失败,识别准确率也低。
发明内容
鉴于此,本发明的目的是提供一种基于信息识别的网络安全系统及方法,具有结构简单、 安全性高和识别效率高的优点。
为了实现上述目的,本发明采用如下技术方案:
一种基于信息识别的网络安全系统,所述系统包括:文本信息提取模块,用于接收目标 信息,提取所述目标信息中包含的文本信息;识别模块,用于对文本信息进行识别,得到文 本语义分析和相似度;敏感信息判定模块,用于根据所述相似度和/或对所述文本信息进行语 义分析判定所述目标信息为敏感信息。
进一步的,所述识别模块包括:训练部分和识别部分;所述训练部分包括:选择单元, 从语料库最新单位时间内的语料中选择第一预定比例的语料作为训练语料;以及从语料库最 新单位时间内的语料中选择第二预定比例的语料作为测试语料;训练单元,用于对所述选择 单元选择的训练语料进行训练生成一级模型;准确率获得单元,用于将所述选择单元选择的 测试语料提交给所述训练单元生成的一级模型进行文本识别,获得生成的一级模型的文本识 别的准确率;保存单元,用于当所述准确率获得单元获得的所述生成的一级模型的准确率大 于或等于预设的第一阈值时,保存所述训练单元生成的一级模型;对比单元,用于将所述保 存单元保存的一级模型的准确率进行对比,输出准确率最高的一级模型;所述识别部分包括: 识别单元,用于通过一级模型和二级模型对所述文本信息提取模块获得的文本信息进行文本 识别,得到文本语义分析和相似度;所述一级模型为利用语料库中最新单位时间内的语料生 成的文本识别模型;所述二级模型为利用所述语料库中的语料生成的文本识别模型。
进一步的,所述识别模块包括:全文哈希识别单元,用于计算所述文本信息的哈希值; 分词单元,用于在所述文本信息的哈希值与预设的特征敏感信息的哈希值不同时,对所述文 本信息进行分词得到分词集合;相似度计算单元,用于计算所述分词集合中的分词的哈希值, 根据所述分词集合中的分词的哈希值生成所述目标信息与预设的特征敏感信息的相似度。
进一步的,所述相似度计算单元还用于计算所述分词集合中,与预设的特征敏感信息的 分词的哈希值匹配的分词在所述分词集合中所占的比例;根据所述比例生成所述目标信息与 预设的特征敏感信息的相似度。
进一步的,所述装置还包括行为识别单元,用于在所述目标信息中不包含文本信息时, 获取发布所述目标信息的用户标识;获取所述用户标识的行为特征数据,根据所述行为特征 数据判定所述目标信息是否为敏感信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海祁昕信息技术有限公司,未经上海祁昕信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010631609.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种油溶性植物提取物乳液的制备方法
- 下一篇:一种适用于木地板生产的压合装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





