[发明专利]敏感信息检测方法、装置、设备及存储介质有效
| 申请号: | 202010940328.7 | 申请日: | 2020-09-09 |
| 公开(公告)号: | CN112134858B | 公开(公告)日: | 2022-12-13 |
| 发明(设计)人: | 周一枫;侯姗姗;张云蕾 | 申请(专利权)人: | 中移(杭州)信息技术有限公司;中国移动通信集团有限公司 |
| 主分类号: | H04L9/40 | 分类号: | H04L9/40;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 上海晨皓知识产权代理事务所(普通合伙) 31260 | 代理人: | 成丽杰 |
| 地址: | 310011 浙江省杭州*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 敏感 信息 检测 方法 装置 设备 存储 介质 | ||
1.一种敏感信息检测方法,其特征在于,包括:
获取待检测字节流报文;
基于预设敏感信息检测模型中的门控循环单元GRU网络从所述待检测字节流报文中提取文本向量;
在所述预设敏感信息检测模型中的注意力机制下处理所述文本向量,以得到文本特征表示信息;
通过分类器对所述文本特征表示信息进行归一化处理,以得到敏感信息检测结果。
2.根据权利要求1所述的敏感信息检测方法,其特征在于,所述GRU网络包括第一GRU网络、第二GRU网络;
所述注意力机制为分层注意力机制,所述分层注意力机制包括词汇级注意力机制及句子级注意力机制;
所述预设敏感信息检测模型的模型结构依次包括所述第一GRU网络、所述词汇级注意力机制、所述第二GRU网络及所述句子级注意力机制。
3.根据权利要求1所述的敏感信息检测方法,其特征在于,所述GRU网络包括更新门与重置门;
相应地,所述基于预设敏感信息检测模型中的门控循环单元GRU网络从所述待检测字节流报文中提取文本向量,具体包括:
根据所述待检测字节流报文分别确定与所述更新门对应的计算结果以及与所述重置门对应的计算结果;
根据与所述更新门对应的计算结果以及与所述重置门对应的计算结果确定文本向量。
4.根据权利要求1或2所述的敏感信息检测方法,其特征在于,所述获取待检测字节流报文之前,所述敏感信息检测方法还包括:
获取待训练报文样本;
根据所述待训练报文样本对待训练敏感信息检测模型进行训练,以得到训练后的预设敏感信息检测模型;
其中,所述待训练敏感信息检测模型为基于GRU网络与注意力机制的深度学习模型;
其中,所述GRU网络包括更新门与重置门。
5.根据权利要求4所述的敏感信息检测方法,其特征在于,所述获取待训练报文样本之前,所述敏感信息检测方法还包括:
获取待训练文本样本;
对所述待训练文本样本进行编码转换,以得到编码样本;
对所述编码样本进行抓包操作,以得到待训练报文样本。
6.根据权利要求5所述的敏感信息检测方法,其特征在于,所述对所述待训练文本样本进行编码转换,以得到编码样本,具体包括:
通过预设编码方式对所述待训练文本样本进行编码转换,以得到编码样本;
其中,所述预设编码方式包括Unicode编码、UTF-8编码及GB2312编码。
7.根据权利要求5所述的敏感信息检测方法,其特征在于,所述对所述编码样本进行抓包操作,以得到待训练报文样本之后,所述敏感信息检测方法还包括:
对所述待训练报文样本进行大小端模式处理,以得到第一报文样本;
对所述第一报文样本进行分词处理,以得到第二报文样本,并将所述第二报文样本作为新的待训练报文样本。
8.一种敏感信息检测装置,其特征在于,包括:
报文获取模块,用于获取待检测字节流报文;
GRU处理模块,用于基于预设敏感信息检测模型中的门控循环单元GRU网络从所述待检测字节流报文中提取文本向量;
注意力机制处理模块,用于在所述预设敏感信息检测模型中的注意力机制下处理所述文本向量,以得到文本特征表示信息;
结果输出模块,用于通过分类器对所述文本特征表示信息进行归一化处理,以得到敏感信息检测结果。
9.一种敏感信息检测设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7任一项所述的敏感信息检测方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述的敏感信息检测方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中移(杭州)信息技术有限公司;中国移动通信集团有限公司,未经中移(杭州)信息技术有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010940328.7/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





