[发明专利]一种基于自学习的深度报文解析系统有效
| 申请号: | 201910755654.8 | 申请日: | 2019-08-15 |
| 公开(公告)号: | CN110445800B | 公开(公告)日: | 2022-06-14 |
| 发明(设计)人: | 裴亚可;曹瑜 | 申请(专利权)人: | 上海寰创通信科技股份有限公司 |
| 主分类号: | H04L69/22 | 分类号: | H04L69/22;H04L47/31;H04L47/2441;H04L47/2483;H04L61/4511;G06N20/00;G06K9/62;G06V10/762 |
| 代理公司: | 上海申新律师事务所 31272 | 代理人: | 俞涤炯 |
| 地址: | 201100 上海市闵*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 自学习 深度 报文 解析 系统 | ||
1.一种基于自学习的深度报文解析系统,其特征在于,包括生成端和运行端,所述生成端连接所述运行端,所述生成端包括:
第一采集模块,用于抓取网络中的数据报文;
第一解析模块,连接所述第一采集模块,所述第一解析模块根据一预设的第一特征库对所述数据报文进行特征标记,并根据标记结果和目的IP地址对所述数据报文进行分类存储,输出一分类结果;
第一学习模块,连接所述第一解析模块,所述第一学习模块包括:
训练单元,用于根据所述分类结果,将分类存储且进行特征标记的所述数据报文作为训练数据,对一无监督学习模型进行第一机器学习,以形成并保存一包括所述数据报文的数据特征的第二特征库,应用所述第二特征库可对所述数据报文进行特征识别;
所述运行端中包括:
第二采集模块,用于抓取网络中的数据报文;
第二解析模块,连接所述第二采集模块,读取所述生成端保存的所述第二特征库,对所述第二采集模块抓取的所述数据报文进行特征解析,并输出解析结果;
输出模块,连接所述第二解析模块,用于将所述解析结果输出给用户使用;
所述运行端还包括:
第二学习模块,连接所述第二解析模块,根据所述解析结果,将实际识别得到的所述数据报文的所述数据特征中的DNS特征标记结果和目的IP地址加入所述第一特征库中,并根据所述第一特征库,实时对所述特征识别模型进行第二机器学习,以更新所述第二特征库;
所述第一特征库为现有的DNS特征库,所述第二特征库为应用程序特征库,所述第一机器学习为无监督学习方式,所述第二机器学习为监督学习方式和/或强化学习方式;
所述解析结果包括对所述数据报文进行特征标记、分类的结果和通过深度报文解析得到的数据。
2.根据权利要求1所述的基于自学习的深度报文解析系统,其特征在于,所述第一学习模块还包括:
清洗单元,连接所述训练单元,用于对所述分类结果进行数据清洗。
3.根据权利要求1所述的基于自学习的深度报文解析系统,其特征在于,
所述第二解析模块根据所述第二特征库对所述第二采集模块抓取的所述数据报文进行特征标记,并根据标记结果对所述数据报文进行分类,输出为所述解析结果。
4.根据权利要求1所述的基于自学习的深度报文解析系统,其特征在于,所述训练单元采用聚类算法对所述特征识别模型进行所述第一机器学习。
5.根据权利要求1所述的基于自学习的深度报文解析系统,其特征在于,所述第二学习模块采用分类算法对所述特征识别模型进行第二机器学习。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海寰创通信科技股份有限公司,未经上海寰创通信科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910755654.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:入侵阶段的确定方法、装置及服务器
- 下一篇:一种物联网的态势感知方法和系统





