[发明专利]数据处理方法、装置、电子设备及存储介质有效
| 申请号: | 202011468191.6 | 申请日: | 2020-12-14 |
| 公开(公告)号: | CN112637292B | 公开(公告)日: | 2022-11-22 |
| 发明(设计)人: | 张英华;柴智;王斌;刘慧;李萌;孟令栋;龚晓雪;杜永刚;于宝彤 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
| 主分类号: | H04L67/02 | 分类号: | H04L67/02;H04L41/14;H04L9/40;H04L9/32 |
| 代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 朱颖;刘芳 |
| 地址: | 100033 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据处理 方法 装置 电子设备 存储 介质 | ||
1.一种数据处理方法,其特征在于,包括:
获得待处理的流量数据包;
采用类选择器对所述流量数据包进行类别抽取处理,获得所述流量数据包在不同类别下的流量数据;
对不同类别下的流量数据进行向量处理,获得流量数据包对应的配置信息、包长和时间序列信息、字节分布信息以及非加密的数据头信息;
将所述流量数据包对应的配置信息、包长和时间序列信息、字节分布信息以及非加密的数据头信息输入至预设的数据分类模型,输出所述流量数据包的分类结果;
根据不同类别下的流量数据,获得流量数据包对应的非加密的数据头信息,包括:
针对CliSuites,CliExtensions,SerSuite,SerExtension类别的流量数据,采用W2V算法对每一类的流量数据进行向量处理,获得每一类的流量数据对应的多维向量;
对各多维向量进行整合处理,获得整合维度后的多维向量,该整合维度后的多维向量将作为所述非加密的数据头信息;
其中,所述针对CliSuites,CliExtensions,SerSuite,SerExtension类别的流量数据,采用W2V算法对每一类的流量数据进行向量处理,获得每一类的流量数据对应的多维向量,包括:
针对CliSuites,CliExtensions,SerSuite,SerExtension类别,采用W2V算法将二进制编码的CliSuites,CliExtensions,SerSuite,SerExtension类别的流量数据转换为十六进制编码,将十六进制编码的CliSuites,CliExtensions,SerSuite,SerExtension类别的流量数据组成词库,并分别将其转换为低维度的向量,得到每一类的流量数据对应的多维向量。
2.根据权利要求1所述的数据处理方法,其特征在于,根据不同类别下的流量数据,获得流量数据包对应的包长和时间序列信息,包括:
针对包长和时间序列类别下的流量数据,采用马尔科夫链算法对其进行向量处理,获得包长和时间序列类别对应的向量,该向量作为所述流量数据包对应的包长和时间序列信息。
3.根据权利要求1所述的数据处理方法,其特征在于,根据不同类别下的流量数据,获得流量数据包对应的字节分布信息,包括:
针对字节分布类别下的流量数据,对其进行字节分布频率的统计,并获得字节出现次数,将该次数作为字节分布信息。
4.根据权利要求1-3任一项所述的数据处理方法,其特征在于,还包括:
构建数据分类模型,并采集获得训练样本;其中,所述训练样本中包括有多个样本流量数据,以及对每个样本流量数据进行标注获得的数据分类;
利用所述训练样本对所述数据分类模型进行训练,将训练后的数据分类模型作为所述预设的数据分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011468191.6/1.html,转载请声明来源钻瓜专利网。





