[发明专利]一种域名流量特征提取方法、装置、设备及可读存储介质有效
申请号: | 201910344874.1 | 申请日: | 2019-04-26 |
公开(公告)号: | CN111866196B | 公开(公告)日: | 2023-05-16 |
发明(设计)人: | 闫凡;陈扬;赵振洋;古亮 | 申请(专利权)人: | 深信服科技股份有限公司 |
主分类号: | H04L61/4511 | 分类号: | H04L61/4511;G06N3/0464;G06N3/08;G06N3/044;H04L67/02 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518055 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 域名 流量 特征 提取 方法 装置 设备 可读 存储 介质 | ||
1.一种域名流量特征提取方法,其特征在于,包括:
获取域名访问流量,得到待处理流量数据;
统计预设时间内所述待处理流量数据中各域名单位时间访问次数,得到各域名对应的访问次数序列;
对所述访问次数序列进行归一化处理,得到输入序列;
将所述待输入序列输入至域名流量特征提取模型中进行深层次流量特征提取,得到流量特征输出序列;其中,所述域名流量特征提取模型为经过域名流量特征提取预训练的序列到序列模型;
其中,所述域名流量特征提取方法,还包括:
结合流量的统计特征与所述流量特征输出序列,将得到的结果作为域名的特征信息。
2.如权利要求1所述的域名流量特征提取方法,其特征在于,所述域名流量特征提取模型包括:卷积神经网络以及递归神经网络;
则相应地,将所述输入序列输入至域名流量特征提取模型中进行深层次流量特征提取具体为:
根据所述输入序列构建域名流量变化波形图;
将所述域名流量变化波形图输入至卷积神经网络进行图形结构特征提取,得到第一输出序列;
将所述输入序列输入至所述递归神经网络进行序列结构特征提取,得到第二输出序列;
将所述第一输出序列以及所述第二输出序列进行特征整合,得到流量特征输出序列。
3.如权利要求1所述的域名流量特征提取方法,其特征在于,所述获取域名访问流量,包括:
收集各主机访问待分析域名时的时间戳、DNS记录以及HTTP记录,生成访问记录,并将所述访问记录作为所述待处理流量数据。
4.如权利要求1所述的域名流量特征提取方法,其特征在于,所述获取域名访问流量,包括:
收集域名访问流量,得到原始数据;
对所述原始数据根据预设数据筛选规则进行数据过滤,得到预设类别的待处理流量数据。
5.如权利要求4所述的域名流量特征提取方法,其特征在于,对所述原始数据根据预设数据筛选规则进行数据过滤,包括:
确定目标主机的特征信息,得到目标主机特征;
将所述目标主机特征作为筛选条件对所述原始数据进行筛选,并将筛选得到的与所述目标主机特征匹配的数据作为所述待处理流量数据。
6.如权利要求4所述的域名流量特征提取方法,其特征在于,对所述原始数据根据预设数据筛选规则进行数据过滤,包括:
确定目标域名的特征信息,得到目标域名特征;
将所述目标域名特征作为筛选条件对所述原始数据进行筛选,并将筛选得到的与所述目标域名特征匹配的数据作为所述待处理流量数据。
7.如权利要求4所述的域名流量特征提取方法,其特征在于,对所述原始数据根据预设数据筛选规则进行数据过滤,包括:
确定目标记录字段的特征信息,得到目标字段特征;
将所述目标字段特征作为筛选条件对所述原始数据进行筛选,并将筛选得到的与所述目标字段特征匹配的数据作为所述待处理流量数据。
8.如权利要求1所述的域名流量特征提取方法,其特征在于,对所述访问次数序列进行归一化处理,包括:
对所述访问次数序列中各数值取对数并保留预设位数的有效数字、进行min-max标准化处理、进行标准差标准化处理。
9.如权利要求1所述的域名流量特征提取方法,其特征在于,还包括:
计算与各特征信息间的距离,得到与各域名的特征距离;
将小于阈值的所述特征距离对应的域名划分为第一类别,将不小于阈值的所述特征距离对应的域名划分为第二类别;
根据各类别的特征信息确定类别标签,得到各域名类别划分结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深信服科技股份有限公司,未经深信服科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910344874.1/1.html,转载请声明来源钻瓜专利网。