[发明专利]流式数据的特征提取方法及装置、存储介质、计算机设备有效
| 申请号: | 202110999767.X | 申请日: | 2021-08-30 |
| 公开(公告)号: | CN113452581B | 公开(公告)日: | 2021-12-14 |
| 发明(设计)人: | 辜乘风;徐明;魏国富;殷钱安;周晓勇;陶景龙;余贤喆;梁淑云;刘胜;王启凡;马影 | 申请(专利权)人: | 上海观安信息技术股份有限公司 |
| 主分类号: | H04L12/26 | 分类号: | H04L12/26;G06N20/00;G06K9/62;G06F16/2455;G06F16/22 |
| 代理公司: | 北京中强智尚知识产权代理有限公司 11448 | 代理人: | 黄耀威 |
| 地址: | 200000 上海市浦东新*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据 特征 提取 方法 装置 存储 介质 计算机 设备 | ||
本申请公开了一种流式数据的特征提取方法及装置、存储介质、计算机设备,该方法包括:接收流式数据,并获取所述流式数据对应的网络安全特征提取需求,其中,所述网络安全特征提取需求包括至少一个待提取的目标维度以及至少一个待提取的目标特征;依据所述目标维度以及所述目标特征,生成特征数据提取器;利用所述特征数据提取器,提取所述流式数据中与所述目标维度以及所述目标特征对应的网络安全特征数据。本申请通过构建特征数据提取器,并通过特征数据提取器提取流式数据的网络安全特征数据,能够对流式数据进行即时性特征提取,在充分发挥流式数据的低延迟性特点的同时,减少资源的占用量。
技术领域
本申请涉及数据处理技术领域,尤其是涉及到一种流式数据的特征提取方法及装置、存储介质、计算机设备。
背景技术
流式数据是一组顺序、大量、快速、连续到达的数据序列,是一种随时间延续而不断增加的动态数据集合。由于流式数据具有低延迟、高吞吐的特性,因而被广泛应用于对数据实时性要求较高的业务中,例如失陷主机判断、DNS请求数量提取等网络安全业务。
网络安全业务中,大部分流式数据均需要经过特征提取后再加以应用,而当前在对流式数据进行特征提取时,通常根据网络安全业务实际情况,预先设定时间周期,之后按照该时间周期对流式数据进行统一处理,提取出想要的特征。这种特征提取方法一方面无法充分发挥流式数据的低延迟的特点,一方面按照时间周期对流式数据统一进行特征提取前,需要对这些流式数据进行统一存储,当流式数据的吞吐量较高时,需要占用大量的主机资源。
因此,如何对网络安全业务中的流式数据进行即时性特征提取,在充分发挥流式数据的低延迟性特点的同时,减少资源的占用量,成为了本领域亟待解决的问题。
发明内容
有鉴于此,本申请提供了一种流式数据的特征提取方法及装置、存储介质、计算机设备,能够对网络安全业务中的流式数据进行即时性特征提取,在充分发挥流式数据的低延迟性特点的同时,减少资源的占用量。
根据本申请的一个方面,提供了一种流式数据的特征提取方法,包括:
接收流式数据,并获取所述流式数据对应的网络安全特征提取需求,其中,所述网络安全特征提取需求包括至少一个待提取的目标维度以及至少一个待提取的目标特征,所述目标维度包括IP维度、时间维度以及mac局域网地址维度中的至少一种,所述目标特征包括DNS请求数量特征、ICMP请求数量特征、HTTP请求数量特征、DNS域名集合特征以及页面访问次数特征中的至少一种;
依据所述目标维度以及所述目标特征,生成特征数据提取器;
利用所述特征数据提取器,提取所述流式数据中与所述目标维度以及所述目标特征对应的网络安全特征数据。
可选地,所述网络安全特征提取需求包括请求DNS域名去重数量,所述请求DNS域名去重数量包括所述IP维度以及所述DNS域名集合特征。
可选地,所述获取所述流式数据对应的网络安全特征提取需求之前,所述方法还包括:
依据预设数据筛选条件,对所述流式数据进行筛选,其中,所述预设数据筛选条件包括预设数据协议。
可选地,所述依据所述目标维度以及所述目标特征,生成特征数据提取器,具体包括:
分别依据每个目标特征,建立与所述每个目标特征各自匹配的特征数据提取工具;
依据所述目标维度、所述目标特征以及所述特征数据提取工具,生成所述特征数据提取器,其中,所述特征数据提取器包括提取器头部以及提取器主体,所述提取器头部用于指示所述目标维度以及所述目标特征,所述提取器主体包括所述特征数据提取工具。
可选地,所述利用所述特征数据提取器,提取所述流式数据中与所述目标维度以及所述目标特征对应的网络安全特征数据,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海观安信息技术股份有限公司,未经上海观安信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110999767.X/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





