[发明专利]网络流量的识别方法、装置、设备及存储介质在审
申请号: | 202111289011.2 | 申请日: | 2021-11-02 |
公开(公告)号: | CN114039928A | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 白司特;崔渊博;周忠义;阿曼太;梁彧;傅强;田野;王杰;杨满智;蔡琳;金红;陈晓光 | 申请(专利权)人: | 恒安嘉新(北京)科技股份公司 |
主分类号: | H04L47/2483 | 分类号: | H04L47/2483 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 岳晓萍 |
地址: | 100086 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络流量 识别 方法 装置 设备 存储 介质 | ||
本发明实施例公开了一种网络流量的识别方法、装置、设备及存储介质,该方法包括:获取目标网际协议IP地址的网络流量,并对网络流量进行解析,获取对应的报文数据;当报文数据与目标状态机的起始状态检测内容成功匹配时,将目标状态机配置为起始状态,并将报文数据依次与目标状态机的各其他状态检测内容进行匹配;在预设时间阈值内,若检测到目标状态机的最终状态,则确定网络流量由目标状态机对应的目标应用产生。本发明实施例的技术方案,提出了一种利用状态机实现网络流量识别的新方式,可以实现对加密网络流量的准确识别,可以提升网络流量识别的准确度。
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种网络流量的识别方法、装置、设备及存储介质。
背景技术
随着互联网对隐私保护需求的日益增高,通常基于传输层安全(Transport LayerSecurity,TLS)协议对网络流量进行加密;实现对TLS协议加密后的网络流量的准确识别,在网络优化、网络监控等领域具有广阔应用前景。
目前,现有的TLS协议加密网络流量的识别方法,主要包括字段匹配方法和机器学习算法;其中,字段匹配方法,主要利用TLS协议协商过程中发送的服务器名称指示(ServerName Indication,SNI)字段,确定对应的应用;机器学习算法,通过提取TLS协议协商头部字段的特征信息,并将该特征信息作为样本数据,训练得到网络流量识别模型,最终基于训练完成的网络流量识别模型,实现对TLS协议加密网络流量的识别。
然而,对于字段匹配方法,当存在某个域名的服务器被多个应用共同使用时,此时各应用的网络流量中的SNI字段相同,无法实现对不同应用的网络流量的区分。对于机器学习算法,其对不同应用网络流量的识别准备率主要取决于样本数据的数量,而在实际场景下,样本数据的数量通常是有限的,导致网络流量的识别准确度低。
发明内容
本发明实施例提供一种网络流量的识别方法、装置、设备及存储介质,可以实现对加密网络流量的准确识别,可以提升网络流量识别的准确度。
第一方面,本发明实施例提供了一种网络流量的识别方法,包括:
获取目标网际协议IP地址的网络流量,并对所述网络流量进行解析,获取对应的报文数据;
当所述报文数据与目标状态机的起始状态检测内容成功匹配时,将所述目标状态机配置为起始状态,并将所述报文数据依次与目标状态机的各其他状态检测内容进行匹配;
在预设时间阈值内,若检测到目标状态机的最终状态,则确定所述网络流量由所述目标状态机对应的目标应用产生。
第二方面,本发明实施例还提供了一种网络流量的识别装置,包括:
报文数据获取模块,用于获取目标网际协议IP地址的网络流量,并对所述网络流量进行解析,获取对应的报文数据;
状态检测内容匹配模块,用于当所述报文数据与目标状态机的起始状态检测内容成功匹配时,将所述目标状态机配置为起始状态,并将所述报文数据依次与目标状态机的各其他状态检测内容进行匹配;
最终状态检测模块,用于在预设时间阈值内,若检测到目标状态机的最终状态,则确定所述网络流量由所述目标状态机对应的目标应用产生。
第三方面,本发明实施例还提供了一种电子设备,该电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个计算机程序;
当所述一个或多个计算机程序被所述一个或多个处理器执行,使得所述一个或多个处理器执行所述计算机程序时实现本发明任意实施例提供的网络流量的识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于恒安嘉新(北京)科技股份公司,未经恒安嘉新(北京)科技股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111289011.2/2.html,转载请声明来源钻瓜专利网。