[发明专利]一种跨资源访问的协议识别方法有效
申请号: | 201310063699.1 | 申请日: | 2013-02-28 |
公开(公告)号: | CN103152340A | 公开(公告)日: | 2013-06-12 |
发明(设计)人: | 余兆 | 申请(专利权)人: | 汉柏科技有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹 |
地址: | 300384 天津市华*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 资源 访问 协议 识别 方法 | ||
技术领域
本发明涉及网络协议识别技术领域,具体涉及一种跨资源访问的协议识别方法。
背景技术
随着互联网和移动互联网的快速发展,用户的体验与参与也越来越丰富,除了文字传播,网络流量分布中以音频与视频的流量占有较大比重,如果不能对这些流量正确识别并加以监管和控制,将很大程度上加大网络的拥堵,影响用户的体验。如以千千静听为代表的主要以音乐与视频MV传播为主要业务的应用协议,除了自身的海量服务器存储大量的播放资源以外,部分资源还可以跨其它服务器去获取,这种跨服务器获取资源的方式采用的是服务器本身的应用协议,这些服务器只存放资源的链接信息,根据获取的资源链接信息找到存储资源的所在服务器从而提供给用户,这是一个连续的过程,涉及到多种协议。根据这种连续的跨资源访问方式,采用多协议的结合,如果不采用某种技术辅助识别,则大量的音视频流量不能识别为具体业务协议,从而影响了对这部分网络流量的监管。
目前协议识别领域主要采用的协议识别技术是DPI(Deep Packet Inspection深度包检测)与DFI(Deep Flow Inspection深度流检测)两个部分,DPI主要是对协议内容进行扫描匹配,针对跨资源访问的协议,本身对协议的识别采用DPI,应用业务的跨资源连续访问方式中的每一种协议都采用DPI识别。现有的跨资源访问的服务器的流量被识别为单个的服务器的协议。
但针对这种跨资源访问的流量不能简单仅仅只是识别为单个协议,还需要根据一系列的访问方式及在访问链上多协议的内联性进行综合识别,只有统一识别为某一具体应用业务协议,才能有效进行流量管理。
发明内容
(一)所要解决的技术问题
本发明提供一种基于跨资源访问的协议识别方法,把跨资源访问的连续的涉及多种的不同协议有效识别为本应用业务协议,高效率地完成对需要跨服务器资源访问的应用协议的识别,进而实现对网络流量的监管与控制。
(二)技术方案
本发明提供一种跨资源访问的协议识别方法,该方法包括:
A:提取业务协议应用的域名关键字,编译形成特征库;
B:提取所述应用的跨资源访问服务器的域名关键字,编译并加入所述特征库;
C:基于所述特征库对网络中不同链接信息进行DPI检测识别,若发现所述业务协议应用,则将所述业务协议应用记录下来,所述记录有时间限制;
若发现所述应用的跨资源访问服务器,则判断是否有所述记录:否,则将链接信息直接识别为本服务器的协议;是,则对服务器链接的回复包进行提取,若得到访问资源的域名关键字,存储域名关键字转至步骤D,若得到访问资源的IP地址,存储IP地址直接转至步骤E;
D:扫描主机的DNS请求,判断请求解析的域名是否与所述访问资源的域名关键字相匹配,若匹配,则记录DNS解析出的访问资源的IP地址;
E:根据所述访问资源的IP地址形成链接五元组信息并存储,判断网络中下一条链接信息的链接五元组信息与所述存储的五元组信息是否匹配,若匹配则将所述链接信息识别为具体业务应用协议。
其中,所述步骤A包括:抓取所述业务协议应用的离线报文,分析并提取域名关键字。
其中,所述访问资源的域名关键字存储于域名hash表,所述访问资源的IP地址存储于IP地址hash表。
其中,所述五元组信息存储时间为:成功匹配一次后清空,或不管匹配与否,预定时间后清空。
(三)有益效果
本发明对跨资源访问的协议进行内联性识别,统一识别为具体业务应用协议,而不是识别为不同的单个服务器的协议,这种访问资源一般流量较大,只有统一跨资源访问链接上的所有协议才能将这种资源的协议统一识别为应用业务协议,对业务应用协议管理实现了对资源管理,进而统一了对流量的监管,净化了网络流量环境,减缓了网络拥堵,提高了用户体验。
附图说明
图1为本发明所述的跨资源访问的协议识别方法步骤流程图。
具体实施方式
下面结合附图和实施实施例,对本发明的具体实施方式作进一步详细描述。
本发明提供一种跨资源访问的协议识别方法,具体步骤如图1所示:简单起见,以千千静听这一应用为例,
A:提取业务协议应用的域名关键字,编译形成特征库。
通过抓取千千静听的离线报文,分析提取千千静听的域名关键字及其它特征,即能唯一识别为千千静听协议的所有特征(报文内容信息),将这些信息编译形成特征库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汉柏科技有限公司,未经汉柏科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310063699.1/2.html,转载请声明来源钻瓜专利网。