[发明专利]一种基于网络流行为的内容感知方法有效

专利信息
申请号: 201810728170.X 申请日: 2018-07-05
公开(公告)号: CN108900432B 公开(公告)日: 2021-10-08
发明(设计)人: 谭新城;谢逸;费星瑞 申请(专利权)人: 中山大学
主分类号: H04L12/851 分类号: H04L12/851;H04L12/24
代理公司: 广州圣理华知识产权代理有限公司 44302 代理人: 顿海舟
地址: 510275 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 网络 流行 内容 感知 方法
【权利要求书】:

1.一种基于网络流行为的内容感知方法,其特征在于,包括模型训练阶段、内容识别阶段以及模型更新阶段;

其中模型训练阶段:从外部网络采集网络流数据,并提取观测特征得到训练样本,然后使用DNN-HMM模型对网络流行为建模,再利用训练样本对模型进行训练得到模型参数;

内容识别阶段:将采集的待检测的实时网络流输入到训练后的DNN-HMM模型,模型输出该网络流的内容类别;

模型更新阶段:把识别的网络流数据反馈回DNN-HMM模型,对模型的参数进行更新得到新的DNN-HMM模型;

所述DNN-HMM模型,其HMM用来描述网络流特征的动态变化,DNN模型位于HMM之上;即在给定观测值的条件下,使用DNN的每个输出节点来估计对应状态的后验概率,DNN的每个输出节点与HMM的对应一个状态对应;

具体是:由DNN模型对给定观测值进行分类,再用HMM描述网络流特征的动态变化;

在模型训练阶段获取模型参数方式如下:

利用采集的网络样本数据,对DNN-HMM模型进行训练;为方便计算,将t时刻的观测值ot进行离散化处理,数据包长度和到达时间分别被量化到对应的区间;模型训练过程可以分成三个步骤:

1)为每一种内容类型c建立一个包含Q个状态的HMM,使用对应类型的训练数据输入到模型进行训练,得到相应的HMM的参数λc

为便于计算,首先定义以下辅助变量:

αt(i)=P(o1:t,qt=si),1≤t≤T;1≤i≤Q

α变量按以下方式迭代求解:

α1(i)=πibi(ot)

定义辅助变量:

βt(i)=P(ot+1:T|qt=si),1≤t<T;1≤i≤Q

β变量按以下方式迭代求解:

βT(i)=1

定义辅助变量:

γt(i)=P(qt=i|OT,λ)

γ变量通过变量α和β计算:

参数λ估计的具体步骤如下:

1、使用类别c对应的观测序列集合{O}作为训练数据;

2、使用K-means聚类算法对观测值进行聚类,将观测数据分类为Q个状态;

3、初始化HMM参数λ:

4、对每一个观测序列OT∈{O},迭代计算变量αt(i)、βt(i);

5、计算变量γt(i),并依据以下公式推断观测序列OT对应的最佳状态序列q1,q2,..,qT

2.根据权利要求1所述的内容感知方法,其特征在于,获取训练样本包含两步:流量采集和观测特征提取;首先在客户端访问指定类型的内容,同时利用流量采集工具在网络出口节点采集产生的网络流量并标注其类型;然后将采集的流量依据五元组划分成单一的网络流,并提取流的观测特征。

3.根据权利要求2所述的内容感知方法,其特征在于,选取网络流中数据包的字节数和到达时间作为观测值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810728170.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top