[发明专利]一种基于网络流行为的内容感知方法有效
| 申请号: | 201810728170.X | 申请日: | 2018-07-05 |
| 公开(公告)号: | CN108900432B | 公开(公告)日: | 2021-10-08 |
| 发明(设计)人: | 谭新城;谢逸;费星瑞 | 申请(专利权)人: | 中山大学 |
| 主分类号: | H04L12/851 | 分类号: | H04L12/851;H04L12/24 |
| 代理公司: | 广州圣理华知识产权代理有限公司 44302 | 代理人: | 顿海舟 |
| 地址: | 510275 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 网络 流行 内容 感知 方法 | ||
1.一种基于网络流行为的内容感知方法,其特征在于,包括模型训练阶段、内容识别阶段以及模型更新阶段;
其中模型训练阶段:从外部网络采集网络流数据,并提取观测特征得到训练样本,然后使用DNN-HMM模型对网络流行为建模,再利用训练样本对模型进行训练得到模型参数;
内容识别阶段:将采集的待检测的实时网络流输入到训练后的DNN-HMM模型,模型输出该网络流的内容类别;
模型更新阶段:把识别的网络流数据反馈回DNN-HMM模型,对模型的参数进行更新得到新的DNN-HMM模型;
所述DNN-HMM模型,其HMM用来描述网络流特征的动态变化,DNN模型位于HMM之上;即在给定观测值的条件下,使用DNN的每个输出节点来估计对应状态的后验概率,DNN的每个输出节点与HMM的对应一个状态对应;
具体是:由DNN模型对给定观测值进行分类,再用HMM描述网络流特征的动态变化;
在模型训练阶段获取模型参数方式如下:
利用采集的网络样本数据,对DNN-HMM模型进行训练;为方便计算,将t时刻的观测值ot进行离散化处理,数据包长度和到达时间分别被量化到对应的区间;模型训练过程可以分成三个步骤:
1)为每一种内容类型c建立一个包含Q个状态的HMM,使用对应类型的训练数据输入到模型进行训练,得到相应的HMM的参数λc;
为便于计算,首先定义以下辅助变量:
αt(i)=P(o1:t,qt=si),1≤t≤T;1≤i≤Q
α变量按以下方式迭代求解:
α1(i)=πibi(ot)
定义辅助变量:
βt(i)=P(ot+1:T|qt=si),1≤t<T;1≤i≤Q
β变量按以下方式迭代求解:
βT(i)=1
定义辅助变量:
γt(i)=P(qt=i|OT,λ)
γ变量通过变量α和β计算:
参数λ估计的具体步骤如下:
1、使用类别c对应的观测序列集合{O}作为训练数据;
2、使用K-means聚类算法对观测值进行聚类,将观测数据分类为Q个状态;
3、初始化HMM参数λ:
4、对每一个观测序列OT∈{O},迭代计算变量αt(i)、βt(i);
5、计算变量γt(i),并依据以下公式推断观测序列OT对应的最佳状态序列q1,q2,..,qT;
2.根据权利要求1所述的内容感知方法,其特征在于,获取训练样本包含两步:流量采集和观测特征提取;首先在客户端访问指定类型的内容,同时利用流量采集工具在网络出口节点采集产生的网络流量并标注其类型;然后将采集的流量依据五元组划分成单一的网络流,并提取流的观测特征。
3.根据权利要求2所述的内容感知方法,其特征在于,选取网络流中数据包的字节数和到达时间作为观测值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810728170.X/1.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法





