[发明专利]一种基于SVM的大规模P2P流量数据的离线分析方法在审
申请号: | 201711018881.X | 申请日: | 2017-10-26 |
公开(公告)号: | CN109714379A | 公开(公告)日: | 2019-05-03 |
发明(设计)人: | 李海峰;朱彤 | 申请(专利权)人: | 北京航天长峰科技工业集团有限公司 |
主分类号: | H04L29/08 | 分类号: | H04L29/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100854*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于SVM的大规模P2P流量数据的离线分析方法,依照数据流向设置数据采集模块、数据传输与存储存储模块和P2P流量识别模块,其中数据采集模块负责捕获流量数据;数据传输与存储模块负责对流量数据的初步处理并将其写入HDFS;P2P流量训练与识别模块基于MapReduce编程实现,应用mapreduce任务计算出特征向量的各个分量;应用SVM算法,先计算出每一个流的特征向量,完成SVM特征向量训练,生成P2P流量模型,然后根据训练得到的模型进行判断,从而识别是否为P2P流量。 | ||
搜索关键词: | 特征向量 存储模块 离线分析 流量数据 数据传输 数据采集模块 采集模块 初步处理 任务计算 设置数据 数据流向 编程 捕获 应用 写入 存储 | ||
【主权项】:
1.一种基于SVM的大规模P2P流量数据的离线分析方法,其特征在于:依照数据流向设置数据采集模块、数据传输与存储存储模块和P2P流量识别模块,其中:数据采集模块负责捕获流量数据,在流量采集模块启动时,先通过设备管理函数把网卡设成侦听状态,此状态下的引擎能够捕获流量引擎的所有流量;数据传输与存储模块负责对流量数据的初步处理并将其写入HDFS;通过数据传输与存储模块完成了对每个数据集的分流;P2P流量训练与识别模块基于MapReduce编程实现,应用mapreduce任务计算出特征向量的各个分量;应用SVM算法,先计算出每一个流的特征向量,完成SVM特征向量训练,生成P2P流量模型,然后根据训练得到的模型进行判断,从而识别是否为P2P流量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航天长峰科技工业集团有限公司,未经北京航天长峰科技工业集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711018881.X/,转载请声明来源钻瓜专利网。