[发明专利]一种基于杜鹃搜索算法的对等网络流量特征选择方法在审
| 申请号: | 201410352930.3 | 申请日: | 2014-07-23 |
| 公开(公告)号: | CN104092618A | 公开(公告)日: | 2014-10-08 |
| 发明(设计)人: | 叶志伟;李沁沄;王明威;王春枝;刘伟;陈宏伟;徐慧;宗欣露;尹宇洁;喻东阳 | 申请(专利权)人: | 湖北工业大学 |
| 主分类号: | H04L12/801 | 分类号: | H04L12/801 |
| 代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 薛玲 |
| 地址: | 430068 湖北*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 杜鹃 搜索 算法 对等 网络流量 特征 选择 方法 | ||
技术领域
本发明属于智能计算、计算机网络和模式识别的交叉应用领域,涉及模式识别方法在计算机网络,尤其涉及该技术在计算机网络中对等网络流量识别问题,具体涉及一种基于杜鹃搜索算法的对等网络流量特征选择方法。
背景技术
对等网络技术是无中心服务器、依靠用户群交换信息的互联网体系,是互联网技术的一个重要分支。与有传统中心服务器的中央网络系统不同,对等网络的每个用户端既是客户机器也是服务器。目前对等网络技术被广泛应用于军事、商业、政府信息、通讯等众多领域。美国《财富》杂志称对等网络技术是改变互联网发展的四大新技术之一。据统计对等网络应用在互联网应用占据80%左右的流量。在对等网络快速发展的同时,由于对等网络技术本身的特点,对等网络应用对网络运营商的网络质量和用户管理也带来了巨大的危害。
为了使得对等网络技术更好的为人们生产生活提供更好的服务,有必要对对等网络流量的进行控制和管理,首先要解决的问题是对等网络流量的识别。在对等网络流量识别问题中,流量特征的提取和选择对对等网络流量识别有着重大的影响,单一的网络流量特征通常识别精度不高,而过多的流量特征会增加流量样本特征抽取的工作量;此外过多的特征会带来维数灾问题,增加分类器的计算时间,降低分类器的性能。所以为了提高对等网络流量识别的正确率和减少计算工作量,在进行对等网络流量分类识别之前,需要对原始的数据集进行特征选择,剔除不相关或冗余的对等网络流量特征,尽可能选择出最能代表网络流量样本属性的特征子集,以提高对等网络流量识别的正确率。特征选择也叫特征子集选择,是指从已有的M个特征中选择N(N小于等于M)个特征使得系统的特定指标最优化。特征选择是影响分类准确率的最重要的因素之一。实质上对等网络流量特征选择问题是一个计算时间复杂度为指数级别NP难求解问题,其时间复杂度为O(2M),M为原始特征个数。常用的求解算法如分支限界法,回溯法等只能求解规模很小的特征选择问题。实际工作中,特征选择问题常被视为组合优化问题,采用启发式算法或者最优化方法获得它的近似最优解。
发明内容
杜鹃搜索算法是一种启发式优化算法,具有很强的全局寻优能力,为了解决在对等网络流量特征问题,本发明提出一种基于杜鹃搜索算法的对等网络流量特征选择方法。
本发明所采用的技术方案是:一种基于杜鹃搜索算法的对等网络流量特征选择方法,其特征在于,包括以下步骤:
步骤1:对获取的网络数据包进行预处理并提取网络流量特征,对网络流量特征进行归一化处理,得到原始特征样本集,所述的原始特征样本集作为输入数据集;
步骤2:将输入数据集作为完整的特征空间输入到特征选择算法中;
步骤3:初始化杜鹃搜索算法所需的参数,得到算法的初始种群;
步骤4:将杜鹃搜索算法中鸟巢的初始空间位置向量解码成相应的特征子集,利用适应度评价函数计算得到每个特征子集的适应度函数值,比较每个鸟巢的适应度函数值,并记录和保留当前最优鸟巢位置为A;
步骤5:通过杜鹃搜索算法中的位置更新公式更新鸟巢的位置,得到一组新解并计算其适应度函数值,比较这组解的适应度函数值并记其具有最优适应度函数值的位置为B;
步骤6:用随机数r∈[0,1]与鸟巢的主人发现外来的鸟蛋概率pa对比,并判断:
若r>pa,则通过列维飞行随机改变鸟巢位置,得到一组新的鸟巢位置,并计算其适应度函数值,比较这组解的适应度函数值并记其具有最优适应度函数值的位置为C;
若r≤pa,则顺序执行下述步骤7;
步骤7:将位置B和C的适应度函数值与上一代当前最优鸟巢位置A的适应度函数值进行对比,若更好,则将其作为当前的最优鸟巢位置A;
步骤8:判断,是否满足终止条件?
若否,则回转执行所述的步骤5;
若是,则解码并输出全局最优鸟巢位置对应的最优特征子集。
作为优选,步骤1中所述的对获取的网络流量包进行预处理,其具体实现过程是利用网络抓包工具分时段随机抓取一定数量网络数据包并存入样本数据库中,人工分析出其中对等网络包和普通网络包的数量,对抓取的网络数据包提取网络流量特征。
作为优选,步骤1中所述的对对网络流量特征进行归一化处理,采用的公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北工业大学,未经湖北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410352930.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:控制传动系统的方法及相应控制系统
- 下一篇:人体静脉图像特征提取方法





