[发明专利]基于离散型乌鸦差分协同搜索算法的分类数据特征选择方法在审
| 申请号: | 202010656817.X | 申请日: | 2020-07-09 |
| 公开(公告)号: | CN111832645A | 公开(公告)日: | 2020-10-27 |
| 发明(设计)人: | 程子昂;郭雅蓉;霍林;黄俊杰;王宏伟;覃志健;冯锦豪 | 申请(专利权)人: | 广西大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/00 |
| 代理公司: | 南宁深之意专利代理事务所(特殊普通合伙) 45123 | 代理人: | 徐国华 |
| 地址: | 530004 广西*** | 国省代码: | 广西;45 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 离散 乌鸦 协同 搜索 算法 分类 数据 特征 选择 方法 | ||
本发明公开一种基于离散型乌鸦差分协同搜索算法的分类数据特征选择方法,包括以下步骤:1)获取数据样本特征集;2)将样本特征集划分为训练集和测试集;3)使用乌鸦差分协同搜索算法进行特征选择,选择出最优特征组合;4)根据所选特征组合获得对应的最优特征子集;5)用最优特征子集进行分类器训练;6)将待测数据用训练好的分类模型进行分类。本发明中的特征选择方法可以寻找到使分类准确率最高且所选特征长度最小的特征子集,兼顾了高准确率和低资源消耗,且算法运行较稳定,适用于多种数据智能分类的应用。
技术领域
本发明涉及分类问题中的数据预处理领域,尤其涉及一种基于改进乌鸦算法——离散型乌鸦差分协同搜索算法(BCSADE)的分类数据特征选择方法。
背景技术
随着信息数字化时代的快速发展,计算机辅助分类系统在人们日常生活中扮演着举足轻重的角色。由于数据量的频繁增加,涌现出越来越多的高维度问题,对数据的分类、回归或对其进行其他的机器学习任务,都可能会因为其“维数灾难”的影响,而使工作变得困难。在众多机器学习研究领域中,分类问题作为一个重要分支,原始数据的复杂冗余给分类模型的训练带来了极大困难,分类器性能的优劣改进也给分类问题的研究带来了极大地挑战。从信息中提取出数据特征后,如何高效利用这些特征进行准确分类是当前的研究难点之一。
在实际应用中,数据集通常包含很多复杂的特征属性,有些属性可以代表另一个属性的影响;有些属性则会相互依赖,移除其中任何一个都会对后续任务的输出产生重要影响,因此,必要的属性需要保留,不必要的属性可以被忽略,有相关性的属性需要同时保留。然而,由于缺乏经验和先前的知识,很难确定哪个特征是有效的。
特征选择技术作为一种广泛应用的维数约简技术,对解决高维数据的应用问题很有帮助,可以有效地解决“维数灾难”。同时,特征选择也是解决分类问题的重要一环。特征选择被认为是一个非确定性多项式时间困难问题,当涉及到大量的特征时,可能的特征组合的数量呈指数增长,因此,在高维空间中对特征的最优组合进行穷举搜索是不切实际的。
特征选择问题可以理解为在特征空间中寻找一个最优特征子集的寻优过程。智能算法是解决经典优化技术局限性的一种智能计算方法,使用一系列受自然现象和社会现象启发的算法来建立模型、解决计算问题,被认为是全局优化的有力方法。
发明内容
本发明的目的在于针对现有分类技术中存在的困难,提供了一种基于离散型乌鸦差分协同搜索算法(BCSADE)的分类数据特征选择方法。该方法利用BCSADE算法的自适应寻优能力,改善分类技术中存在的缺陷,以提高分类的准确性和可靠性,从而更准确、有效地利用真实数据中包含的信息。
为了实现上述目的,本发明采用了以下技术方案:
一种基于离散型乌鸦差分协同搜索算法的分类数据特征选择方法,包括以下步骤:
1)获取待分类数据样本的特征集;
2)基于k折交叉验证方法,将样本特征集分成k份,取其中一份为测试集,其余k-1份为训练集;
3)使用改进后的乌鸦算法——离散型乌鸦差分协同搜索算法(BCSADE) 进行封装式特征选择,通过分类预测效果的性能来评估特征组合的质量,根据目标函数fitness的评估,在每次迭代中筛选若干特征,或排除若干特征,最终选择出最优特征组合;
4)根据所选最优特征组合,获得对应的最优特征子集;
5)用所选最优特征子集进行常用机器学习分类器训练,得到训练好的分类器;
6)用训练好的分类模型对待测数据进行分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西大学,未经广西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010656817.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种磁电开关电路
- 下一篇:应用的切换显示方法、装置及电子设备





