[发明专利]一种结合局部对立学习与社会蜘蛛算法解决最小属性约简的方法在审
| 申请号: | 202010878636.1 | 申请日: | 2020-08-27 |
| 公开(公告)号: | CN111950687A | 公开(公告)日: | 2020-11-17 |
| 发明(设计)人: | 危前进;王承先;常亮;黄桂敏 | 申请(专利权)人: | 桂林电子科技大学 |
| 主分类号: | G06N3/00 | 分类号: | G06N3/00;G06K9/62 |
| 代理公司: | 桂林市持衡专利商标事务所有限公司 45107 | 代理人: | 唐智芳 |
| 地址: | 541004 广西*** | 国省代码: | 广西;45 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 结合 局部 对立 学习 社会 蜘蛛 算法 解决 最小 属性 方法 | ||
本发明公开了一种结合局部对立学习与社会蜘蛛算法解决最小属性约简的方法,该方法在迭代开始阶段提出一种相似度约束使种群中的个体保持一个较好的状态,在迭代过程中,引入对立学习,设计局部对立学习策略扩大搜索范围,加快收敛速度;进一步的,采用冗余检测机制对全局最优解进行冗余检测,尽可能保证最小属性约简。本发明所述方法在多数情况下可以找到有效最小约简,具有更短的运行时间,同时具有较快的收敛速度;并且随着数据集的增大,也可以表现出较好的性能。
技术领域
本发明涉及数据挖掘与知识发现领域,具体涉及一种结合局部对立学习与社会蜘蛛算法解决最小属性约简的方法。
背景技术
随着社会的发展,数据规模呈指数级增长,数据中产生了大量嘈杂的、无关的或有误导性的特征。粗糙集理论(RST)作为一种处理不确定、不精确和模糊数据的数学工具。粗糙集被广泛应用于许多领域,例如机器学习、特征选择、数据挖掘、图像处理、模式识别。RST可以通过发现数据中的依赖关系,从而删除数据中的冗余属性,并且无需任何先验信息。给定具有离散化数值的数据集,通过RST可以找到原始集合的一个子集(约简)。目前,许多学者对属性约简领域进行了广泛研究。其中最小属性约简是研究的重点与热点。
最小属性约简的目的是找到最小基数的约简。最小属性约简的一个最基本的解决方案是生成所有可能的约简并选择那些具有较小基数的约简。但在实践中,生成全部约简是不现实的,最小属性约简问题是一个NP-hard问题。因此,需要考虑启发式方法。
贪婪方法是一种典型的启发式方法,传统的通过粗糙集理论寻找最小属性约简是基于贪婪方法。粗糙集理论中通常采用属性重要度、信息熵、互信息等作为启发式信息。从空集或者核属性开始,采用正向添加或反向删除。正向添加是通过从空集或核属性开始,不断选择最重要的特征加入当前约简集合直到满足条件停止。反向删除则是从完整特征集中依次删除属性直到满足条件停止。Pawlak提出基于正域的属性约简方法(Pawlak.(1982).Rough sets.International Journal of ComputerInformationSciences,11(5),341-356.)。Miao提出了一种基于信息熵的属性约简方法(苗夺谦,王珏,MIAODuo-qian,WANGJue.(1999).粗糙集理论中概念与运算的信息表示.软件学报,10(2),113-116.)。但是,基于贪婪方法的属性约简方法并不能很好的找到最小属性约简。使用属性重要度、信息熵、互信息等作为启发式信息可能会导致搜索沿着非最小路径。
一些学者考虑采用群智能算法找最小属性约简,群智能算法是一种受自然启发的算法。其原理是通过模拟生物的行为迭代寻优。通常包括蚁群算法(ACO)、粒子群算法(PSO)、萤火虫算法(GSO)、鱼群算法(FSA)、人工蜂群算法(ABC)、蝙蝠算法(BAT)等。由于群智能算法的性能的优越性,已经被广泛应用于路径规划、故障诊断等领域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010878636.1/2.html,转载请声明来源钻瓜专利网。





