[发明专利]一种基于萤火虫算法的选择性集成学习方法在审

专利信息
申请号: 201510953417.4 申请日: 2015-12-16
公开(公告)号: CN105550711A 公开(公告)日: 2016-05-04
发明(设计)人: 倪志伟;张琛;倪丽萍;朱旭辉;金飞飞;伍章俊 申请(专利权)人: 合肥工业大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 安徽省合肥新安专利代理有限责任公司 34101 代理人: 陆丽莉;何梅生
地址: 230009 安*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 萤火虫 算法 选择性 集成 学习方法
【说明书】:

技术领域

发明涉及数据挖掘中集成学习领域,具体的说是一种基于萤火虫算法的选择性集成学 习方法。

背景技术

针对集成学习来说,参与集成的个体的精度越高,差异度越大,越有利于提高集成的泛化 性能,然而如何在个体的精度与个体间的差异度之间寻求一种平衡以达到提高集成泛化性能 的目的是众多学者研究的初衷。周志华等人在研究神经网络集成时,率先提出了一种“Many couldbebetterthanall”(“部分可能比全体结果更好”)的思想,认为在独立训练生成若干个 个体分类器后,并不一定需要把所有的个体都集成起来,选择其中的部分个体进行集成,可以 得到比使用所有分类器构成的集成更好的泛化性能,把这种集成称为选择性集成。

现有的经典选择性集成算法主要从两个角度进行考虑:(l)将求最优集成看成是最优化问 题,采用优化算法来获得最优集成,周志华将遗传算法首先在神经网络集成中得到了验证; (2)将求最优集成看成是聚类问题,李凯、黄厚宽等提出了一种基于聚类技术的选择性神经网 络集成算法,通过采用聚类算法将近似的个体聚成一类,以达到去除近似个体的目的。

然而上述选择性集成算法存在如下缺陷:

遗传算法在寻优过程中,对初始种群的选择具有一定的依赖性,初始种群的选择会影响 优化的速度和性能,并且遗传算法的时间复杂度较高;

(2)使用聚类方法,聚类中心的随机选取、聚类簇数的确定等对聚类结果都有一定的影响, 而这也会间接影响到集成的泛化性能和集成学习的稳定性。

发明内容

本发明为克服现有技术存在的不足之处,提出一种基于萤火虫算法的选择性集成学习方 法,以期能使用离散型萤火虫算法对集成中的个体分类器的权重进行优化,克服传统的连续 型权重的选择性集成中权重阈值的选择问题,减少个体分类器的个数,降低集成规模,从而 提高集成的泛化性能,降低时间复杂度。

为解决上述技术问题,本发明所采用的技术方案是:

本发明一种基于萤火虫算法的选择性集成学习方法的特点是将萤火虫算法应用于支持向 量机的选择性集成学习中,并按如下步骤进行:

步骤1、将样本划分为训练集、验证集和测试集;并在所述训练集上利用bootstrap抽样 方法和支持向量机进行训练,获得D个个体分类器;

步骤2、在所述验证集上利用萤火虫算法对所述D个个体分类器进行选择性集成学习, 获得优选的个体分类器;

步骤3、利用所述测试集对所述优选的个体分类器进行测试,获得分类准确率。

本发明所述的基于萤火虫算法的选择性集成学习方法的特点也在于:

所述步骤2是按如下过程进行:

基本参数定义:

假设一个萤火虫群中有n个萤火虫,第i个萤火虫个体记为xi,i=1,…,n,并有 xi=[xi1,xi2,…,xik,…,xiD],xik代表第i个萤火虫xi赋予第k个个体分类器的权值,xik∈[0,1], k=1,2,…,D,若权值xik=1表示第i个萤火虫xi选择第k个个体分类器,权值xik=0表示第i个 萤火虫xi不选择第k个个体分类器;

定义所述n个萤火虫中第i个萤火虫的荧光素挥发因子为ρ、荧光素更新率为γ、动态决策域更新率为β、邻域集内包含的萤火虫数目的阈值为T、感知半径为θ、初始荧光素值为li(0)、初始动态决策域半径为初始位置为xi(0)={xi1(0),xi2(0),…,xik(0),…,xiD(0)};

定义迭代次数为t;最大迭代次数为iter_max;

步骤1、初始化:

初始化萤火虫数目n、荧光素挥发因子ρ、荧光素更新率γ、动态决策域更新率β、感 知半径θ、邻域集内包含的萤火虫数目的阈值为T、最大迭代次数iter_max;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510953417.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top