[发明专利]一种基于粒子群算法的多标签分类方法在审
申请号: | 201510464344.2 | 申请日: | 2015-07-31 |
公开(公告)号: | CN104991974A | 公开(公告)日: | 2015-10-21 |
发明(设计)人: | 梁庆中;樊媛媛;姚宏;颜雪松;胡成玉;曾德泽;刘超 | 申请(专利权)人: | 中国地质大学(武汉) |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京国智京通知识产权代理有限公司 11501 | 代理人: | 张瑜 |
地址: | 430070 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 粒子 算法 标签 分类 方法 | ||
技术领域
本发明属于多标签分类技术领域,具体涉及一种基于粒子群算法的多标签分类方法。
背景技术
多标签分类问题的研究是被文本分类推动的,现代,许多实际应用都是多标签分类问题,比如场景分类、蛋白质功能分析、电影分类和音乐归类。多标签数据集中的样本拥有多个标签,怎样建立和求解这样的最优化问题是要解决的重要问题。算法的实现虽有一定的难度,但其优点是它没有改变数据集的结构,没有破坏类别之间的关联关系,反映了多标签分类的特殊性质。根据建立最优化问题的不同方法,该算法也可以分成多种不同的形式,如:基于Adaboost算法的多标签分类算法、使用决策树方法扩展的多标签分类算法、多标签支持向量机算法、多标签k近邻算法(KNN算法)、多标签最大化熵算法。但是这些算法会由于特征值的冗余或不相关而造成计算误差。
发明内容
本发明目的之一在于为克服现有技术的缺陷,提供了一种精确度高的基于粒子群算法的多标签分类方法。
本发明提供的一种基于粒子群算法的多标签分类方法,包括优化阶段和分类阶段:
S10:优化阶段是采用粒子群算法优化特征加权KNN算法的特征权值,具体包括如下步骤:
S11:采用随机方法初始化粒子群,每个粒子的位置和速度的维度为n,其位置对应数据集中一条记录的特征权值向量w=(w1,w2,···,wn):其中有
S12:计算适应值,进而求出局部最优解和全局最优解:
在计算适应值时,将粒子的位置即特征权值应用到特征加权KNN算法中,将原训练样本集中前70%当做新的训练样本,后30%当做新的预测样本集,对此预测样本集进行分类,算出分类的准确度,准确度越高越符合适应值;
预测样本集每条记录的原始标签为li=(li1,li2,···,lin),分类过后的预测标签为lj=(lj1,lj2,···,ljn),li与lj与重合个数为sum,那么准确率Accruay=sum/n;
S20:分类阶段:
将优化阶段得出的特征权值应用到特征加权KNN算法中给测试样本X进行分类,最终输出测试集中所有样本的标签,即分类完成。
进一步的,所述粒子群算法包括如下步骤:
SA1:初始化微粒群,其中包括初始化整个粒子群的位置xi=(xi1,xi2,···xid)T和速度vi=(vi1,vi2,···,vid)T及局部最优和整体最优,其中id表示第i代中第d个粒子。
SA2:计算每个粒子在当前位置处的适应度值fitnessid=f(xid)。然后根据适应度值的大小,初始化局部最优解pbesti=fitnessi和整体最优解gbest=min(fintess1,fitness2,···,fitnessN),i=1,2,···,N;
SA3:在每次迭代过程中,每个粒子根据以下准则来更新自己的位置和速度
vid(t+1)=wvid(t)+c1r1(pld-xid(t))+c2r2(pgd-xid(t))
xid(t+1)=xid(t)+vid(t+1)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国地质大学(武汉),未经中国地质大学(武汉)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510464344.2/2.html,转载请声明来源钻瓜专利网。