[发明专利]基于标签相关性的多标签AdaBoost集成方法在审
| 申请号: | 201510740949.X | 申请日: | 2015-11-04 |
| 公开(公告)号: | CN105320967A | 公开(公告)日: | 2016-02-10 |
| 发明(设计)人: | 王莉莉;付忠良;姚宇;纪祥虎;张丹普 | 申请(专利权)人: | 中科院成都信息技术股份有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 成都九鼎天元知识产权代理有限公司 51214 | 代理人: | 邓世燕 |
| 地址: | 610041 四川省成都市高新*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种基于标签相关性的多标签AdaBoost集成方法,采用一种基于样本权重的stump决策树方法作为弱分类器,弱分类器的输出为样本标签的置信度,置信度大小紧密依赖于样本权重,构造方法简单、高效;本发明针对多分类问题,根据分类结果来判断标签之间的相似性,并融合到多标签AdaBoost算法的迭代训练中,将标签相关性分析融入到分类模型的训练中,相互促进、相互影响,最终提升强分类器性能;针对多标签分类问题,采用余弦相似度来计算标签相关性矩阵,把原始标签转换为模糊标签,并把模糊标签矩阵与分类器模型训练相结合。本发明方法易于实现,可提高多标签分类系统的效率,具有更好的分类效果。 | ||
| 搜索关键词: | 基于 标签 相关性 adaboost 集成 方法 | ||
【主权项】:
一种基于标签相关性的多标签AdaBoost集成方法,其特征在于:包括如下步骤:步骤一、获取训练样本集X={(x1,Y1),...,(xm,Ym)},xi=(xi1,…xid)∈Rd,表示样本空间有d个属性,Yi是样本xi的标签集,如果l∈Yi,则Y(i,l)=1,否则Y(i,l)=‑1;步骤二、判断问题类型,若是多分类问题,则进入步骤四;若是多标签分类问题,则进入步骤三;步骤三、采用余弦相似度来计算标签相关矩阵R和模糊标签矩阵
步骤四、初始化样本权重:w(i,l)=1/(mK),其中:m为样本个数,K为类别个数;步骤五、基于样本权重wt(i,l)训练第t个弱分类器ht,t=1,2,…T,T为待集成的弱分类器个数;步骤六、判断问题类型,若是多分类问题,则进入步骤七;若是多标签分类问题,则进入步骤九;步骤七、根据临时强分类器ft对样本集X的分类结果计算标签相似矩阵St:步骤八、对权值调整因子βt赋值如下:如果ht(xi)=l且St(yi,l)=1,则令βt(i,l)=c2,否则βt(i,l)=c1;然后进入步骤十;步骤九、对权值调整因子βt赋值如下:如果![]()
且ht(xi,l)>0则令βt(i,l)=c2,否则βt(i,l)=c1;然后进入步骤十;步骤十、计算第t个弱分类器的权重αt:![]()
ut(xi)=Yi(l)ht(xi,l)βt(i,l);步骤十一、更新权重并归一化:wt+1(i,l)=wt(i,l)exp(‑αtYi(l)ht(xi,l)βt(i,l));步骤十二、判断t是否小于迭代次数T:如果是,返回步骤五;如果否,进入步骤十三;步骤十三、输出强分类器H(x):对于多分类问题,则输出
对于多标签分类问题,则输出![]()
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科院成都信息技术股份有限公司,未经中科院成都信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510740949.X/,转载请声明来源钻瓜专利网。





