[发明专利]基于标签相关性的多标签AdaBoost集成方法在审
| 申请号: | 201510740949.X | 申请日: | 2015-11-04 |
| 公开(公告)号: | CN105320967A | 公开(公告)日: | 2016-02-10 |
| 发明(设计)人: | 王莉莉;付忠良;姚宇;纪祥虎;张丹普 | 申请(专利权)人: | 中科院成都信息技术股份有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 成都九鼎天元知识产权代理有限公司 51214 | 代理人: | 邓世燕 |
| 地址: | 610041 四川省成都市高新*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 标签 相关性 adaboost 集成 方法 | ||
技术领域
本发明涉及一种基于标签相关性的多标签AdaBoost集成方法。
背景技术
相比于二分类问题,多标签分类问题更符合真实世界。在多分类问题中,一个样例只有一个标签,例如数字识别问题。在多标签分类问题中,一个样例可能同时具有多个不同的标签,例如,一副图像可能具有多个语义。
Schapire等人于1999年在文章《Improvedboostingalgorithmsusingconfidence-ratedpredictions》(MachineLearning,1999,37(3):297-336)中引入置信度,并把二分类AdaBoost算法扩展到多标签分类中。蒋云良等人在申请号为CN201510036010.5的专利申请中提出了一种基于ELM的多类AdaBoost集成学习方法,该方法可以直接应用于多分类问题。但这些算法并没有考虑标签之间的相关性问题。范莹等人在申请号为CN201510068195.8的专利申请中提出一种多标签分类方法,把多标签问题转换为单标签问题,通过标签顺序,构造多个分类器链,从而解决多标签分类问题。但这样容易造成误差通过标签顺序进行传递,从而影响多标签分类性能。
现有的多标签分类方法中,大多数方法在利用标签相关性促进分类模型构建时往往分为两步:第一步分析标签之间相关性,第二步再利用标签相关性进行分类建模。如ZhangMinling等人于2010年在文章《Multi-labellearningbyexploitinglabeldependency》(发表时间2010年,InProceedingsofthe16thACMSIGKDDInternationalConferenceonKnowledgeDiscoveryandDataMining.Washington,DC,USA,999–1008.)中提出了一种两阶段算法,该算法先利用贝叶斯神经网络计算标签相关性,然后利用标签相关性来学习多个二元分类器,进而解决多标签分类问题。Deng等人于2014年在文章《Large-scaleobjectclassificationusinglabelrelationgraphs》(ComputerVision–ECCV2014.SpringerInternationalPublishing,2014:48-64.)中提出基于HEX的概率分类模型,采用HEX层次结构来表示标签相关性。然而,这样分割的两个步骤会导致标签相关性信息并无法促进第二步的运行。
发明内容
为了克服现有技术的上述缺点,本发明提供了一种基于标签相关性的多标签AdaBoost集成方法。
本发明解决其技术问题所采用的技术方案是:一种基于标签相关性的多标签AdaBoost集成方法,包括如下步骤:
步骤一、获取训练样本集X={(x1,Y1),...,(xm,Ym)},xi=(xi1,…xid)∈Rd,表示样本空间有d个属性,Yi是样本xi的标签集,如果l∈Yi,则Y(i,l)=1,否则Y(i,l)=-1;
步骤二、判断问题类型,若是多分类问题,则进入步骤四;若是多标签分类问题,则进入步骤三;
步骤三、采用余弦相似度来计算标签相关矩阵R和模糊标签矩阵
步骤四、初始化样本权重:w(i,l)=1(mK),其中:m为样本个数,K为类别个数;
步骤五、基于样本权重wt(i,l)训练第t个弱分类器ht,t=1,2,…T,T为待集成的弱分类器个数;
步骤六、判断问题类型,若是多分类问题,则进入步骤七;若是多标签分类问题,则进入步骤九;
步骤七、根据临时强分类器ft对样本集X的分类结果计算标签相似矩阵St:
步骤八、对βt赋值如下:如果ht(xi)=l且St(yi,l)=1,则令βt(i,l)=c2,否则βt(i,l)=c1;然后进入步骤十;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科院成都信息技术股份有限公司,未经中科院成都信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510740949.X/2.html,转载请声明来源钻瓜专利网。





