[发明专利]基于标签相关性的多标签AdaBoost集成方法在审

专利信息
申请号: 201510740949.X 申请日: 2015-11-04
公开(公告)号: CN105320967A 公开(公告)日: 2016-02-10
发明(设计)人: 王莉莉;付忠良;姚宇;纪祥虎;张丹普 申请(专利权)人: 中科院成都信息技术股份有限公司
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 成都九鼎天元知识产权代理有限公司 51214 代理人: 邓世燕
地址: 610041 四川省成都市高新*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于标签相关性的多标签AdaBoost集成方法,采用一种基于样本权重的stump决策树方法作为弱分类器,弱分类器的输出为样本标签的置信度,置信度大小紧密依赖于样本权重,构造方法简单、高效;本发明针对多分类问题,根据分类结果来判断标签之间的相似性,并融合到多标签AdaBoost算法的迭代训练中,将标签相关性分析融入到分类模型的训练中,相互促进、相互影响,最终提升强分类器性能;针对多标签分类问题,采用余弦相似度来计算标签相关性矩阵,把原始标签转换为模糊标签,并把模糊标签矩阵与分类器模型训练相结合。本发明方法易于实现,可提高多标签分类系统的效率,具有更好的分类效果。
搜索关键词: 基于 标签 相关性 adaboost 集成 方法
【主权项】:
一种基于标签相关性的多标签AdaBoost集成方法,其特征在于:包括如下步骤:步骤一、获取训练样本集X={(x1,Y1),...,(xm,Ym)},xi=(xi1,…xid)∈Rd,表示样本空间有d个属性,Yi是样本xi的标签集,如果l∈Yi,则Y(i,l)=1,否则Y(i,l)=‑1;步骤二、判断问题类型,若是多分类问题,则进入步骤四;若是多标签分类问题,则进入步骤三;步骤三、采用余弦相似度来计算标签相关矩阵R和模糊标签矩阵步骤四、初始化样本权重:w(i,l)=1/(mK),其中:m为样本个数,K为类别个数;步骤五、基于样本权重wt(i,l)训练第t个弱分类器ht,t=1,2,…T,T为待集成的弱分类器个数;步骤六、判断问题类型,若是多分类问题,则进入步骤七;若是多标签分类问题,则进入步骤九;步骤七、根据临时强分类器ft对样本集X的分类结果计算标签相似矩阵St:步骤八、对权值调整因子βt赋值如下:如果ht(xi)=l且St(yi,l)=1,则令βt(i,l)=c2,否则βt(i,l)=c1;然后进入步骤十;步骤九、对权值调整因子βt赋值如下:如果且ht(xi,l)>0则令βt(i,l)=c2,否则βt(i,l)=c1;然后进入步骤十;步骤十、计算第t个弱分类器的权重αtut(xi)=Yi(l)ht(xi,l)βt(i,l);步骤十一、更新权重并归一化:wt+1(i,l)=wt(i,l)exp(‑αtYi(l)ht(xi,l)βt(i,l));步骤十二、判断t是否小于迭代次数T:如果是,返回步骤五;如果否,进入步骤十三;步骤十三、输出强分类器H(x):对于多分类问题,则输出对于多标签分类问题,则输出
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科院成都信息技术股份有限公司,未经中科院成都信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201510740949.X/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top