[发明专利]基于图聚类标签传播的集成多分类器融合分类方法和系统有效

专利信息
申请号: 201310502891.6 申请日: 2013-10-23
公开(公告)号: CN103605990A 公开(公告)日: 2014-02-26
发明(设计)人: 毛启容;胡素黎;王丽;詹永照 申请(专利权)人: 江苏大学
主分类号: G06K9/66 分类号: G06K9/66;G06K9/00
代理公司: 江苏致邦律师事务所 32230 代理人: 樊文红
地址: 212013 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 图聚类 标签 传播 集成 分类 融合 方法 系统
【说明书】:

技术领域

发明属于分类领域,特别涉及一种基于图聚类标签传播的集成多分类器融合分类方法和系统。

背景技术

在实际分类情况下,存在待分类样本和训练样本之间具有分布差异的情况。由于待分类样本和训练样本之间存在聚类误差,常用分类器无法克服样本之间差异性以达到对待分类样本的准确分类。

在模式分类中,单一分类器一般是从某一角度对样本的属性进行描述,待分类样本与训练样本之间存在分布差距时,容易出现分类误差。多分类器集成分类方法是指将多个分类器联合起来达到最优分类的方法,如现有技术中主要是由多分类器的预测标签进行融合得到待分类样本的类别标签,待分类样本与训练样本存在分布差距时,分类器得到的预测标签存在误差,导致最终的分类准确率低。再如聚类集成分类方法中,现有技术中根据训练样本的聚类划分分别训练分类器,该类方法的聚类误差容易导致分类误差。为了避免以上研究中的问题,本发明弥补现有聚类集成分类方法中因样本聚类误差而导致分类准确率低的问题,使用待分类样本的聚类信息和基本分类器的预测标签集合进行分类融合以提高分类准确率。

发明内容

本发明使用多种基本分类器和多种聚类划分共同推断样本类别信息。在样本之间存在聚类误差的情况下,可以克服训练样本得到的基本分类器的分类误差,充分利用了样本聚类划分,避免聚类误差影响分类准确率。本发明结合基本分类器和聚类划分的分类方法解决现有集成分类器在样本存在差异时分类准确率低的问题。

本发明提供了一种基于图聚类标签传播的集成多分类器融合分类方法,从而得到样本类别标签的方法,包括以下步骤:

步骤1使用训练样本训练基本分类器,对训练样本和测试样本进行多次聚类,得到多种聚类划分状态;

步骤2根据训练样本和测试样本的聚类划分状态进行标签传播,得到测试样本的聚类类别标签CCI;

步骤3所有聚类划分状态和基本分类器经过步骤1和步骤2处理,得到测试样本的聚类类别信息集合;将聚类类别信息和基本分类器的分类信息共同构成集成分类器的决策矩阵,根据聚类类别信息和基本分类器的分类信息的分类准确率设置分类融合目标方程的参数,以便于限制参数在融合中的限制范围;

步骤4根据分类融合目标方程,将待分类样本的聚类类别信息和基本分类器的预测标签信息使用二分图最大共识法进行融合分类,得到最终的类别标签。

进一步的,上述步骤2,具体包括:对测试样本进行语音信号预处理和特征提取;对训练样本和测试样本进行聚类划分,获得聚类划分状态;使用基本分类器对测试样本进行预分类,得到测试样本的预分类结果;使用基于图的近邻标签传播方法,得到测试样本的聚类类别标签CCI。

进一步的,上述第一方面中的所述使用基于图的近邻标签传播方法,得到测试样本的聚类类别标签CCI,具体包括:

根据聚类划分对测试样本建立近邻关系图G和标签图LG,其中,近邻关系图G为:G(xi,xj)=w(xi,xj),如果xi和xj在同一簇中且互为近邻,w(xi,xj)=(1+dist(xi,xj))-1,其中dist(xi,xj)表示样本xi,xj之间的距离,否则w(xi,xj)=0;标签图LG为:LG(xi)=l,l=label(xi)l∈[0...num];根据待分类样本的近邻样本的类别标签计算类别相似值以推断其聚类类别标签;若无法得到聚类类别标签则此时待分类样本的近邻样本大多数均为无标签的待分类样本,此时利用此待分类样本的最大近邻子集和基本分类器的分类结果计算类别相似值推断其在此聚类情况下的类别信息。

本发明实施例还提供了一种基于图聚类标签传播的集成多分类器融合分类的系统,包括训练模块和分类模块,其中,

训练模块,用于使用训练样本训练基本分类器,对训练样本和测试样本进行多次聚类,得到多种聚类划分状态;以及根据训练样本和测试样本的聚类划分状态进行标签传播,得到测试样本的聚类类别标签CCI;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏大学,未经江苏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310502891.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top