[发明专利]一种基于多分类器集成的半监督识别方法在审
| 申请号: | 202010458674.1 | 申请日: | 2020-05-26 |
| 公开(公告)号: | CN111695610A | 公开(公告)日: | 2020-09-22 |
| 发明(设计)人: | 黄杰;许顺轶 | 申请(专利权)人: | 东南大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 许小莉 |
| 地址: | 210096 *** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 分类 集成 监督 识别 方法 | ||
1.一种基于多分类器集成的半监督识别方法,其特征在于,包括以下步骤:
(1)初始化样本集,将样本集中的样本分为有标记样本和未标记样本;
(2)利用有标记样本集训练基分类器;
(3)分类未标记样本,计算对应置信值CZ,用基分类器的分类准确率更新权重参数进入循环;
(4)判断未标记样本置信值CZ与阈值λ关系,为未标记样本打标;
(5)判断是否达到迭代终止条件,如果未达到,返回步骤(3),如果已经达到,进入步骤(6);
(6)完成分类,未标记样本获得类别标记。
2.根据权利要求1所述的一种基于多分类器集成的半监督识别方法,其特征在于,所述步骤(1)具体包括以下步骤:
(11)将样本集V={V1,V2,...,vm}中的设备标记规范化,保证同一类别的标记相同,vi(1≤i≤m)为n维特征向量;
(12)将有标记样本标记转化为1~k的数字,其中k为有标记样本类别数,将无标记样本类别标号指定为-999;
(13)初始化三个基分类器权重参数x1=x2=x3=1,和三个基分类器的置信度C1=C2=C3=0,给定置信度阈值λ。
3.根据权利要求1所述的一种基于多分类器集成的半监督识别方法,其特征在于,步骤(2)中所述的利用有标记样本集训练基分类器是指:选定逻辑回归、支持向量机和决策树三种算法,对有标记样本集进行训练生成基分类器。
4.根据权利要求1所述的一种基于多分类器集成的半监督识别方法,其特征在于,所述步骤(3)具体包括以下步骤:
(31)用三个基分类器对未标记样本Vj分类;
(32)得到预测的设备类别及各个基分类器的置信度C1、C2、C3,用基分类器的分类准确率更新权重参数x1、x2、x3;
(33)计算该未标记样本的置信值CZ(Vj),相应公式为:
CZ(vj)=x1C1+x2C2+x3C3
5.根据权利要求1所述的一种基于多分类器集成的半监督识别方法,其特征在于,所述步骤(4)具体包括以下步骤:
(41)将各个未标记样本的置信值CZ(vj)与置信度阈值λ比较,若其小于λ,不进行任何处理,若其大于λ,将未标记数据给定标签,归入有标记数据集中S=S∪{vj},同时在未标记数据集中去除该项U=U-{vj};
(42)判断新加入有标记数据集中的数据量是否达到规定值,若达到规定值,进行样本及特征抽取,重新训练三个基分类器,并用准确率更新x1、x2、x3,否则直接进入下一步。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010458674.1/1.html,转载请声明来源钻瓜专利网。





