[发明专利]一种基于多分类器集成的半监督识别方法在审

专利信息
申请号: 202010458674.1 申请日: 2020-05-26
公开(公告)号: CN111695610A 公开(公告)日: 2020-09-22
发明(设计)人: 黄杰;许顺轶 申请(专利权)人: 东南大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 南京众联专利代理有限公司 32206 代理人: 许小莉
地址: 210096 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 分类 集成 监督 识别 方法
【权利要求书】:

1.一种基于多分类器集成的半监督识别方法,其特征在于,包括以下步骤:

(1)初始化样本集,将样本集中的样本分为有标记样本和未标记样本;

(2)利用有标记样本集训练基分类器;

(3)分类未标记样本,计算对应置信值CZ,用基分类器的分类准确率更新权重参数进入循环;

(4)判断未标记样本置信值CZ与阈值λ关系,为未标记样本打标;

(5)判断是否达到迭代终止条件,如果未达到,返回步骤(3),如果已经达到,进入步骤(6);

(6)完成分类,未标记样本获得类别标记。

2.根据权利要求1所述的一种基于多分类器集成的半监督识别方法,其特征在于,所述步骤(1)具体包括以下步骤:

(11)将样本集V={V1,V2,...,vm}中的设备标记规范化,保证同一类别的标记相同,vi(1≤i≤m)为n维特征向量;

(12)将有标记样本标记转化为1~k的数字,其中k为有标记样本类别数,将无标记样本类别标号指定为-999;

(13)初始化三个基分类器权重参数x1=x2=x3=1,和三个基分类器的置信度C1=C2=C3=0,给定置信度阈值λ。

3.根据权利要求1所述的一种基于多分类器集成的半监督识别方法,其特征在于,步骤(2)中所述的利用有标记样本集训练基分类器是指:选定逻辑回归、支持向量机和决策树三种算法,对有标记样本集进行训练生成基分类器。

4.根据权利要求1所述的一种基于多分类器集成的半监督识别方法,其特征在于,所述步骤(3)具体包括以下步骤:

(31)用三个基分类器对未标记样本Vj分类;

(32)得到预测的设备类别及各个基分类器的置信度C1、C2、C3,用基分类器的分类准确率更新权重参数x1、x2、x3

(33)计算该未标记样本的置信值CZ(Vj),相应公式为:

CZ(vj)=x1C1+x2C2+x3C3

5.根据权利要求1所述的一种基于多分类器集成的半监督识别方法,其特征在于,所述步骤(4)具体包括以下步骤:

(41)将各个未标记样本的置信值CZ(vj)与置信度阈值λ比较,若其小于λ,不进行任何处理,若其大于λ,将未标记数据给定标签,归入有标记数据集中S=S∪{vj},同时在未标记数据集中去除该项U=U-{vj};

(42)判断新加入有标记数据集中的数据量是否达到规定值,若达到规定值,进行样本及特征抽取,重新训练三个基分类器,并用准确率更新x1、x2、x3,否则直接进入下一步。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010458674.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top