[发明专利]基于主动学习和变分自编码器的广义零样本目标分类方法有效
申请号: | 202110459763.2 | 申请日: | 2021-04-27 |
公开(公告)号: | CN113177587B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 李晓;翟之博 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06V10/778;G06N3/0455;G06N3/0464;G06N3/091;G06N3/0895 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 陈宏社;王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 主动 学习 编码器 广义 样本 目标 分类 方法 | ||
本发明提出了一种基于主动学习和变分自编码器的广义零样本目标分类方法,用于解决现有技术中存在的由于未知类监督信息丢失导致的偏置问题和从高维特征到低维空间投影所导致的低维特征聚集问题,有效地提高了分类准确率,实现步骤为:获取训练样本集Psubgt;train/subgt;和测试样本集Psubgt;test/subgt;;构建基于变分自编码器的广义零样本分类模型H;对基于变分自编码器的广义零样本分类模型H中的变分自编码器f和非线性分类器fsubgt;classifier/subgt;进行迭代训练;获取广义零样本的目标分类结果。本发明可以实现对缺乏训练数据的稀有物种分类、生物医学图像识别等领域。
技术领域
本发明属于零样本图像分类技术领域,涉及一种广义零样本目标分类方法,具体涉及一种基于主动学习和变分自编码器的广义零样本目标分类方法,可用于稀有物种分类、生物医学图像识别等领域。
背景技术
目标分类作为人工智能主要的研究方向之一,随着人工智能的蓬勃发展,目标分类已经广泛应用于缺陷检测、无人驾驶、医学诊断等人工智能领城。当前目标分类的研究主要针对图像的分类问题。但随着社交网络和社会标签系统的快速发展,新的标签和概念不断涌现,随之而来的是人们如何使用这些新标签对图像进行标记的问题,即广义零样本目标分类问题。在广义零样本目标分类问题中,已知类样本集和未知类样本集属于不同的目标类别,并且对于未知类样本集中样本没有带标记的训练样本可用,其目的是实现一个从已知类样本或未知类样本到已知类和未知类所属类别的分类。
现有的目标分类学习方法大多是监督学习方法,需要大量标记信息才能进行有效分类,因此不能适用于这种没有标记信息的情况,而无监督的方法虽然可行但却不能充分利用己有的相关领域中的信息,来提高目标领城中的分类准确率。针对上述情况,研究者提出了半监督学习,半监督学习一种是将监督学习和无监督学习相结合的学习方法,主要考虑的是如何利用少量的标注样本和大量的未标注样本进行训练和分类的问题。
现有的广义零样本目标分类方法大多采用的是半监督的方法,通过建立视觉特征和监督信息之间的联系来实现新目标的分类,由于未知类缺失有效的监督信息,导致现有的广义零样本目标分类方法都存在着较强的偏置问题,即在训练阶段,视觉特征通常被投影到由已知类确定的子空间中的几个固定的点,这样就导致了在测试阶段中,测试数据集中的新类图像倾向于被分到已知类当中,除此之外,广义零样本学习的方法通常会把视觉特征空间和语义空间投影到一个公共的子空间,通过拉近视觉特征和对应的语义在子空间中投影点的距离来减小两个空间的结构差异,但这种方式往往使得不同类别样本在子空间出现聚集的问题,即当将高维向量投影到低维空间时,会出现聚集现象,这样的投影减小了样本方差,从而导致投影点聚集成中心点,因而子空间的判别性降低,分类准确率也随之下降。
例如Edgar Schonfeld等人发表的名称为“Generalized Zero-and Few-ShotLearning via Aligned Variational Autoencoders”(Proceedings of the IEEE/CVFConference on Computer Vision and Pattern Recognition.2019:8247-8255)的论文中,提出了一种基于分布对齐和交叉重建对齐的变分自编码器的广义零样本目标分类方法,该方法通过构建两个变分自编码器,分别将视觉特征和语义特征投影至相近的子空间。在分类时,先通过编码器将样本视觉特征投影至子空间,再用分类器对子空间特征进行分类,但该方法中并没有解决由于未知类监督信息缺失带来的偏置问题和从高维特征向低维空间投影所带来的聚集性问题,即子空间并不具有较强的判别性,因而导致该方法的分类准确率较低。
主动学习方法能够使得在模型在训练的过程中主动地采样出“难”分类的样本数据,通过人为地对样本数据添加标注信息,然后将人工标注得到的数据再次使用半监督学习模型进行训练,这种主动采样并添加标注信息的操作可以有效消除广义零样本问题中由于未知类监督信息丢失带来的偏置问题。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110459763.2/2.html,转载请声明来源钻瓜专利网。