[发明专利]一种长尾目标检测方法与系统有效
| 申请号: | 202010508103.4 | 申请日: | 2020-06-05 |
| 公开(公告)号: | CN111832406B | 公开(公告)日: | 2022-12-06 |
| 发明(设计)人: | 唐胜;李瑜;李锦涛;曹娟;张勇东 | 申请(专利权)人: | 中国科学院计算技术研究所 |
| 主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/26;G06V10/774;G06V10/764 |
| 代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 祁建国 |
| 地址: | 100080 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 长尾 目标 检测 方法 系统 | ||
本发明提出的基于平衡分组Softmax的长尾目标检测方法与系统,该方法在网络结构上,改变网络的最后一个全连接层,对拥有不同训练样本数量的类别进行分组,将背景类别单独分为一组,在每组中都加入其它类别;在训练过程中,按照组内普通类别训练样本数量采样一定数量的其它类别样本进行训练,并在每个组内分别用Softmax函数激活并计算交叉熵损失;在测试过程中,在每个组内分别用Softmax函数激活,去掉组内其它类别,仅保留正常类别得分,用背景组的“其它”类别得分为所有正常类别加权,组成最终得分,用于后处理。该发明提升了在大规模长尾目标数据集上的目标检测以及实例分割性能。
技术领域
本方法属于机器学习和计算机视觉领域,特别涉及面向计算机视觉中大规模长尾目标检测的机器学习问题。
背景技术
目前深度学习,特别是卷积神经网络(Convolutional Neural Network,CNNs),使人工智能和计算机视觉的众多领域取得了巨大的进展。目标检测是计算机视觉领域最基础也是最具挑战的任务之一。而近年来,目标检测领域的巨大进展主要都是由人工建立的大规模目标检测数据集推动,如PASCAL VOC,COCO等,而这些数据集中的每个类别所包含的训练样本数量相对比较平衡。但在现实中,不同类别的目标数量分布是典型的长尾分布,因此,针对这类类别不平衡的目标检测方法是非常重要的,同样也是现在极度缺乏的。最近,一个大规模长尾目标识别数据集LVIS发布,极大促进在更接近真实场景下的目标检测技术研究。
LVIS数据集相较于ILSVRC DET,LVIS的尾部类别具有小样本的特性,即,每个类别仅包含极少数的训练样本,从几个到几百个不等。和平衡分布的目标检测、小样本目标检测相比,极具挑战性和实用性的长尾目标检测还几乎尚未被探索过。重复因子采样方法(Repeat Factor Sampling,简称RFS)为LVIS数据集提供了一个基线,而分类校准方法(Classification Calibration)通过一个新训练的分类分支对尾部类别的得分进行校准,该新分支采用ROI级别的类别平衡采样策略进行训练,从而进一步提升RFS方法。这两种方法都源自于长尾图像分类领域的重采样方法,在每个epoch中需要进行更多次的迭代以达到样本平衡的目的,增加了训练的开销,其中分类校准方法训练过程和测试过程都较为复杂,并且提升非常有限。
虽然专注于长尾目标检测和实例分割的方法极少,但是有很多工作研究长尾图像分类问题。这些方法大概可以分为以下三类:数据重采样方法、损失敏感学习方法、其它方法。对于数据重采样方法,通常,训练样本会被过采样(over-sampled,多次采样尾部类别训练样本)、或欠采样(under-sampled,减少头部类别采样样本)、或类别平衡采样(class-balanced sampled)。对于损失敏感学习方法,网络的损失会在类别级别会被进行重加权,强制加大尾部类别训练样本对网络权重的影响,或是在样本级别对不同的训练样本进行更加精细的权重控制。有一些其它着重优化用长尾数据训练处的网络的分类器部分,例如最近类别均值分类器(Nearest Class Mean classifier,NCM)和t-归一化分类器(t-normalized classifier)。这些方法通常都对超参很敏感,并且由于目标检测任务和图像分类任务的本质区别,迁移到目标检测框架上后并不能取得较好性能。
发明内容
针对现有技术的不足,本发明提出一种专门针对长尾目标检测设计的方法,该方法不采用尾部类别过采样的方式来解决分类器在权重数量级上不平衡的方法,通过对类别进行分组训练的方式,大幅度提升长尾目标检测性能。
具体来说,本发明提供了一种长尾目标检测方法,其中包括:
步骤1、获取由已标记目标类别的图片,并将图片中目标类别以外的区域标记为背景类别,集合所有图片构成训练样本,通过Softmax训练目标检测模型,得到初步检测模型,按照训练集中每个类别包含的目标样本数量,对该初步检测模型最后一个全连接层的节点进行分组,得到多个节点组;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010508103.4/2.html,转载请声明来源钻瓜专利网。





