[发明专利]一种用于目标检测器模型训练过程中的免除采样方法在审
申请号: | 202010070199.0 | 申请日: | 2020-01-21 |
公开(公告)号: | CN111291796A | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 徐童;陈卓;刘东;陈恩红;吴世伟 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 邓治平 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 目标 检测器 模型 训练 过程 中的 免除 采样 方法 | ||
本发明提出一种用于目标检测器模型训练过程中的免除采样方法,包括如下步骤:步骤1:最优偏差初始化,有偏地初始化检测器模型网络输出预测张量的卷积层的偏置,使得检测器的分类损失被在训练开始阶段被初始化为极小值点;步骤2:设计目标检测器训练的指导性损失函数,使用目标检测中的边框回归损失指导确定分类损失缩放的比例,通过比例计算使得分类损失与边框回归损失在数值上时刻相等;步骤3:设置目标检测器模型训练类别的自适应阈值,计算数据集中统计的类别的数量和所有类别的数量的比值与正负样本数量的比值的乘积,根据某类别的数量和所有类别的数量的比值自适应的确定阈值。
技术领域
本发明涉及深度学习和计算机视觉领域,尤其涉及目标检测模型训练中的采样方法。
背景技术
目标检测中存在多种多样的不平衡,这些不平衡会影响最终的检测精度。最常见的比如类别不平衡,主要由样本数量上的差别引起。最典型的是前景和背景的不平衡,即训练过程中的正例数量远远小于负例数量引起的不平衡。
围绕这个研究问题,在传统解决方案中,消除这种类别不平衡的解决办法通常有三种:1.阈值偏移:降低数量少的类别的阈值。2.启发式采样:对于特定类别采用有偏选择,比如下采样和过采样。启发式的采样通常会改变数据的分布,导致了训练过程和推理过程中存在数据分布不一致的问题。3.用集成学习的方法来获得更鲁棒的模型。其中启发式采样的方法大致分为两类:1.硬采样方法(通常用于二阶段的目标检测),比如欠采样、OHEM和IoU平衡采样;2.软采样方法(通常用于一阶段的目标检测和anchor-free的目标检测器),比如Focal Loss和GHM。这些方法会引入复杂的超参数调整过程。
在现有的目标检测框架中,采样方法被广泛使用,其目的是解决训练中的正负样本的极端不平衡。然而,采样方法将引入繁琐的超参数调节,且将改变原始的数据分布,制约了检测器模型精度的提升。
发明内容
为了解决以上技术问题,本发明提供了一种用于目标检测器模型训练过程中的免除采样方法,通过最优偏置初始化、指导性损失、类别自适应阈值三个策略来代替采样方法,且不引入新的超参数。避免了启发式采样中复杂的超参数调整过程。本发明相比于启发式采样,可以减少超参数的引入,同种检测器采用这种机制,在COCO数据集上的准确度也更高。
本发明的技术方案为:一种用于目标检测器模型训练过程中的免除采样方法,包括如下步骤:
步骤1:最优偏差初始化,有偏地初始化检测器模型网络输出预测张量的卷积层的偏置,使得检测器的分类损失被在训练开始阶段被初始化为极小值点;
步骤2:设计目标检测器训练的指导性损失函数,使用目标检测中的边框回归损失指导确定分类损失缩放的比例,通过比例计算使得分类损失与边框回归损失在数值上时刻相等;
步骤3:设置目标检测器模型训练类别的自适应阈值,计算数据集中统计的类别的数量和所有类别的数量的比值与正负样本数量的比值的乘积,根据某类别的数量和所有类别的数量的比值自适应的确定阈值,进行模型训练。
进一步的,所述步骤1具体包括:
最优偏差初始化具体为:假设数据集中有C类目标种类,N个样本,其中有Nf个前景样本,则在训练开始阶段,使用交叉熵分类损失的损失函数LCE改写成:
其中,公式的前一项-log(π)是前景损失,后一项是背景损失;
公式(1)的导数为:
当时,LCE取得极小值,由σ(b)≈π求得初始化偏置应为:
进一步的,所述步骤2具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010070199.0/2.html,转载请声明来源钻瓜专利网。