[发明专利]一种不完备数据集中平衡输入数据类别多目标检测方法有效
| 申请号: | 202011323339.7 | 申请日: | 2020-11-23 |
| 公开(公告)号: | CN112633319B | 公开(公告)日: | 2022-11-22 |
| 发明(设计)人: | 杨静;李少波;吉晓阳;杨观赐;柳庭卿;白强 | 申请(专利权)人: | 贵州大学 |
| 主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 北京翔石知识产权代理事务所(普通合伙) 11816 | 代理人: | 李勇 |
| 地址: | 55002*** | 国省代码: | 贵州;52 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 完备 数据 集中 平衡 输入 类别 多目标 检测 方法 | ||
1.一种不完备数据集中平衡输入数据类别多目标检测方法,包括:
步骤a,对输入的数据进行清洗,对数据命名进行规范,检查图片文件所对应的标签文件是否为空,以确保每张图片中具有类别实体,没有损坏的文件;
步骤b,依次读取数据集中的Xml文件,获得每张图片中的图片类别,并按照不同的类别对图片进行排序;
步骤c,计算训练数据集中Ci个类别的图片数量,包含Bounding Box数量最少的类别(Ci)min和Bounding Box数据量最多的类别(Ci)max以及其它类别中Bounding Box的数量;
步骤d,将Ci个类别中的信息按照{序号,图片名,类别Ci,x,y,w,h}的格式保存在pre_train.txt文件中,x,y表示Bounding Box中心点坐标,w,h表示Bounding Box的宽和高;保存序号是为了让每个Bounding Box都有一个唯一的身份标签;
步骤e,按照类别ID对每类Bounding Box随机打乱次序,根据最少Bounding Box数量类别(Ci)min的数量(Ci)bx_min-1确定每一次训练中每类Bounding Box的数量,且(Ci)bx_min-1>类别数;
步骤f,在pre_train.txt中取出对应数量的图片,并计算图片的数量Pn,保存在train.txt文件中,train.txt文件内容格式为:{图片名,类别Ci,x,y,w,h},将图片的数量Pn赋值给Batch Size,确定Batch Size的大小;
步骤g,采用最多类别(Ci)max的Bounding Box的数量(Ci)bx_max除以64获得lteration的值,即
步骤h,为了平衡Batch Size中输入的每个类别,通过运算将每次lteration中单个类别的数据量进行均衡BNK;
步骤i,当将所有的执行结束,完成一次Epoch。
2.根据权利要求1所述的不完备数据集中平衡输入数据类别多目标检测方法,其特征在于,在一张图片中包括多个不同类别的Bounding Box,对于所有样本寻找一个分类器θ,使得分类损失最小:
其中,Pi,j,k表示第i张图片的第j个候选框属于第k类的概率,τ(.)表示损失函数;当面对二分类问题时,则公式(1)表示为:
公式(1)中存在图片i包括多个不同的类别,且不同类别的bounding box数量不相等,当一次输入给神经网络多张图片时,公式(1)存在类别不平衡问题,将公式(1)的正负样本分开写,表示为:
其中,j+表示正样本平衡的图片,j-表示负样本不平衡的图片。
3.根据权利要求2所述的不完备数据集中平衡输入数据类别多目标检测方法,其特征在于,当公式(1)存在类别不平衡问题时,则将该问题转换为排序问题,公式表示为:
其含义是,对于所有样本对,一个正样本和一个负样本构成一对的损失最小;
对于每幅图像,将公式(4)分解为:
当按照公式(5)来处理输入样本时,产生n+×n-对样本;存在两种情况:当n-<n+时,正样本占主导地位;当n-≥n+时,负样本占主导地位,正样本的贡献会被负样本所占据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州大学,未经贵州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011323339.7/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





