[发明专利]一种基于特征金字塔的小频标检测方法有效
| 申请号: | 201911151756.5 | 申请日: | 2019-11-22 |
| 公开(公告)号: | CN110956108B | 公开(公告)日: | 2023-04-18 |
| 发明(设计)人: | 刘桂雄;蒋晨杰 | 申请(专利权)人: | 华南理工大学 |
| 主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/774;G06V10/82;G06N3/0464 |
| 代理公司: | 北京天奇智新知识产权代理有限公司 11340 | 代理人: | 陈新胜 |
| 地址: | 510640 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 特征 金字塔 小频标 检测 方法 | ||
1.一种基于特征金字塔的小频标检测方法,其特征在于,所述方法包括:
A为所有用于检测的视频添加频标,并从每个视频中每隔n帧提取一张图像制作构成数据集;
B选择ResNeXt作为骨干网络提取浅层特征、设计深层特征提取网络结构、结合anchor机制,来构建检测频标的目标检测网络,利用FPN将深层语义信息向低层传递以检测小目标;
C设计损失函数,多次调整超参数并训练得到对应模型,从多次训练模型中选择最佳的目标检测模型;
D部署目标检测网络,检测出对应目标,根据所检测目标设计频标识别与校验方法;
所述步骤A中,频标由序列号和校验号构成,序列号与校验号中各元素均为0~9的数字,其中序列号为视频帧在整个视频中的序号,用于视频帧的定位,校验号为序列号各位数字相加结果的个位数,是频标的最后一位数字,剩余数字为序列号;在视频中添加的频标为黑色、背景为白色、不同视频中大小不同;
对于用于检测的视频,每隔n帧提取一张图像,并对图像中需检测目标做标注,所有标注类别包括0~9的数字,其目标框的Ground Truth为目标的中心坐标(x,y)及目标框的宽度为w和高度为h;
所述步骤D中,将检测出的目标按中心横坐标从小到大排列,最后一个为校验号,前面为序列号,如果序列号各位数字相加结果的个位数等于校验号,则校验通过,检测成功;否则校验不通过,检测失败。
2.如权利要求1所述的基于特征金字塔的小频标检测方法,其特征在于,所述步骤B中,选择ResNeXt作为骨干网络、后续深层特征提取由m个单元组成,每个单元包含:Ci,1个尺寸为1×1×Ci-1,2、步长为1的卷积核;Ci,2个尺寸为3×3×Ci,1、步长为2的卷积核,其中Ci,1、Ci,2分别表示第i个单元的1×1卷积层与3×3卷积层输出通道数、C02为ResNeXt输出通道数,并记ResNeXt输出特征图为F0、后续单元输出特征图为Fi。
3.如权利要求1所述的基于特征金字塔的小频标检测方法,其特征在于,所述步骤B中,i从m至0,使用特征金字塔FPN生成新的特征图F′i,并选择其中部分特征图构成集合F,在F中的特征图上使用anchor机制,并用全卷积网络代替全连接得到分类与目标框回归候选结果,对于候选结果使用非极大值抑制得到目标检测结果。
4.如权利要求1所述的基于特征金字塔的小频标检测方法,其特征在于,所述步骤C中,损失函数分为分类损失函数和目标框回归损失函数,分类损失函数为交叉熵损失函数、目标框回归损失函数为(x,y,w,h)各自对应的SmoothL1损失函数。
5.如权利要求1所述的基于特征金字塔的小频标检测方法,其特征在于,所述步骤C中,需要设置或多次调整的超参数包括:权重初始值、学习率、学习率衰减量、批大小、单元数m、卷积层输出通道数Ci,1与Ci,2、集合F等,所选用的模型性能评价指标为mAP和IOU。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911151756.5/1.html,转载请声明来源钻瓜专利网。





