[发明专利]一种轻量级的文身检测方法在审
| 申请号: | 202110415552.9 | 申请日: | 2021-04-19 | 
| 公开(公告)号: | CN113205103A | 公开(公告)日: | 2021-08-03 | 
| 发明(设计)人: | 卢闰霆;褚真;马文广;马伟;李冰;赵金 | 申请(专利权)人: | 金科智融科技(珠海)有限公司;北京工业大学 | 
| 主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/32;G06N3/04;G06N3/08 | 
| 代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 | 
| 地址: | 519000 广东省珠海*** | 国省代码: | 广东;44 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 轻量级 文身 检测 方法 | ||
1.一种轻量级的文身检测方法,其特征在于,包括以下步骤:
步骤1、数据准备阶段;
训练数据包括两部分,一部分来自公开数据集,另一部分从互联网上爬取并进行手工标注包围框;
步骤2、轻量级文身检测网络构建阶段;
YOLOv5网络构建阶段,包括主干网络设计,Neck设计、head设计;
(1)主干网络:使用的主干网络为CSPDarknet,称作跨阶段局部网络;主干网络使用的模块有:Focus、CBL、CSP;
Focus:网络的输入为三通道的RGB图像,大小为480×480×3;该模块把原始输入图像进行切片,得到240×240×12的特征图,然后使用卷积操作得到240×240×32的特征图;
CBL:YOLOv5的基本模块,其结构为步长为2的3×3卷积、批归一化BN,激活函数Hardswish;Hardswish的公式为:
CSP:该模块输入分为两个分支,第一支包括一个CBL模块,多个残差单元和一个3×3卷积;第二支只有一个3×3卷积;
利用主干网络进行特征提取的具体流程为:
(一)尺度为480×480输入图像经过Focus模块,得到240×240×32的特征图;
(二)经过3组CBL+CSP组合,将特征图的尺度由240×240依次降低为120×120、60×60、30×30;
(三)最后经过一个CBL模块,得到尺度为15×15的特征图,作为SPP的输入;
(2)Neck:该模块的功能是构建特征金字塔,获得多尺度的信息;使用了SPP、FPN+PAN的结构;具体流程为:
A.SPP的输出的尺度为15×15特征的作为特征金字塔的顶层,然后将其上采样,与主干网络提取的30×30的特征图做堆叠融合,作为金字塔中层,然后中层特征分别再经过上采样与主干网络提取的60×60的特征图做堆叠融合,作为金字塔的底层,完成FPN的构建;
B.将FPN底层特征作为PAN的底层,再使用CBL将其依次下采样到30×30、15×15,分别于同尺度的FPN特征进行堆叠融合,从而得到PAN的中层上顶层,完成PAN的构建;
(3)Head:因为YOLOv5是多尺度的单阶段的目标检测方法,使用Head层从PAN特征图中选择三个尺度大小为15×15,30×30,60×60的特征图;首先对这三个特征图分别通过3×3卷积,将通道数统一,用于消除自顶向下部分上采样后的特征图与自底向上部分的同尺寸特征图融合后出现的特征不连续现象,之后分别输入1×1的卷积层做出预测;最终预测的向量分为两类:一是文身图案的包围框中心点坐标和它的长宽,以及置信度;二是该物体的类别,只有一种类别,即文身;
步骤3、定义直方图损失函数;
直方图损失首先使用直方图H将相似的特征点对和不相似的特征点对进行排列组成概率分布,然后对相似特征点对的概率分布做累计密度分布,将相似特征点对的累计密度分布和不相似的特征点对的分布进行相乘,之后再进行积分运算,得到直方图损失;使用正样本对和负样本对的概率分布估计一个随机负样本对的相似性大于一个随机正样本对的相似性的概率:
其中,p+和p-分别表示正样本对和负样本对的概率分布,Φ+(x)是p+(x)的累积密度函数,该公式估计了一个随机负样本对的相似性大于一个随机正样本对的相似性的概率,近似计算为以下离散的形式:
其中,Lh就是使用的直方图损失,对于R维的直方图H-和H+,表示直方图H-上每个元素的值,表示直方图H+上所有元素的累加和;
步骤4、网络训练与测试;
步骤4.1、模型参数初始化;
步骤4.2、整体模型训练;
基于PyTorch深度学习框架在文身数据集上进行端到端训练;训练过程中的优化器为Adam,学习率为0.001,批大小为32,共迭代训练300轮以上;
文身检测的损失函数除了分类损失和包围框回归损失外,额外引入了直方图损失,最终的损失函数如公式(4)所示:
L=λboxLbox+λobjLobj+λclsLcls+λhLh (4)
其中,Lbox是包围框的回归损失,使用GIoU Loss实现;Lcls分类损失和Lobj置信度损失都使用二分类交叉熵计算;最后的Lh是直方图损失;λbox、λobj、λcls、λh是调整各个权重平衡的超参数;其中前三项与原始YOLOv5相同,分别取0.05、1.0和0.5,λh取0.5;
步骤4.3、模型测试;
使用最终的文身模式在测试集上进行量化评估,模型将对每幅输入图像输出预测框的坐标、目标分数、类别分数,定位出文身目标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于金科智融科技(珠海)有限公司;北京工业大学,未经金科智融科技(珠海)有限公司;北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110415552.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种服装面料整烫设备
 - 下一篇:一种大型电缆移动切割装置
 





