[发明专利]一种带语义引导的多尺度目标检测方法及系统有效
申请号: | 202110447853.X | 申请日: | 2021-04-25 |
公开(公告)号: | CN113076926B | 公开(公告)日: | 2022-11-18 |
发明(设计)人: | 许宏韬;康文雄;邓飞其 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/774;G06V10/80;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍;江裕强 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语义 引导 尺度 目标 检测 方法 系统 | ||
本发明提供的一种带语义引导的多尺度目标检测方法,包括:构建多尺度目标检测模型,多尺度检测模型包括主干网络、特征金字塔、检测头和语义引导分支;数据预处理;进行前向计算,得到多尺度目标检测模型的输出;将输出与真实目标进行损失函数的计算;使用反向传播算法计算所有可训练参数的梯度;使用梯度下降法更新模型的可训练参数,重复以上步骤,达到预设的次数结束训练,保存训练完成的模型;将待检测的图片输入训练好的模型,得到各分支的输出;对得到的各输出进行后处理,得到最终的检测结果。特征融合模块的检测头中设置两个特征选择模块,分别去学习当前层特征和下一层特征,从而减缓了不同尺度信息的梯度不一致性导致对训练时的干扰。
技术领域
本发明属于目标检测领域,特别涉及一种带语义引导的多尺度目标检测方法及系统。
背景技术
深度学习、CNN(卷积神经网络)使得当前图像识别、目标检测领域得到快速发展。本发明涉及目标检测领域,人脸检测为目标检测领域的一个分支,可看作单类别的目标检测。所谓检测指的是输入一张图片,经过算法模型得到物体的目标框坐标,如图1所示。
多尺度检测是目标检测领域的重要研究点,意为检测输入图片中不同尺度(大小、比例等)的目标都需要被检测。为了提高多尺度检测的准确性,学界提出了一系列特征融合的算法去融合不同尺度的信息,如FPN、PANet、HrNet等等。其中FPN几乎成为多尺度目标检测算法的标配,结构如图3所示。一般认为,网络越深层的特征所包含的语义信息越多,因此这些做法希望将深层和浅层的特征融合达到强化特征的目的。卷积神经网络是一种多层堆叠的结构,这里的不同尺度特征指的是网络不同层的特征。
因为不同尺度大小的目标所需要的信息是不同的,所以多尺度检测一般会将不同尺度范围的目标分配到不同的特征层上检测,即类似SSD(Single Shot Detector)算法,如图2所示。可以看出图2和图3的区别在于图3对相邻层的特征进行了融合操作,图2直接在不同层上检测,图3则是在相邻层特征融合后的特征上检测。不同层特征融合的方式可以有多种,图3中的FPN进行了相加操作,还有其他如YOLOv3、DSSD中的按通道拼接(concatenate)操作。
计算机视觉中的注意力机制,常见的有通道注意力如SENet、空间注意力如ASFF或二者结合如CBMA。简单来说就是生成一个通道维度或者空间维度上的soft mask(软掩码)对特征进行加权,抑制不重要特征、强化重要特征,从而减少特征冗余。ASFF使用密集连接的注意力机制去选择不同尺度的特征融合,如图4所示,可以看出其是在FPN基础上加入多个ASFF模块来强化特征,可以解决不同尺度梯度不一致的问题。
但是以上方法仍存在以下问题:(1)FPN类的特征融合方法简单来说就是融合相邻两个尺度的特征信息,但融合时上一层使用的是上一个阶段融合后的特征,如图5,这同样存在不同尺度梯度不一致的问题,不利于网络的训练。(2)仅对不同尺度的特征进行相加或拼接操作,缺乏对特征学习的引导,最终可能会因为数据集尺度的不均衡导致特征学习的不均衡。
发明内容
本发明解决基于卷积神经网络的多尺度人脸检测模型特征融合问题,并可利用其副产品来优化推断结果。多尺度特征融合可以强化网络对特征的学习,提高准确率,当前主流的特征融合方法为FPN(特征金字塔),但此类方法在训练时缺乏对特征学习的引导,本发明在模型中添加语义监督信息来指导网络深层特征与浅层特征的融合。
为了实现本发明目的,本发明提供的一种带语义引导的多尺度目标检测方法,包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110447853.X/2.html,转载请声明来源钻瓜专利网。