[发明专利]多目标检测方法、装置和存储介质在审
| 申请号: | 202011467005.7 | 申请日: | 2020-12-14 |
| 公开(公告)号: | CN112418410A | 公开(公告)日: | 2021-02-26 |
| 发明(设计)人: | 刘凤余;张冲;张平平 | 申请(专利权)人: | 上海卓繁信息技术股份有限公司 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06K9/62;G06K9/46 |
| 代理公司: | 上海容慧专利代理事务所(普通合伙) 31287 | 代理人: | 于晓菁 |
| 地址: | 200030 上海*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 多目标 检测 方法 装置 存储 介质 | ||
本发明提供了一种多目标检测方法,装置及存储介质,通过构建一种改进的YOLO‑V3模型,并建立具有包含关系的多目标数据集以训练模型,相比传统的目标检测方法在检测多个目标时出现的漏检或错检等缺陷,大大提高了检测准确率,同时降低了漏检率,改进后的模型综合空洞卷积层、转置卷积层和可分离卷积层三种网络结构,具有良好的鲁棒性、对于不同类别目标之间存在遮挡关系时也具有良好的检测效果。
技术领域
本发明涉及深度学习技术领域,具体涉及一种多目标检测检测方法、装置和存储介质。
背景技术
在很多目标检测的应用场景中,需要检测的目标是存在从属关系的。比如:有时候我们可能想要检测电脑屏幕是在玩游戏还是在办公;有时候我们想要检测在某一物体上是否存在另外一个物体;比如面包上是火腿还是肉松或者什么都没有;有时候我们可能需要检测车子上是什么logo。随着深度学习近年来的迅猛发展,越来越多的深度学习模型开始广泛应用于计算机视觉的各项技术中。基于卷积神经网络的目标检测方法大幅提高了检测精度与速度;但是现有的YOLO v3模型提取的特征过于单一,导致在多目标检测的场景中无法快速准确进行识别。
发明内容
本发明的目的是提供一种多目标检测方法,装置及存储介质,用以检测场景中相似度较大且具有不同尺度的多个目标。
为了达到上述目的,本发明一方面提供一种多目标检测方法,包括:
建立数据集,所述数据集包括应用场景中不同尺度的检测对象及其标注,所述标注用以确定对象之间的嵌套关系;
模型构建,基于YOLO-V3模型进行修改,将用以特征提取的卷积层与用以对象识别的yolo层之间分别增加空洞卷积层、转置卷积层和可分离卷积层,生成修改后的YOLO-DN模型;
模型训练,定义损失函数,通过K-means聚类方法生成锚框,采用数据集分别训练YOLO-DN模型和YOLO-V3模型;
模型剪枝,在所述空洞卷积层、转置卷积层和可分离卷积层后增加BN层,利用BN层的系数进行通道剪枝和模型压缩;
模型检测,将YOLO-V3模型与YOLO-DN模型的检测结果进行比较,根据比较结果验证YOLO-DN模型的准确度。
进一步的,还包括以下步骤:
建立空洞卷积层,所述空洞卷积层基于不同膨胀率的空洞卷积对多尺度的目标进行检测;
建立转置卷积层,所述转置卷积恢复卷积计算的空间分辨率,对粗粒化图像进行卷积操作;
建立可分离卷积层,所述可分离卷积层通过区域和通道的分离实现卷积操作。
进一步的,在模型构建过程中,所述卷积层的计算公式为:
其中,l表示第l层卷积层,j代表当前卷积层的第j个特征图,示第l-1层卷积层的第j个特征图,表示第1层卷积层第j个特征图的第m个卷积核,Mj表示第j个特征图对应的所有卷积核集合,符号*代表卷积运算,表示第l层卷积第j个特征图的偏置参数,f(x)代表激活函数。
进一步的,所述激活函数包括Leaky-ReLU和ELU,其中Leaky-ReLU的计算公式为:
ELU的计算公式为:
进一步的,所述模型的损失函数为:
其中,损失函数中的第一行和第二行表示边界框的位置损失,第三行第四行表示置信度误差,第五行表示框的分类误差;x,y,w,h分别表示边界框的中心点横轴坐标,纵轴坐标,宽度和高。C表示置信度,P表示分类概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海卓繁信息技术股份有限公司,未经上海卓繁信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011467005.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种便于调节的医疗会诊车
- 下一篇:一种源室辐射监测系统





