[发明专利]密集多尺度目标检测系统及方法有效
申请号: | 202011545672.2 | 申请日: | 2020-12-24 |
公开(公告)号: | CN112529098B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 陈曦;李志强;韩震;蒋捷;王超杰;王斐 | 申请(专利权)人: | 上海华浩原益生物科技有限公司 |
主分类号: | G06V10/82 | 分类号: | G06V10/82;G06N3/0464;G06V10/52;G06V10/80 |
代理公司: | 上海九泽律师事务所 31337 | 代理人: | 李明洁 |
地址: | 200090 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 密集 尺度 目标 检测 系统 方法 | ||
密集多尺度目标检测系统及方法,包括目标特征提取子网络,其对处理后的图像进行多层级卷积处理并合并成特征图输出;目标特征多感受野重复融合子网络,其对输入的特征图通过不同感受野的空洞卷积并行同步卷积后再合并输出,以扩充特征图中提取目标特征的感受野数量及尺度,通过反复多次的上述操作重复融合叠加感受野,使不同尺度的目标都能被尺度相匹配的感受野提取目标特征,最后输出多感受野重复融合特征。本系统及方法在相对较小的计算成本下,能够根据不同目标的尺度大小及尺度跨度灵活提供合适密度分布、合适尺度的感受野来完全覆盖并适配不同大小的目标,捕获类别之间上下文关系的语义信息,检测精度更高,并且解决了网格化伪影的问题。
技术领域
本发明涉及多尺度目标检测领域,尤其一种基于空洞卷积的密集多尺度目标检测系统及方法。
背景技术
目标检测是计算机视觉中一项具有挑战性的任务,它要求算法为图像中每个实例预测一个带有类别标签的边框。在过去几年中,此类任务已成为最热门的领域之一。现有方法中,尤其是那些基于卷积神经网络的方法,如Faster R-CNN:Towards Real-Time ObjectDetection with Region Proposal Networks(Faster R-CNN),Single Shot MultiBoxDetector(SSD)和YOLOv3:An Incremental Improvement(YOLOv3)等在目标检测的任务上取得了巨大的成功。
然而,在处理多尺度且尺度跨度大的多目标检测上仍然是一个挑战。大目标可能会超出卷积神经网络的感受野,从而导致无法完整的检测目标边界;小目标可能会在较大的感受野中被忽略,从而导致无法检测出目标的存在。
近年来,已经提出了许多方法来捕获多尺度特征。一种直接的方法是并行采用具有各种大小的多个卷积核。例如,Pyramid Scene Parsing Network(PSPNet)利用并行的4个不同感受野的空间池化层聚合多尺度上下文信息。但是,由于计算复杂度的限制,PSPNet不能增加更多的感受野,通过有限的4个感受野尺度用于提取高级特征的效果仍然非常有限,可能无法同时满足为多尺度且尺度跨度大的多个目标准确地分配感受野。SSD为了解决目标多尺度问题,直接融合了不同尺度特征,以此来解决多尺度问题。随后,FeaturePyramid Networks for Object Detection(FPN)结构被提出来,它实现了一种自顶向下、带有侧向连接的层次结构来构建各个尺度的高层语义特征。但在复杂场景下,FPN可能还不足以完全覆盖所有目标检测对象的尺度。
另一种方法是利用空洞卷积方法,该方法使用膨胀率对输入进行采样并控制插入卷积核中零的数目以扩感受野。空洞卷积可以任意更改感受野的大小,并捕获更多高级语义信息,而不会增加参数和计算成本。因此,Atrous Spatial Pyramid Pooling(ASPP)采用并行或级联的4种具有不同速率的空洞卷积来产生多个感受野大小,以捕获多尺度语义信息。随后,Receptive Field Block Net for Accurate and Fast Object Detection(RFBNet)提出在Inception的基础上加入了空洞卷积,从而有效的增大了感受野。然而,这种方式对于多尺度目标密集的场景还是无法满足需求。因此,DenseASPP for SemanticSegmentation in Street Scenes(DenseASPP)被提出来,以通过5种膨胀率的空洞卷积堆叠产生更加密集尺度的感受野来缓解这些问题。然而,DenseASPP在某些密集多尺度的复杂场景下还是无法满足需求。
综上,在场景较为复杂,尺度多且尺度之间跨度大的多目标检测上,目前的目标检测系统尚不能较好满足检测精度的要求。
发明内容
本发明所要解决的技术问题在于提供一种密集多尺度目标检测系统及方法,能够根据不同检测场景、不同目标的尺度大小及尺度跨度灵活提供合适的感受野尺寸匹配多个不同尺度的目标对象,有效提高目标检测精度。
本发明是通过以下技术方案实现的:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海华浩原益生物科技有限公司,未经上海华浩原益生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011545672.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种变功率制氢的纯化系统及其控制方法
- 下一篇:数据管理方法、装置及终端