[发明专利]一种基于多任务与感兴趣区域分割引导的目标检测方法有效
申请号: | 202011032728.4 | 申请日: | 2020-09-27 |
公开(公告)号: | CN112132816B | 公开(公告)日: | 2022-12-30 |
发明(设计)人: | 刘峡壁;刘伟华;李慧玉 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06V10/25;G06V10/26;G06V10/52;G06V10/82;G06N3/04 |
代理公司: | 北京正阳理工知识产权代理事务所(普通合伙) 11639 | 代理人: | 张利萍 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 任务 感兴趣 区域 分割 引导 目标 检测 方法 | ||
本发明涉及一种基于多任务与感兴趣区域分割引导的目标检测方法,属于计算机视觉及目标检测技术领域。本方法基于全新设计的多任务与感兴趣区域分割引导检测的单一卷积神经网络模型,命名为SDNet,SDNet融合了多任务学习,利用感兴趣区域分割引导检测,设计了基于金字塔式的空洞卷积结构,利于前景目标区域的分割,运用中心点分类和尺度回归进行目标检测,能够有效提高目标检测精度和检测准确率。本方法能够在各种实际应用场景下获得快速、高精度、高可靠的目标检测效果,解决目标中误检率较高的问题,同时保证了召回率。
技术领域
本发明涉及一种目标检测方法,尤其涉及一种基于多任务与感兴趣区域分割引导的目标检测方法,属于计算机视觉及目标检测技术领域。
背景技术
目标检测,是指在图像中找出所有感兴趣目标的具体位置和大小等定位信息,是计算机视觉、模式识别等领域中的基础问题之一,在汽车自动驾驶、视频监控及分析、人脸识别及其医学CT图像的结节或肿瘤检测等应用中得到广泛使用。
现有的目标检测方法主要分为两类。
一类是传统目标检测方法。传统目标检测一般采用滑动窗口的框架,主要包括图像空间分割、特征设计和提取、分类识别等步骤,它需要在尺度和位置等几个维度空间内进行搜索,待处理的窗口数量巨大,使得计算量过大,且手工设计的特征对多样性目标的鲁棒性不强,很难设计出高效的特征,检测精度较低。
传统目标检测方法尽管实施简单,但由于图像中的目标往往在姿态、尺度、灰度空间等方面呈现多样性,检测精度往往达不到实际应用的要求。
另一类是基于卷积神经网络的目标检测方法,包括:两阶段方法,其中包括第一阶段的候选区域提取,第二阶段对区域进行卷积特征提取和分类,比如R-CNN,Faster R-CNN等。端到端的检测方法,如Yolo,SSD等,这类方法只需要一个卷积神经网络,直接输出所有的检测结果。但是,已有的基于卷积神经网络的目标检测方法由于采用了复杂的神经网络结构,尽管检测精度优于传统方法,即便是单阶段的端对端的单网络结构,其误检难以控制。两阶段的网络,尽管其误检率降低,但其流程更加复杂,这使得在具体目标的检测上,其召回率和准确率不能达到良好的效果。
发明内容
本发明的目的是针对现有目标检测方法存在可靠性低、误检率高的技术缺陷,为了更加有效地实现目标检测,创造性的提出一种基于多任务与感兴趣区域分割引导的目标检测方法。本方法基于全新设计的多任务与感兴趣区域分割引导检测的单一卷积神经网络模型,命名为SDNet,SDNet融合了多任务学习,利用感兴趣区域分割引导检测,能够有效提高目标检测精度和检测准确率。
本方法创新点在于:第一,采用感兴趣分割引导检测;第二,设计基于金字塔式的空洞卷积结构,利于前景目标区域的分割;第三,设计的新的检测方式,运用中心点分类和尺度回归进行目标检测。
本发明方法,采用以下技术方案实现。
一种基于多任务与感兴趣区域分割引导的目标检测方法,包括以下步骤:
步骤1:建立基于同时进行感兴趣区域分割和目标检测的、并利用感兴趣区域分割指导目标检测的卷积神经网络模型SDNet。
其中,SDNet包括特征提取模块、分割模块和检测模块。
所述特征提取模块采用U-Net进行特征提取,包括特征压缩模块和特征放大模块。
分割模块,设计了金字塔的空洞卷积结构,用于表达大的目标分割区域。特征首先由金字塔式的空洞卷积组成的操作进行处理,使得此路径能获得更大的视野域能表示前景区域,同时可以降低空洞卷积的棋格问题;对分割结果,通过相乘操作把其作用到特征模块的输出上,强化感兴趣的目标特征区域,并引导检测模块。
检测模块,包括并行的中心点预测和尺度预测两个路径,其输入是融合了分割结果的特征图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011032728.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种利用豆渣制作面点的方法
- 下一篇:一种可调式液晶模组的散热机构