[发明专利]一种基于多任务与感兴趣区域分割引导的目标检测方法有效
申请号: | 202011032728.4 | 申请日: | 2020-09-27 |
公开(公告)号: | CN112132816B | 公开(公告)日: | 2022-12-30 |
发明(设计)人: | 刘峡壁;刘伟华;李慧玉 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06V10/25;G06V10/26;G06V10/52;G06V10/82;G06N3/04 |
代理公司: | 北京正阳理工知识产权代理事务所(普通合伙) 11639 | 代理人: | 张利萍 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 任务 感兴趣 区域 分割 引导 目标 检测 方法 | ||
1.一种基于多任务与感兴趣区域分割引导的目标检测方法,其特征在于,包括以下步骤:
步骤1:建立基于同时感兴趣区域分割和目标检测的、并利用分割指导检测的卷积神经网络模型SDNet;其中,SDNet包括特征提取模块、分割模块和检测模块;
所述特征提取模块,包括特征压缩模块和特征放大模块;其中,特征压缩模块包括N个卷积块,沿着一条融合源连接输入的特征压缩路径展开;特征放大模块包括M个反卷积块,沿着一条融合跳跃连接的特征放大路径展开;
从特征压缩路径上的第一个卷积块开始,每一层输出的特征图和相应尺度的源图像拼接构成下一层卷积操作的输入;
从特征放大路径上的第一个反卷积块开始,每一层输出的特征图和来自特征压缩路径的特征图拼接构成下一层反卷积操作的输入,使得特征压缩路径上具有的目标细节信息能够传输到具有高层语义信息的特征放大路径上;
所述分割模块,包括前景分割模块,其由金字塔式的空洞卷积组成,使得特征压缩路径能获得更大的视野域表示前景区域,同时可降低空洞卷积的棋格问题;对分割结果,通过相乘操作把其作用到特征模块的输出上,强化感兴趣的目标特征区域,并后续引导检测模块的学习;
所述检测模块,由并行的中心点预测路径和尺度预测路径组成,其输入是融合了分割结果的特征图;
中心点预测使用多个卷积模块;尺度预测也具有类似结构,即使用多个卷积模块;通过同时预测中心点和尺度,输出目标区域信息;
步骤2:训练阶段;
该阶段采用两阶段迁移学习策略,实现步骤如下:
步骤2.1:数据增强和数据预处理;
基于数据划分、数据增强以及预处理从带标记的原始数据中产生第一阶段训练的训练集、第二阶段训练的训练集和测试集;
其中,数据增强手段包括旋转、缩放和平移操作;
步骤2.2:将步骤2.1获得的用于第一阶段训练的训练集输入二分类网络,采用随机梯度下降算法优化softmax损失函数,得到训练后的二分类网络;此训练后的二分类网络中,包括训练好的特征提取模块;
步骤2.3:基于步骤2.1的数据增强手段对少量检测标注数据进行增强,生成的第二阶段训练所需的训练集进行第二阶段训练,得到训练后的SDNet网络;
其中,第二阶段训练在SDNet网络中进行,且SDNet网络中的特征提取模块来自步骤2.2中训练好的特征提取模块;
步骤3:利用训练好的SDNet网络,进行目标精确检测。
2.如权利要求1所述的一种基于多任务与感兴趣区域分割引导的目标检测方法,其特征在于,在特征提取模块中,特征压缩路径上的每个卷积块包含一次卷积、BN、激活和Pooling操作,对输入图像进行特征提取得到特征图。
3.如权利要求1所述的一种基于多任务与感兴趣区域分割引导的目标检测方法,其特征在于,在特征提取模块中,特征放大路径上的每个卷积块包含一次Unpooling、反卷积、BN和激活操作,对特征压缩路径输出的特征图进行特征放大。
4.如权利要求1所述的一种基于多任务与感兴趣区域分割引导的目标检测方法,其特征在于,步骤2.1包括以下步骤:
步骤2.1.1:将带标记的原始数据划分为带有检测目标的正样本训练集、不带有检测目标的负样本训练集以及测试集;
步骤2.1.2:采用数据增强手段处理正样本训练集,再与正样本训练集一起构成新的正样本训练集;其中,新训练集补充了带有检测目标的正样本训练集;
步骤2.1.3:对步骤2.1.2构成的新的正样本训练集和步骤2.1.1输出的负样本训练集以及测试集中的每一幅图像,进行灰度归一化和去均值的预处理,分别得到正样本训练集和负样本训练集组成的训练集以及测试集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011032728.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种利用豆渣制作面点的方法
- 下一篇:一种可调式液晶模组的散热机构