[发明专利]一种基于编码和解码结构的双通道输出轮廓检测方法有效
| 申请号: | 202010553252.2 | 申请日: | 2020-06-17 |
| 公开(公告)号: | CN111680706B | 公开(公告)日: | 2023-06-23 |
| 发明(设计)人: | 陈利;王晓东;蔡欣展;刘艳艳 | 申请(专利权)人: | 南开大学 |
| 主分类号: | G06V10/46 | 分类号: | G06V10/46;G06V10/80;G06V10/82;G06N3/0464;G06N3/0455;G06N3/084 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 300071*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 编码 解码 结构 双通道 输出 轮廓 检测 方法 | ||
本发明提出一种基于编码和解码结构的双通道输出轮廓检测方法。编码阶段通过改进后的VGG16网络提取图像特征信息,解码阶段自底向上融合不同尺度特征信息,并使用同一标签对两个通道的输出轮廓图进行深度监督。本发明通过自底向上逐层解码的方式融合不同尺度特征图,提取的图像特征信息更加丰富;在特征融合阶段加入通道注意力结构,并且使用子像素卷积进行特征图采样;设计了合适的损失函数以解决训练样本不平衡的难点;使用数据增强的方法对数据集进行了扩增,增加了模型的泛化能力。本发明能够有效地提取BSDS500公共数据集和自定义木雕轮廓检测数据集图像的目标轮廓且检测轮廓线比较精细。
技术领域
本发明属于图像处理与计算机视觉领域,涉及一种基于编码和解码结构的双通道输出轮廓检测方法,本质上就是利用卷积神经网络对图像像素点进行二分类的问题。
背景技术
轮廓检测是计算机视觉领域中的核心任务,通过数字图像丰富的特征信息提取图像中目标轮廓,是目标检测、语义分割、缺陷识别等高级视觉任务的基础。由于光照、摄影设备精度、目标轮廓复杂程度等方面的原因,精确提取图像目标轮廓仍是一项具有挑战性的任务。
传统的边缘检测算子方法是通过寻找数字图像中亮度明显变化的像素点进行轮廓检测。基于统计学、机器学习的轮廓检测方法将图像像素点邻域的颜色、纹理以及梯度等特征信息融合,再使用支持向量机、随机森林等分类算法对像素点进行分类。上述两种方法都是基于图像局部信息进行特征提取,检测精度较低且很难区分目标轮廓线与背景边缘线。
卷积神经网络是目前人工智能领域的研究热点,通过卷积神经网络实现图像目标轮廓检测本质上就是对图像像素点进行轮廓与非轮廓二分类。构造端到端的卷积神经网络对图像目标轮廓进行监督学习,能够学习到丰富的图像全局特征,相较于传统的边缘检测算子和机器学习方法更适用于轮廓检测任务。现阶段基于卷积神经网络的轮廓检测算法主要存在检测的轮廓线粗糙、定位不准以及训练样本不平衡等难点。
发明内容
针对现阶段基于卷积神经网络的轮廓检测模型的不足,本发明从网络结构和损失函数两方面对现阶段主流的轮廓检测模型进行分析与改进,提出了一种基于编码和解码结构的双通道输出轮廓检测模型,并应用于自定义木雕图案轮廓检测任务。
本发明提出的基于编码和解码结构的双通道输出轮廓检测模型由特征提取阶段和特征解码阶段构成,特征提取阶段是利用卷积神经网络对图像进行特征提取,特征解码阶段是对特征提取阶段输出的小尺度特征图进行逐层二倍上采样运算,并与特征提取阶段同一层级特征图进行特征通道融合,将特征图恢复到原始图像尺度,最后采用相同的标签轮廓图和自定义损失函数对两个通道输出的特征图进行监督训练,将输出的特征图进行像素点的轮廓、非轮廓二分类。
本发明技术方案如下:
一种基于编码和解码结构的双通道输出轮廓检测方法,具体的实现步骤如下:
本发明提出的轮廓检测模型主要由特征提取模块、残差融合单元和特征解码模块构成。
一、特征提取模块:通过三个步长为1、卷积核大小为3的标准卷积提取图像全局特征信息,并使用批量归一化对数据进行规范和LeakRelu激活函数增加模型非线性表达能力,然后使用子像素卷积的反向运算进行下采样运算,降低特征图尺度。
二、残差融合单元:残差融合单元首先将特征提取块中的各层特征图进行特征叠加融合,然后通过一个残差连接与标准卷积运算后的特征图进行特征叠加融合,最后使用逐点卷积运算,降低特征图通道数量。
三、特征解码模块:通过子像素卷积对上一层输出特征图进行上采样运算,并将上采样后的特征图与特征提取阶段同层级的输出特征图进行特征通道融合,然后使用改进的通道注意力结构对融合后的特征图通道进行加权,最后再使用逐点卷积运算降低特征图通道数。
本发明所采用的损失函数融合Focal Loss和Dice Loss两种损失函数,通过实验设置合理的权重,一定程度上解决了正负样本不平衡的问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南开大学,未经南开大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010553252.2/2.html,转载请声明来源钻瓜专利网。





