[发明专利]一种基于豪斯多夫距离计算距离损失的方法及装置有效
申请号: | 202211243593.5 | 申请日: | 2022-10-12 |
公开(公告)号: | CN115330759B | 公开(公告)日: | 2023-03-10 |
发明(设计)人: | 张晓武;陈斌;李伟;徐朝彬 | 申请(专利权)人: | 浙江霖研精密科技有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06V10/774;G06V10/80;G06V10/82 |
代理公司: | 成都君合集专利代理事务所(普通合伙) 51228 | 代理人: | 张鸣洁 |
地址: | 313000 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 豪斯多夫 距离 计算 损失 方法 装置 | ||
1.一种基于豪斯多夫距离计算距离损失的方法,其特征在于,包括:
步骤S1,构建基于豪斯多夫距离的网络模型,所述网络模型包括从前到后依次连接的基于通道注意力模块的ShuffleNetV2网络、RepBlockv2模块和基于豪斯多夫距离设计的无锚点检测头网络;
步骤S2,将待测工业产品的数据集和训练集输入到基于通道注意力模块的ShuffleNetV2网络获取不同尺寸的提取特征图;
步骤S3,将所述提取特征图输入到RepBlockv2模块,使用多分支结构配合深度可分离卷积和残差连接,进行多级预测获取融合特征图;
步骤S4,将所述融合特征图输入到基于豪斯多夫距离设计的无锚点检测头网络获取检测特征图,并计算预测检测框和真实框的距离损失,根据所述距离损失对所述基于豪斯多夫距离的网络模型进行训练,把检测特征图的每个位置作为训练样本,对于检测特征图中的每个位置对应原图的边框都进行边界平滑的回归,最终使用训练后的基于豪斯多夫距离的网络模型检测待测工业产品;
所述步骤S1中基于通道注意力模块的ShuffleNetV2网络包括:
所述ShuffleNetV2网络包括从前至后依次设置的卷积层、批标准化层、激活函数层以及若干个ShuffleNet基本单元,并去掉了最后一层卷积,抽取8、16、32倍下采样的特征对工业产品数据集的训练集进行多尺度的特征融合,获取不同尺寸的提取特征图;
所述ShuffleNet基本单元包括从前至后依次设置的卷积层、深度可分离卷积层和特征相加层,去掉了通道随机混合操作模块,设计了通道注意力模块代替;
所述通道注意力模块包括从前至后依次设置的自适应平均池化层、卷积层、ReLU激活函数、批标准化层和Hard-Sigmoid激活函数;
所述Hard-Sigmoid激活函数表示为:,其中,x为神经元的输出。
2.根据权利要求1所述的一种基于豪斯多夫距离计算距离损失的方法,其特征在于,所述步骤S1中RepBlockv2模块包括:
所述RepBlockv2模块包括从前至后依次设置的卷积层、深度可分离卷积层、批标准化层、特征相加层和ReLU激活函数;
所述RepBlockv2模块中的上采样和下采样均使用插值完成,并且将多尺寸的提取特征图直接相加。
3.根据权利要求1所述的一种基于豪斯多夫距离计算距离损失的方法,其特征在于,所述步骤S1中基于豪斯多夫距离设计的无锚点检测头网络包括:
基于豪斯多夫距离设计的无锚点检测头网络检测的待测工业产品检测特征图和多层特征图集中各图之间的误差的方法包括类别分类损失函数和位置回归函数:
所述类别分类损失函数采用焦点损失函数,所述的位置回归函数采用双向豪斯多夫距离损失函数和平滑L1损失函数;
所述双向豪斯多夫距离表示为:
其中,B和G分别代表预测检测框和真实框的二维高斯分布,b和g分别为分布中的点集,然后采用非线性转换函数f将双向豪斯多夫距离映射为类似IoU损失的函数,所以豪斯多夫损失函数表示为:
;
最终总损失函数表示如下:
;
其中,n为预测检测框的个数,为预测检测框,为真实框,为预测检测框的标签,为真实框的标签,和为超参数,为焦点损失。
4.一种基于豪斯多夫距离计算距离损失的装置,其特征在于,包括采集模块、训练模块和检测模块: 所述采集模块用于采集待测工业产品上的工业产品图像样本作为工业产品数据集,并将工业产品数据集分为测试集和训练集;
所述训练模块中引入训练豪斯多夫模块,用于采集训练基于豪斯多夫距离的网络模型,所述基于豪斯多夫距离的网络模型包括从前到后依次连接的基于通道注意力模块的ShuffleNetV2网络、RepBlockv2模块和基于豪斯多夫距离设计的无锚点检测头网络;
所述检测模块用于使用训练后的基于豪斯多夫距离的网络模型检测待测工业产品;
所述ShuffleNetV2网络包括从前至后依次设置的卷积层、批标准化层、激活函数层以及若干个ShuffleNet基本单元,并去掉了最后一层卷积,抽取8、16、32倍下采样的特征对工业产品数据集的训练集进行多尺度的特征融合,获取不同尺寸的提取特征图;
所述ShuffleNet基本单元包括从前至后依次设置的卷积层、深度可分离卷积层和特征相加层,去掉了通道随机混合操作模块,设计了通道注意力模块代替;
所述通道注意力模块包括从前至后依次设置的自适应平均池化层、卷积层、ReLU激活函数、批标准化层和Hard-Sigmoid激活函数;
所述Hard-Sigmoid激活函数表示为: ,其中,x为神经元的输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江霖研精密科技有限公司,未经浙江霖研精密科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211243593.5/1.html,转载请声明来源钻瓜专利网。