[发明专利]一种基于GAN和YOLO-v5的目标分割检测方法在审
申请号: | 202111092430.7 | 申请日: | 2021-09-17 |
公开(公告)号: | CN113744262A | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 郭方洪;窦云飞;吴嘉昊;董辉;吴祥;陈博;俞立;姚荣康 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/10;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 忻明年 |
地址: | 310014 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 gan yolo v5 目标 分割 检测 方法 | ||
1.一种基于GAN和YOLO-v5的目标分割检测方法,其特征在于:所述基于GAN和YOLO-v5的目标分割检测方法包括如下步骤:
S1、获取目标检测数据集并标注目标的真实框;
S2、筛选所述目标检测数据集中的图片,将符合训练要求的所述图片归为训练集中准备训练,将不符合训练要求的所述图片采用生成对抗网络进行训练,直到符合训练要求后归为所述训练集中准备训练;
S3、采用K-NN算法对所述训练集中的图片进行分割;
S4、将分割后的所述训练集中的图片输入YOLO-v5模型进行训练,所述YOLO-v5模型包括输入端、Backbone网络、Neck网络和Prediction模块,并执行如下步骤:
S41、将所述输入端预处理后的所述图片输入所述Backbone网络以获得不同尺度的特征图;
S42、将所述不同尺度的特征图输入所述Neck网络进行特征提取;
S43、采用所述Prediction模块对提取特征进行预测并输出多个预测框和对应所述预测框的置信度;
S44、通过锚框融合算法获得最终预测框和所述最终预测框的置信度,所述锚框融合算法计算如下:
其中,(Xa,Ya)为所述最终预测框的左上顶点的坐标,(Xb,Yb)为所述最终预测框的右下顶点的坐标,μ为所述最终预测框的置信度,为第i个所述预测框的左上顶点的坐标,为第i个所述预测框的右下顶点的坐标,μi为第i个所述预测框的置信度,N为所述预测框的个数;
S45、采用GIOU_Loss作为训练损失函数进行反向传播调节权重参数,获得最终训练模型。
2.如权利要求1所述的基于GAN和YOLO-v5的目标分割检测方法,其特征在于:步骤S2中,所述目标检测数据集中的图片的筛选包括如下步骤:
S21、获取所述图片的灰度值并计算灰度方差,所述灰度方差计算公式如下:
其中,f(x,y)为所述图片像素点(x,y)的灰度值,μ为所述图片的灰度平均值,Nx为所述图片x方向上的像素点个数,Ny为所述图片y方向上的像素点个数;
S22、判断所述图片是否符合训练要求,若所述灰度方差大于第二预设阈值,则符合训练要求,否则,不符合训练要求。
3.如权利要求1所述的基于GAN和YOLO-v5的目标分割检测方法,其特征在于:步骤S3中,所述K-NN算法具体如下:
S31、计算预测点与各个点之间的欧氏距离,并根据距离大小排序;
S32、选择距离最小的K个点统计类别,以统计频率最高的类别作为所述预测点的类别。
4.如权利要求3所述的基于GAN和YOLO-v5的目标分割检测方法,其特征在于:所述K-NN算法通过交叉验证获得K值。
5.如权利要求1所述的基于GAN和YOLO-v5的目标分割检测方法,其特征在于:步骤S41中,所述预处理为将所述图片缩放并进行归一化后依次进行Mosaic数据增强、自适应锚框计算、自适应图片缩放操作。
6.如权利要求1所述的基于GAN和YOLO-v5的目标分割检测方法,其特征在于:步骤S45中,所述GIOU_Loss计算如下:
其中,A为所述真实框,B为所述最终预测框,C为所述真实框和最终预测框的闭包,即包围所述真实框和最终预测框的平行于坐标轴的最小矩形。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111092430.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种蟹柳棒的脱膜切断装置
- 下一篇:一种自动划分自然资源确权登记单元的方法