[发明专利]一种基于深度学习的端到端网口检测方法在审
申请号: | 201811558348.7 | 申请日: | 2018-12-19 |
公开(公告)号: | CN109635875A | 公开(公告)日: | 2019-04-16 |
发明(设计)人: | 彭林鹏;翁芳;赵永生;屈帅龙;张卫平 | 申请(专利权)人: | 浙江大学滨海产业技术研究院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;H04L12/935;H04N5/232 |
代理公司: | 天津滨海科纬知识产权代理有限公司 12211 | 代理人: | 杨慧玲 |
地址: | 300345 天津市滨海新*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 交换机网口 图像 网口检测 端到端 网口 机房 智能巡检机器人 图像数据集 巡检机器人 摄像头 模型结果 使用数据 数据标签 算法处理 准确率 机柜 制作 标注 部署 室内 智能 保存 分类 学习 检测 网络 | ||
1.一种基于深度学习的端到端网口检测方法,其特征在于,包括:
(1)获取机房不同背景、不同机柜的交换机网口图像;
(2)对交换机网口图像进行分类;标注每个图像,制作数据标签;
(3)使用数据增强技术,制作交换机网口图像数据集;
(4)训练深度网络YOLO v3模型,保存模型结果。
2.根据权利要求1所述的方法,其特征在于,步骤(1)中具体包括:通过调整智能室内巡检机器人的云台的高度,同时改变摄像头的视野角度,获取机房不同背景、不同机柜的交换机网口图像。
3.根据权利要求1所述的方法,其特征在于,步骤(2)中所述分类依据网口有无网线、有无遮挡、网线颜色进行划分,并使用矩形框标注网口。
4.根据权利要求1所述的方法,其特征在于,步骤(3)具体包括:
(3.1)在步骤(1)获取的交换机网口图像中选取不同条件下的图像,组成数据集;
(3.2)使用数据增强技术,将数据集中的每幅图像依次做水平翻转、随机裁剪、平移变换、仿射变换、颜色变换、光照变换、旋转变换后得到的网口图像分别存入数据集中;
(3.3)从数据集的所有图像中随机选取80%的图像,组成训练集,将剩余的20%图像组成测试集。
5.根据权利要求1所述的方法,其特征在于,步骤(4)具体包括:
(4.1)定义算法目标,算法全部使用均方和误差作为Loss函数,算法最终迭代Loss函数,使其收敛至最小,Loss函数由三部分组成:坐标误差、IOU误差和分类误差;
(4.2)K-means计算初始化时锚盒anchor boxes尺寸;YOLO v3使用anchor boxes来预测bounding boxes的坐标;
(4.3)初始化训练参数;设置初始学习率base_lr为0.001,学习率调整策略采用ReduceLROnPlateau,优化器采用随机梯度下降SGD算法,设定迭代次数step;
(4.4)开始训练模型;将训练集图像与对应标签类别输入到深度网络YOLO v3模型,加载(4.3)中的配置训练参数,下载ImageNet预训练权重,在自主搭建的GPU服务器上进行模型训练;
(4.5)可视化模型检测结果;载入训练好的深度网络YOLO v3模型的训练参数,将测试集图像输入到深度网络中,通过可视化技术进行检测;
(4.6)调整训练网络模型,如果模型输出误差和理想误差超过允许范围,则在(4.4)的基础上继续训练,直至模型效果达到要求。
6.一种基于深度学习的端到端网口检测系统,其特征在于,包括:
获取模块,用于获取机房不同背景、不同机柜的交换机网口图像;
分类标注模块,对交换机网口图像进行分类;标注每个图像,制作数据标签;
数据增强模块,使用数据增强技术,制作交换机网口图像数据集;
数据训练模块,训练深度网络YOLO v3模型,保存模型结果。
7.根据权利要求6所述的系统,其特征在于,获取模块包括调整单元,用于调整智能室内巡检机器人的云台的高度,同时改变摄像头的视野角度,获取机房不同背景、不同机柜的交换机网口图像。
8.根据权利要求6所述的系统,其特征在于,分类标注模块包括:
分类单元,用于依据网口有无网线、有无遮挡、网线颜色进行划分;
标注单元,用于使用矩形框标注网口。
9.根据权利要求6所述的系统,其特征在于,数据增强模块包括:
选取单元,用于在获取模块获取的交换机网口图像中选取2000张不同条件下的图像,组成数据集;
增强单元,用于使用数据增强技术,将数据集中的每幅图像依次做水平翻转、随机裁剪、平移变换、仿射变换、颜色变换、光照变换、旋转变换后得到的网口图像分别存入数据集中;
集合单元,用于从数据集的所有图像中随机选取80%的图像,组成训练集,将剩余的20%图像组成测试集。
10.根据权利要求6所述的系统,其特征在于,数据训练模块包括:
算法目标单元,用于定义算法目标,算法全部使用均方和误差作为Loss函数,算法最终迭代Loss函数,使其收敛至最小,Loss函数由三部分组成:坐标误差、IOU误差和分类误差;
尺寸计算单元,用于K-means计算初始化时锚盒anchor boxes尺寸;YOLO v3使用anchor boxes来预测bounding boxes的坐标;
初始化单元,用于初始化训练参数;设置初始学习率base_lr为0.001,学习率调整策略采用ReduceLROnPlateau,优化器采用随机梯度下降,迭代次数step为2000;
训练单元,用于开始训练模型;将训练集图像与对应标签类别输入到深度网络YOLO v3模型,加载初始化单元中的配置训练参数,下载ImageNet预训练权重,在自主搭建的GPU服务器上进行模型训练;
检测单元,用于可视化模型检测结果;载入训练好的深度网络YOLO v3模型的训练参数,将测试集图像输入到深度网络中,通过可视化技术进行检测;
调整单元,用于调整训练网络模型,如果模型输出误差和理想误差超过允许范围,则在训练单元的基础上继续训练,直至模型效果达到要求。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学滨海产业技术研究院,未经浙江大学滨海产业技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811558348.7/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序