[发明专利]一种基于深度学习的接触网关键部件识别方法有效
申请号: | 201711341384.3 | 申请日: | 2017-12-14 |
公开(公告)号: | CN108009591B | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 徐可佳;张军磊;张家玮;徐剑锋;方岩;韩峰;曾明 | 申请(专利权)人: | 西南交通大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 成都玖和知识产权代理事务所(普通合伙) 51238 | 代理人: | 胡琳梅 |
地址: | 610000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 接触 网关 部件 识别 方法 | ||
1.一种基于深度学习的接触网关键部件识别方法,其特征在于:包括以下几个步骤:
(1)目标图像采集:采集目标图像,形成原始图像样本集;
(2)图像数据增强:对原始图像样本集进行测试和探索,根据测试结果,选择灰度变换、剪切、旋转、镜像、加噪声图像处理方法中的至少一种方法进行数据处理,形成图像处理图片集,并将图像处理图片集与原始图像样本集进行整合,组成训练集,从训练集中抽取一部分作为验证集与测试集;
(3)图像分层识别:利用训练集进行图像区域识别和关键部件识别的网络模型训练,得到针对不同目标区域的网络模型;
(4)关键部件及部件特征识别:识别零部件以及零部件各个部位;
所述步骤(3)具体步骤如下:
(3a)将训练集图像尺寸缩小,得到训练集一;
(3b)图像区域识别:利用训练集一进行Faster R-CNN网络模型训练,形成网络模型一,利用网络模型一对训练集一图像识别并提取多个目标区域,得到目标区域的坐标;
(3c)将目标区域坐标映射到训练集一图像上,得到训练集一图像上的目标区域坐标,并将目标区域从训练集一图像剪裁下来,分别对剪裁下的不同目标区域尺寸进行变化,形成训练集二;
(3d)训练集二数据增强:利用图像识别模块对训练集二进行测试和探索,根据测试结果,运用灰度变换以及旋转、镜像、加噪声图像处理方法进行数据处理,形成训练集三,并将训练集三与训练集二进行整合,组成训练集四,从中随机抽取部分图片作为验证集二、测试集二;
(3e)关键部件识别网络模型训练:利用训练集四不同区域图像分别进行Faster R-CNN网络训练,得到针对不同目标区域的网络模型,统称为网络模型二。
2.如权利要求1所述的一种基于深度学习的接触网关键部件识别方法,其特征在于:所述步骤(3b)中所述图像区域识别的具体步骤如下:
(3.1)利用训练集一对Faster R-CNN模型训练,产生用于识别目标区域的初级网络模型一;
(3.2)利用初级网络模型一对测试集和验证集进行测试,根据训练集、测试集、验证集识别率关系调整模型参数,并利用模型对未标注过的图片进行测试,根据识别出区域数量,挑选出没有识别到的图片的未识别区域,标注时仅标注未识别图片的未识别区域,并将其他区域以黑色覆盖,形成错误集,并将错误集添加入训练集;
(3.3)统计目标区域识别率是否达到标准,若达到则流程继续,否则,根据测试集、训练集、验证集识别率调整参数并利用加入错误集后的训练集进行微调,微调时在原代价函数基础上增加惩罚项代价函数变为:
其中,w为用于微调的网络模型的权重,w'为每次更新得到的权重,β为该惩罚项的影响因子,pi为目标区域是关键部件的概率,为目标区域是否为关键部件的标签,ti为网络模型预测得到的目标区域坐标,为目标区域中交并比最大的包含关键部件的区域的坐标,Ncls是模型训练时一次可分析处理的图片数量,Nreg是每张图片中识别的可能存在关键部件的图像区域的数量,Lcls是关于某个目标区域的对数损失函数,Lreg是预测的目标区域和标注的图像区域之间坐标的差的回归损失函数,l为加权系数;得到新的初级网络模型一,并用该网络模型对未标注图片进行测试,得到错误集,并重复步骤(3.3),直到目标区域识别率达标,建立最终图像目标区域识别Faster R-CNN网络模型,即网络模型一;
(3.4)利用网络模型一进行目标区域识别并提取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南交通大学,未经西南交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711341384.3/1.html,转载请声明来源钻瓜专利网。