[发明专利]一种电力场景通用物品的目标检测方法、装置及存储介质在审
申请号: | 202110487848.1 | 申请日: | 2021-04-30 |
公开(公告)号: | CN113344852A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 娄根;李慧姝;李晨曦;刘子涵;袁敏轩;刘尚禹 | 申请(专利权)人: | 苏州经贸职业技术学院 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T5/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 武汉智嘉联合知识产权代理事务所(普通合伙) 42231 | 代理人: | 易贤卫 |
地址: | 215000 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电力 场景 通用 物品 目标 检测 方法 装置 存储 介质 | ||
1.一种电力场景通用物品的目标检测方法,其特征在于,包括:
获取电力场景下的多幅样本图像,并对所述多幅样本图像进行数据增强,建立扩充数据集;
根据带有标注信息的所述扩充数据集,确定训练样本集,其中,标注信息经过数据增强后的多幅样本图像中存在的通用物品的实际类别和实际目标框;
将所述训练样本集输入至深度卷积神经网络模型,确定预测的通用物品的预测类别和预测目标框;
根据实际类别、实际目标框、预测类别和预测目标框,确定损失函数,根据所述损失函数的值调整所述深度卷积神经网络模型的参数直至满足收敛条件,完成对所述深度卷积神经网络模型的训练,并将通过使用基于数据增强的小样本学习方法训练完备的深度卷积神经网络模型进行存储;
将待测图像输入至训练完备的深度卷积神经网络模型中,识别预测通用物品,并输出对应的预测类别和预测目标框。
2.根据权利要求1所述的电力场景通用物品的目标检测方法,其特征在于,所述获取多幅样本图像,并对所述多幅样本图像进行数据增强,建立扩充数据集包括:
获取所述多幅样本图像;
将所述多幅样本图像进行图像分块,确定对应的多张图像子块;
根据所述图像子块和对应的所述多张扩充子块,建立对每一张图像子块进行多种图像处理操作,得到对应的多张扩充子块;
所述多张扩充子块构成所述扩充数据集。
3.根据权利要求2所述的电力场景通用物品的目标检测方法,其特征在于,所述多种图像处理操作包括调节图像亮度、调节图像色度、调节图像对比度、调节图像锐度以及人工加噪声中的至少一种。
4.根据权利要求1所述的电力场景通用物品的目标检测方法,其特征在于,所述深度卷积神经网络模型的网络结构依次包括多个卷积层,每个卷积层具有对应的最大值池化层。
5.根据权利要求1所述的电力场景通用物品的目标检测方法,其特征在于,所述根据实际类别、实际目标框、预测类别和预测目标框,确定损失函数包括:
根据所述预测目标框和所述实际目标框的重叠度,确定第一置信度损失;
根据所述预测目标框和所述实际目标框的误差,确定预测框误差损失;
计算将所述预测目标框和所述实际目标框的中心置于同一位置的重叠度,确定第二置信度损失;
根据所述预测目标框和所述实际目标框的坐标误差,确定坐标损失;
根据所述实际类别和所述预测类别,确定分类损失;
将所述第一置信度损失、所述预测框误差损失、所述第二置信度损失、所述坐标损失和所述分类损失和对应的权重相乘,确定所述损失函数。
6.根据权利要求1所述的电力场景通用物品的目标检测方法,其特征在于,所述将待测图像输入至所述训练完备的深度卷积神经网络模型中,识别预测通用物品,并输出对应的预测类别和预测目标框包括:
采用特征工程,确定所述待测图像的目标候选区域;
将所述目标候选区域进行图像分块,确定对应的多张图像子块;
将所述多张图像子块输入至所述训练完备的深度卷积神经网络模型,识别预测通用物品,并采用非极大值抑制进行处理,输出对应的预测类别和预测目标框。
7.根据权利要求1所述的电力场景通用物品的目标检测方法,其特征在于,所述待测图像通过电力作业机器人在电力场景下进行采集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州经贸职业技术学院,未经苏州经贸职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110487848.1/1.html,转载请声明来源钻瓜专利网。