[发明专利]基于深度学习的图像识别匹配方法及系统在审
申请号: | 202310146812.6 | 申请日: | 2023-02-21 |
公开(公告)号: | CN116469045A | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 邹宇;莫洪怀;池小兵;李昌;刘登科;王刚;苏维辉;周海龙;李辛蔚;莫祖荣;王元春;罗端 | 申请(专利权)人: | 广西电网有限责任公司钦州供电局 |
主分类号: | G06V20/52 | 分类号: | G06V20/52;G06V10/40;G06V10/30;G06N3/08;G06N3/0464 |
代理公司: | 广州汇航专利代理事务所(普通合伙) 44537 | 代理人: | 黄健仪 |
地址: | 535000 广*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 图像 识别 匹配 方法 系统 | ||
1.基于深度学习的图像识别匹配系统,其特征在于,包括图像获取端、图像特征分析中心以及显示终端;
所述图像特征分析中心包括图像特征分析提取单元、目标噪声弱化单元、倾斜角损失参数处理单元、自适应匹配单元以及数据库;
所述图像获取端,用于将变电站现场环境图像进行获取,并将所获取的环境图像传输至图像特征分析中心内;
所述图像特征分析中心内部的图像特征分析提取单元,采用层次化的设计,将所获取的环境图像划分为四组微图像,将四组微图像的分辨率进行缩小,将图像特征提取完毕后的环境图像传输至目标噪声弱化单元内;
所述目标噪声弱化单元,对图像特征提取完毕后的环境图像进行噪声弱化,给定一个中间特征映射,模块可以沿着通道和空间两个独立的维度依次推断注意力图,然后将注意力图乘以输入特征图以进行自适应特征细化,将特征细化后的环境图像传输至倾斜角损失参数分析单元内;
所述倾斜角损失参数处理单元,从环境图像内对其所携带的倾斜角θ视为分类任务来处理,将角度信息与边框参数信息进行解耦得到环境图像倾斜角的损失参数,通过数据增强进行了数据扩增来提高模型检测的准确率。
2.根据权利要求1所述的基于深度学习的图像识别匹配系统,其特征在于,所述图像特征分析提取单元,将四组微图像的分辨率进行缩小的具体方式为:
图像输入时先经过块分割层分割为一个个的不重叠的像素块,再经过线性嵌入层投影到任意维度,块合并层类似于卷积神经网络的池化层,进行通过采样操作来降低分辨率、调整通道数同时减少计算量;
在每个局部窗口分别计算自注意力,不再使用基于全局的自注意力计算,使计算的复杂度由图像的平方复杂度转变为图像的线性复杂度,极大减少了计算量,将图像特征提取完毕后的环境图像传输至目标噪声弱化单元内。
3.根据权利要求2所述的基于深度学习的图像识别匹配系统,其特征在于,所述倾斜角损失参数处理单元,将角度信息与边框参数信息进行解耦得到环境图像倾斜角的损失参数的具体方式为:
选择CIoU损失函数作为水平边框的损失函数,其考虑到了预测框和目标框的重叠面积、中心点距离和长宽比,十分契合遥感图像多尺度目标的特性,它的表达式定义如下:
其中,b和bgt分别表示预测框和目标框,d=ρ2(b,bgt)分别表示预测框和目标框中心点坐标的欧氏距离,c是预测框和目标框最小外接框的对角线距离,v是衡量长宽比一致性的参数,定义为:
其中和分别为目标框和预测框的宽高比;
本系统的YOLOv5损失函数由水平边框损失函数、分类损失函数、置信度损失函数和θ角度分类损失函数组成,水平边框损失函数为CIoU损失函数,分类损失函数和θ角度分类损失函数采用二元交叉熵损失函数来计算,置信度损失函数采用BCElogitsloss,计算公式如下:
Loss=Lossbbox+Lossclas+Lossconf+Lossθ
其中分类损失函数Lossclas和置信度损失函数Lossconf不变,与原始模型YOLOv5相同,水平边框损失函数和θ角度分类损失函数如下所示:
Lossbbox=1-CIoU
v其中θn和分别为CSL平滑后的真实角度和预测角度,将计算所得的环境图像倾斜角的损失参数lossθ传输至自适应匹配单元内。
4.根据权利要求3所述的基于深度学习的图像识别匹配系统,其特征在于,所述自适应匹配单元,对环境图像倾斜角的损失参数lossθ进行接收,并从数据库内选取对应的比对阈值Y1,并将环境图像倾斜角的损失参数lossθ与比对阈值Y1进行比对,并将比对结果传输至显示终端内进行显示,当lossθ<Y1时,生成待处理信号,并将此待处理信号传输至显示终端内,反之,不生成任何信号,不进行任何处理。
5.根据权利要求1-4任一项所述的基于深度学习的图像识别匹配系统的匹配方法,其特征在于,包括以下步骤:
步骤一、预先对变电站现场的环境图像进行获取,并对所获取的环境图像进行分析,将所获取的环境图像划分为四组微图像,将四组微图像的分辨率进行缩小,图像输入时先经过块分割层分割为多个的不重叠的像素块,再经过线性嵌入层投影到任意维度,进行通过采样操作来降低分辨率、调整通道数同时减少计算量,将图像特征提取完毕后的环境图像传输至下一步中再次进行处理;
步骤二、对图像特征提取完毕后的环境图像进行噪声弱化,给定一个中间特征映射,模块可以沿着通道和空间两个独立的维度依次推断注意力图,然后将注意力图乘以输入特征图以进行自适应特征细化,将特征细化后的环境图像传输至下一步中进行倾斜角损失参数计算处理;
步骤三、再从环境图像内对其所携带的倾斜角θ视为分类任务来处理,将角度信息与边框参数信息进行解耦得到环境图像倾斜角的损失参数,通过数据增强进行了数据扩增来提高模型检测的准确率,有效提升了对图像目标检测的速度和准确率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西电网有限责任公司钦州供电局,未经广西电网有限责任公司钦州供电局许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310146812.6/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序