[发明专利]一种基于神经网络的指针仪表读数识别方法有效
申请号: | 201910724076.1 | 申请日: | 2019-08-07 |
公开(公告)号: | CN110543878B | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | 田联房;郭月阳;杜启亮 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V30/148;G06N3/04;G06N3/08 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 指针 仪表 读数 识别 方法 | ||
1.一种基于神经网络的指针仪表读数识别方法,其特征在于,包括以下步骤:
1)表盘定位数据集的构建与预处理;
2)针对识别对象及应用场景的特点,设计匹配的神经网络模型,包括以下步骤:
2.1)构建特征提取网络
根据实时性和高精度要求构建特征提取网络,该特征提取网络主要由多个组合卷积模块组成,其结构为:
第一层为组合卷积模块A,它由一个零填充层、一个卷积层、一个批归一化层和一个激活层组成;
第二层为组合卷积模块B,它由一个深度可分离卷积层、两个批归一化层、两个激活层和一个卷积层组成;
第三层为组合卷积模块C,它由一个零填充层、一个深度可分离卷积层、两个批归一化层、两个激活层和一个卷积层组成;
第四层为组合卷积模块B,它由一个深度可分离卷积层、两个批归一化层、两个激活层和一个卷积层组成;
第五层为组合卷积模块C,它由一个零填充层、一个深度可分离卷积层、两个批归一化层、两个激活层和一个卷积层组成;
第六层为组合卷积模块B,它由一个深度可分离卷积层、两个批归一化层、两个激活层和一个卷积层组成;
第七层为组合卷积模块C,它由一个零填充层、一个深度可分离卷积层、两个批归一化层、两个激活层和一个卷积层组成;
第八层为组合卷积模块D,它由五个组合卷积模块B组成;
第九层为组合卷积模块C,它由一个零填充层、一个深度可分离卷积层、两个批归一化层、两个激活层和一个卷积层组成;
第十层为组合卷积模块B,它由一个深度可分离卷积层、两个批归一化层、两个激活层和一个卷积层组成;
2.2)构建预测网络
根据特征提取网络不同层的输出,构建输出预测不同尺寸目标的预测网络,包括:
a、大尺寸目标预测网络
输入为特征提取网络第十层输出,大尺寸目标预测网络主要由多种组合卷积模块和卷积层组成,其结构为:
第一层为组合卷积模块D,它由五个组合卷积模块B组成;
第二层为组合卷积模块B,它由一个深度可分离卷积层、两个批归一化层、两个激活层和一个卷积层组成;
第三层为一个卷积层;
b、中等尺寸目标预测网络
输入为特征提取网络第八层输出和大尺寸目标预测网络第一层输出,中等尺寸目标预测网络主要由多种组合卷积模块和卷积层组成,其结构为:
第一层为输入融合模块,它由一个组合卷积模块B、一个上采样层和一个张量拼接层组成;
第二层为组合卷积模块D,它由五个组合卷积模块B组成;
第三层为组合卷积模块B,它由一个深度可分离卷积层、两个批归一化层、两个激活层和一个卷积层组成;
第四层为一个卷积层;
c、小尺寸目标预测网络
输入为特征提取网络第六层输出和中等尺寸目标预测网络第二层输出,小尺寸目标预测网络主要由多种组合卷积模块和卷积层组成,其结构为:
第一层为输入融合模块,它由一个组合卷积模块B、一个上采样层和一个张量拼接层组成;
第二层为组合卷积模块D,它由五个组合卷积模块B组成;
第三层为组合卷积模块B,它由一个深度可分离卷积层、两个批归一化层、两个激活层和一个卷积层组成;
第四层为一个卷积层;
最后将大尺寸目标预测网络、中等尺寸目标预测网络和小尺寸目标预测网络的输出通过非极大值抑制层得到预测目标位置和类别;
2.3)设置损失函数
设置损失函数为中心坐标损失函数、宽高损失函数、置信度损失与类别损失函数的求和均值,损失函数公式如下:
Loss=(Lossxy+Losswh+Lossconfidence+Losscls)/numf
其中,Loss代表总损失,Lossxy代表中心坐标损失,Losswh代表宽高损失,Lossconfidence代表置信度损失,Losscls代表类别损失,numf代表输入总数的浮点数;各个损失函数公式如下:
Lossxy=markobject*(2-w*h)*Losslog(xytrue,xypredict)
Losswh=0.5*markobject*(2-w*h)*(whtrue-whpredict)2
Lossconfidence=markobject*Losslog(markobject,cpredict)+(1-markobject)*Losslog(markobject,cpredict)*markignore
Losscls=markobject*Losslog(clstrue,clspredict)
中心坐标损失函数公式如下:
Lossxy=markobject*(2-w*h)*Losslog(xytrue,xypredict)
其中,markobject代表锚点框否存在物体的标志位,w代表锚点框的宽,h代表锚点框的高,Losslog代表二值交叉熵损失,xytrue代表真实中心坐标值,xypredict代表预测中心坐标值,whtrue代表真实宽高值,whpredict代表预测宽高值,cpredict代表预测框的置信度值,markignore代表IOU小于阈值的锚点框的标志位,clstrue代表真实类别,clspredict代表预测类别;
3)对设计的神经网络模型装载训练参数进行训练,训练过程中进行在线数据增强,训练完毕后得到表盘定位模型;
4)将待识别图像输入已训练的表盘定位模型中,得到图像中表盘的位置与类别,由表盘定位模型输出构建表盘信息提取数据集并预处理,对步骤2)中设计的神经网络模型装载训练参数并在表盘信息提取数据集上进行训练,训练过程中使用在线数据增强,训练完毕后得到表盘信息提取模型;
5)将表盘定位模型输出输入已训练的表盘信息提取模型中,得到表盘量程信息;
6)由表盘定位模型输出和表盘信息提取模型输出通过图像处理技术获得指针位置和表盘中心位置;
7)由表盘信息提取模型输出中得最大量程位置和最小量程位置,进而获得总量程角度,再由指针位置和最小量程位置获得读数角度,由同比例关系即角度法,获得仪表读数;其中,角度法公式为:
式中,num为指针仪表读数,angle1为最大量程与最小量程之间的角度,angle2为最小量程与指针位置之间的角度,max为最大量程读数,min为最小量程读数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910724076.1/1.html,转载请声明来源钻瓜专利网。