[发明专利]一种自动读取指针式仪表读数的方法有效
| 申请号: | 201810203368.6 | 申请日: | 2018-03-13 |
| 公开(公告)号: | CN108564085B | 公开(公告)日: | 2020-07-14 |
| 发明(设计)人: | 杨育彬;周杨浩;李瑮;刘一帆 | 申请(专利权)人: | 南京大学 |
| 主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/62 |
| 代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 胡建华;于瀚文 |
| 地址: | 210023 江苏省南*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 自动 读取 指针 仪表 读数 方法 | ||
1.一种自动读取指针式仪表读数的方法,其特征在于,包括以下步骤:
步骤1,图像采集及预处理:采集含有仪表正面的图像作为输入图像,读取图像中仪表的示数,并对图像进行颜色空间转换和尺寸变换;
步骤2,分类器的训练:通过预先采集的含有仪表正面的图像,选取含有完整仪表的窗口为正样本,再随机生成不含仪表部分的背景窗口作为负样本,将正负样本尺寸归一化并提取梯度方向直方图HOG特征,作为输入向量,使用线性支持向量机C-SVM进行训练获得分类器;
步骤3,获取仪表部分图像:对步骤1中采集的图像使用滑动窗口,提取每个窗口的梯度方向直方图HOG特征,并使用训练完成的分类器评估每个窗口的得分,选择最优的窗口作为仪表部分的窗口输出,从而得到仪表部分图像;
步骤4,图像的预处理:对步骤3得到的仪表部分图像进行直方图均衡化和滤波操作,得到灰度图;
步骤5,仪表指针和表盘的识别:将步骤4得到的灰度图边缘检测得到边缘图,检测其中的最大圆形即为表盘边缘,获取圆心坐标,再以圆心坐标为基准点检测步骤4得到的灰度图中最有可能的指针点,作为指针所在的直线,得到指针角度;
步骤6,获取指针的读数:根据步骤5得到的指针角度,结合表盘数值信息,计算读数;
步骤1包括:
载入采集到的含有仪表正面的图像作为原图像,将原图像RGB红绿蓝三通道图像转换为单通道的灰度图,并进行尺寸等比例缩小,转换比col_pre和row_pre分别表示变换尺寸前的图像的列尺寸和行尺寸,col_cur和row_cur分别表示变换尺寸后的图像的列尺寸和行尺寸;
步骤2包括如下步骤:
步骤2-1,样本制作:预先采集含有仪表正面部分的图像,选取正好含有完整仪表的窗口为正样本,再随机生成不含仪表部分的背景窗口作为负样本;
步骤2-2,将正负样本归一到相同行尺寸row_win和列尺寸col_win,提取改变尺寸后的图像的梯度方向直方图HOG特征,将图像像素组织成块结构block,每个块结构由细胞单元cell组成,设定梯度方向直方图HOG特征的参数,包括block块的步长winstride,组成block块的cell数cells,统计方向数nbins,block块的列尺寸col_block和行尺寸row_block,每个样本会得到一个维数为的特征向量;
步骤2-3,将正负样本的标签label分别设定为1和-1,利用步骤2-2所述的每个样本对应的dim维梯度方向直方图HOG特征向量和标签label作为训练样本,表示第n个样本的dim维特征向量的1到dim个分量,通过解约束条件yn(wTxn+b)≥1-ξn, ξn≥0,n=1,…,|D|下的最优化问题其中|D|是训练数据集的大小,yn是第n个样本的标记,如果样本图像包含仪表则为1,否则为-1;w是权重参数,b是偏置参数,w和b是优化问题求解的目标;ξn是第n个样本的松弛变量,表示样本不满足约束条件yn(wTxn+b)≥1的程度;C是惩罚参数,表示对不满足约束的样本的惩罚值,选取一个固定的小常数1.0;
求解上述的最优化问题即是训练线性支持向量机C-SVM,最终得到一个最优超平面作为分类平面:wTx+b=0,w和b是求解出的参数,x是样本的HOG特征向量;
步骤3包括如下步骤:
步骤3-1,获取待检测图像,将待检测的图像进行尺寸变换和颜色空间转换;
步骤3-2,建立行尺寸为row_win、列尺寸为col_win的滑动窗口,利用滑动窗口,根据步长stride改变窗口位置,从左至右从上至下遍历步骤3-1中得到的图像,根据步长和大小在每一步的位置生成一个窗口,并对步骤3-1中得到的图像进行放大和缩小的尺度变换,在放大缩小后不同大小的图像用相同的步长和窗口大小在每一步长移动后的位置生成一个窗口,从而在滑动窗口大小不变的情况下检测不同大小的仪表,记每次的缩小或放大比例为scale,进行一次放大变换后的图像行数和列数的大小分别为row_cur*scale和col_cur*scale,进行一次缩小变换后的图像行数和列数的大小分别为row_cur/scale和col_cur/scale;
步骤3-3,对步骤3-2生成的每个窗口提取梯度方向直方图HOG特征向量,并送入训练好的分类器根据y=wTx+b进行分类,w和b即步骤2-3中求解的参数,x是样本的HOG特征向量,y是预测值,其值越大,该窗口包含仪表的概率越大,选择其中最大y值的窗口作为仪表所在的窗口;在第一次的尺度下得到最优的窗口位置之后,后续在其他尺度的图像上检测窗口时不再遍历全图,而只在初始的最优窗口位置的上下左右30个像素的范围内进行窗口滑动与检测,最终得到所有放缩尺度后的图像上最优窗口的左上角坐标(col_retbest,row_retbest),col_retbest,row_retbest分别表示横、纵坐标;
步骤3-4,获取最优窗口位置之后,窗口对应步骤3-1得到的未缩放的输入的待检测图像中的位置为和行列尺寸为scalebest表示最优窗口对应的图像的放缩比例,根据位置和尺寸在输入的待检测图像的对应位置截取对应尺寸大小的图像部分作为待检测图像中仪表部分图像的输出结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810203368.6/1.html,转载请声明来源钻瓜专利网。





