[发明专利]一种基于图像文本的仪表检测分类方法有效
| 申请号: | 202110855223.6 | 申请日: | 2021-07-28 |
| 公开(公告)号: | CN113673509B | 公开(公告)日: | 2023-06-09 |
| 发明(设计)人: | 田联房;王昭霖;杜启亮 | 申请(专利权)人: | 华南理工大学;华南理工大学珠海现代产业创新研究院 |
| 主分类号: | G06V30/19 | 分类号: | G06V30/19;G06V30/146;G06V30/148;G06V10/82;G06N3/0464 |
| 代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
| 地址: | 510640 广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 图像 文本 仪表 检测 分类 方法 | ||
本发明公开了一种基于图像文本的仪表检测分类方法,包括:1)仪表定位数据集的构建,改进YOLO网络训练,使用网络输出表盘图像;2)字符检测数据集的构建,改进EAST网络训练,使用网络输出字符图像;3)字符识别数据集的构建,CRNN网络训练,使用网络输出字符信息;4)文本分类数据集的构建,TextCNN网络训练,使用网络输出仪表类型。本发明使用神经网络实现仪表检测及仪表文本信息检测识别,具有更高的精度以及在不同背景下有更好的泛化能力,对于不同尺寸的仪表均能进行准确检测,不存在采集角度与距离的局限,利用仪表上的字符信息,可解决在机器视觉领域中能识别出仪表位置但难以区分仪表类型的问题,做到了不仅能检测出仪表并能识别出仪表的类型。
技术领域
本发明涉及图像处理与神经网络的技术领域,尤其是指一种基于图像文本的仪表检测分类方法。
背景技术
仪表作为一种监测装置,主要有压力仪表、温度仪表、流量仪表、电工仪表、电子测量仪表,它也被广泛应用于工业生产和社会生活的各个方面,为生产生活提供了极大的便利。通过图像采集设备采集仪表图像进行检测分类,相较于人工分类方法具有适用范围广、分类效率高的优势,随着图像处理技术和神经网络技术的发展,这种方法也在逐步成为主流,该方法中的关键环节就包括仪表中文本的定位与识别,文本定位与识别信息的精确与否对于仪表的分类和量纲读取具有重要影响。
目前对于仪表分类方法的研究与实现,主要集中在使用神经网络对不同类型的仪表图像进行分类训练,这种方法存在一些缺陷,比如对需要识别的仪表图像都需要训练,不同类型的仪表在图像上的区分度不是很大,深度网络对不同的仪表的识别分类性能并不理想。目前对于仪表上的字符识别方法的研究与实现,主要集中在传统图像处理技术的应用上,具体通过滤波、灰度化、阈值化、边缘检测、模板检测一系列图像处理技术实现字符信息的获取,这种方法虽然简单易行,但是泛化能力不足,对于不同环境下的各类型仪表的字符信息的识别并不具有普适性,需要频繁更换参数,而且精度不高。随着近年来图像处理和神经网络技术的迅猛发展,使得使用神经网络进行字符定位识别分类成为可能。其中主要有文本检测、文本识别和文本分类三种算法,文本检测主要通过神经网络对字符信息进行四边形框定位,再通过文本识别算法实现仪表上的文本信息读取,再通过文本分类算法将文本信息进行分类得到仪表的类型。
综合以上论述,发明一种具备实时性和高精度的仪表检测分类方法具有较高的实际应用价值。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提出了一种基于图像文本的仪表检测分类方法,使用神经网络实现仪表检测及仪表文本信息检测识别,具有更高的精度以及在不同背景下有更好的泛化能力,对于不同尺寸的仪表均能进行准确检测,不存在采集角度与距离的局限,利用仪表上的字符信息,能够解决在机器视觉领域中能识别出仪表位置但难以区分仪表类型的问题,做到了不仅能检测出仪表并能识别出仪表的类型。
为实现上述目的,本发明所提供的技术方案为:一种基于图像文本的仪表检测分类方法,包括以下步骤:
1)使用仪表图像对表盘位置进行标注构建仪表定位数据集,并将仪表定位数据集分为训练集和测试集,再装载参数使用训练集训练改进YOLO网络,训练完毕后得到最优的改进YOLO网络,将测试集输入最优的改进YOLO网络,输出表盘图像并将表盘图像裁剪出来;其中,改进YOLO网络是将骨干网络优化为mobilenet轻量化网络以减少网络参数和计算量,提高运算速度;
2)对步骤1)裁剪出来的表盘图像中字符位置进行标注构建字符检测数据集,并将字符检测数据集分为训练集和测试集,再装载训练参数使用训练集训练改进EAST网络,训练完毕后得到最优的改进EAST网络,将测试集输入最优的改进EAST网络,输出字符检测数据集中的字符位置并裁剪为字符图像;其中,改进EAST网络是将骨干网络换为VGG以提高网络检测准确性,其输出层结构修改预测模块只用头部元素预测顶点,以提高对长字符的预测性能;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学;华南理工大学珠海现代产业创新研究院,未经华南理工大学;华南理工大学珠海现代产业创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110855223.6/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





