[发明专利]一种端子排图像检测识别方法在审
申请号: | 202210117989.9 | 申请日: | 2022-02-08 |
公开(公告)号: | CN114550153A | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 王会增;师元康;刘海锋;王乐;齐肖彬;张岩坡;袁冰;王昭雷;范辰旭;靳楠;张韶光 | 申请(专利权)人: | 国网河北省电力有限公司超高压分公司;国家电网有限公司 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V30/148;G06V10/25;G06V10/26;G06V10/80;G06V10/24;G06V30/16;G06K9/62;G06N3/04 |
代理公司: | 石家庄新世纪专利商标事务所有限公司 13100 | 代理人: | 张晓佩 |
地址: | 050000 河*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 端子 图像 检测 识别 方法 | ||
本发明涉及一种端子排图像检测识别方法,涉及图像处理技术领域。该方法包括:在端子排机柜上,先获取端子排待处理图像,然后基于所提出的一阶段结合注意力模块的文字检测网络预先训练好的模型,进行端子排文字检测、分割到实例。基于一阶段所得到的文本实例,再通过二阶段预先训练好的文本识别模型,识别出文本的实际的内容。这种结合了注意力模块和文本扭曲增强的方式,能够有效解决文本目标检测分割边界定位不准的问题,能够有效解决扭曲文本识别转译的问题。最终实现端子排文本检测、识别的准确率提升,且提升效果比较明显。
技术领域
本发明涉及图像处理技术领域,具体涉及一种端子排图像检测识别方法。
背景技术
人工智能被誉为第四次工业革命的核心驱动力,对社会和经济的影响日益凸显。随着人工智能技术的进一步成熟以及政府和产业界投入的日益增长,人工智能应用将不断加速。各国政府纷纷出台相关政策,并将其上升到国家战略高度。当前,国家电网的运行方式和发展模式也正在发生变化,电网向高电压大电网、广域互连、配电网柔性自适应方向发展,能源互联网逐步形成。传统技术方法已无法满足电网业务的快速发展需求和解决相关业务痛点,需借助人工智能技术,从模型、样本、平台、通用组件、各专业智能化应用、运营机制、开放生态等多个方面统筹开展人工智能体系设计,加快人工智能的应用落地,促进公司电网数字化转型升级,实现对电网业务全面赋能。现阶段国家电网在面向人工智能应用建设方面,已成功应用无人机智能巡检技术,替代传统人工巡检,极大提高了隐蔽性缺陷发现率;安监领域亦开展了现场作业视频智能分析,实现典型违章行为的智能识别;基建领域在高风险和复杂工序现场,实施违章智能告警应用,有效识别电力作业现场安全隐患。
随着神经网络的复兴,场景文字检测和识别任务得到了很大推动,基于自然场景图像的文字识别技术也逐渐成为计算机视觉研究中的热点问题,并且近年来涌现了许多基于深度学习的场景文字检测和识别的算法。OCR文字识别作为一种通用的图像理解技术,对信息检索、电力系统信息回路,图纸、图片数据转换等应用的研究都有着重要意义。但现阶段因文字字符结构复杂,种类繁多,自然环境复杂多样、文字扭曲的原因,造成检测、识别、转译难度大的问题,依然不能得到有效解决。在实际应用过程中,失败案例屡屡出现,原因各不相同,其中大部分都是源于模型对于新“新数据”缺乏泛化能力。因此,即使OCR模型可以处理许多情况,如不同的字体、方向、角度、曲线、背景,但也有一些偏差是不能工作,如一些不流行的字体、符号、背景等等。
本研究针对目前电力系统设备的二次作业智能回路检修工作过程中,存在机房电器柜端子排关联信息与标准CAD图纸信息对比复核,及现场信息二次回路识别智能化辅助人员决策的应用需求。开展现场端子排图像文字检测、识别、CAD图纸结构化数据库建设及端子号对应关系核查、校准的应用技术研究。以期实现辅助检修作业过程中的CAD图纸、图像识别对比,达到提升设备检修作业效率、降低人员操作工作失误率,实现二次作业智能化决策的实际应用。
发明内容
本发明的目的在于针对现场端子排的数据形式,结合现阶段OCR检测识别研究现状,当前最先进的OCR识别系统,所采取的技术路线多数是以分割为基础的算法检测,再根据对分割结果进行文字识别的两阶段方法。本发明的技术方案:
一种端子排图像检测识别方法,采用OCR识别系统,以分割为基础的算法检测,再根据对分割结果进行文字识别的两阶段方法,通过由下而上的方式,先对文本进行分割,然后再根据文本分割实例,计算出文本的实际内容;
两阶段方法为两阶段OCR字符识别,一阶段采用可微的二值化DBNet网络结构作为文本检测,在模型骨干(backbone)的各个阶段添加了BAM模块,用于增强模型的增强表达,在文本结构信息缺失的情况下,仍然能对文本目标分割边界定位;二阶段采用CNN+RNN+CTC方法实现文本识别。
CNN为卷积神经网络结构,RNN为循环神经网络结构,CTC是一种避开输入与输出手动对齐的一种方式。是语音识别或者OCR识别的常用应用方法。
CNN+RNN+CTC表述为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网河北省电力有限公司超高压分公司;国家电网有限公司,未经国网河北省电力有限公司超高压分公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210117989.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种小型水电站
- 下一篇:一种端子排图像检测信息匹配方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序