[发明专利]一种端子排图像检测识别方法在审

专利信息
申请号: 202210117989.9 申请日: 2022-02-08
公开(公告)号: CN114550153A 公开(公告)日: 2022-05-27
发明(设计)人: 王会增;师元康;刘海锋;王乐;齐肖彬;张岩坡;袁冰;王昭雷;范辰旭;靳楠;张韶光 申请(专利权)人: 国网河北省电力有限公司超高压分公司;国家电网有限公司
主分类号: G06V20/62 分类号: G06V20/62;G06V30/148;G06V10/25;G06V10/26;G06V10/80;G06V10/24;G06V30/16;G06K9/62;G06N3/04
代理公司: 石家庄新世纪专利商标事务所有限公司 13100 代理人: 张晓佩
地址: 050000 河*** 国省代码: 河北;13
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 端子 图像 检测 识别 方法
【说明书】:

发明涉及一种端子排图像检测识别方法,涉及图像处理技术领域。该方法包括:在端子排机柜上,先获取端子排待处理图像,然后基于所提出的一阶段结合注意力模块的文字检测网络预先训练好的模型,进行端子排文字检测、分割到实例。基于一阶段所得到的文本实例,再通过二阶段预先训练好的文本识别模型,识别出文本的实际的内容。这种结合了注意力模块和文本扭曲增强的方式,能够有效解决文本目标检测分割边界定位不准的问题,能够有效解决扭曲文本识别转译的问题。最终实现端子排文本检测、识别的准确率提升,且提升效果比较明显。

技术领域

本发明涉及图像处理技术领域,具体涉及一种端子排图像检测识别方法。

背景技术

人工智能被誉为第四次工业革命的核心驱动力,对社会和经济的影响日益凸显。随着人工智能技术的进一步成熟以及政府和产业界投入的日益增长,人工智能应用将不断加速。各国政府纷纷出台相关政策,并将其上升到国家战略高度。当前,国家电网的运行方式和发展模式也正在发生变化,电网向高电压大电网、广域互连、配电网柔性自适应方向发展,能源互联网逐步形成。传统技术方法已无法满足电网业务的快速发展需求和解决相关业务痛点,需借助人工智能技术,从模型、样本、平台、通用组件、各专业智能化应用、运营机制、开放生态等多个方面统筹开展人工智能体系设计,加快人工智能的应用落地,促进公司电网数字化转型升级,实现对电网业务全面赋能。现阶段国家电网在面向人工智能应用建设方面,已成功应用无人机智能巡检技术,替代传统人工巡检,极大提高了隐蔽性缺陷发现率;安监领域亦开展了现场作业视频智能分析,实现典型违章行为的智能识别;基建领域在高风险和复杂工序现场,实施违章智能告警应用,有效识别电力作业现场安全隐患。

随着神经网络的复兴,场景文字检测和识别任务得到了很大推动,基于自然场景图像的文字识别技术也逐渐成为计算机视觉研究中的热点问题,并且近年来涌现了许多基于深度学习的场景文字检测和识别的算法。OCR文字识别作为一种通用的图像理解技术,对信息检索、电力系统信息回路,图纸、图片数据转换等应用的研究都有着重要意义。但现阶段因文字字符结构复杂,种类繁多,自然环境复杂多样、文字扭曲的原因,造成检测、识别、转译难度大的问题,依然不能得到有效解决。在实际应用过程中,失败案例屡屡出现,原因各不相同,其中大部分都是源于模型对于新“新数据”缺乏泛化能力。因此,即使OCR模型可以处理许多情况,如不同的字体、方向、角度、曲线、背景,但也有一些偏差是不能工作,如一些不流行的字体、符号、背景等等。

本研究针对目前电力系统设备的二次作业智能回路检修工作过程中,存在机房电器柜端子排关联信息与标准CAD图纸信息对比复核,及现场信息二次回路识别智能化辅助人员决策的应用需求。开展现场端子排图像文字检测、识别、CAD图纸结构化数据库建设及端子号对应关系核查、校准的应用技术研究。以期实现辅助检修作业过程中的CAD图纸、图像识别对比,达到提升设备检修作业效率、降低人员操作工作失误率,实现二次作业智能化决策的实际应用。

发明内容

本发明的目的在于针对现场端子排的数据形式,结合现阶段OCR检测识别研究现状,当前最先进的OCR识别系统,所采取的技术路线多数是以分割为基础的算法检测,再根据对分割结果进行文字识别的两阶段方法。本发明的技术方案:

一种端子排图像检测识别方法,采用OCR识别系统,以分割为基础的算法检测,再根据对分割结果进行文字识别的两阶段方法,通过由下而上的方式,先对文本进行分割,然后再根据文本分割实例,计算出文本的实际内容;

两阶段方法为两阶段OCR字符识别,一阶段采用可微的二值化DBNet网络结构作为文本检测,在模型骨干(backbone)的各个阶段添加了BAM模块,用于增强模型的增强表达,在文本结构信息缺失的情况下,仍然能对文本目标分割边界定位;二阶段采用CNN+RNN+CTC方法实现文本识别。

CNN为卷积神经网络结构,RNN为循环神经网络结构,CTC是一种避开输入与输出手动对齐的一种方式。是语音识别或者OCR识别的常用应用方法。

CNN+RNN+CTC表述为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网河北省电力有限公司超高压分公司;国家电网有限公司,未经国网河北省电力有限公司超高压分公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210117989.9/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top