[发明专利]一种基于对比度优化的电力光学字符识别方法及系统在审

专利信息
申请号: 202211339856.2 申请日: 2022-10-28
公开(公告)号: CN115641592A 公开(公告)日: 2023-01-24
发明(设计)人: 张驯;赵红;张蕾;李志茹;赵金雄;魏峰;白万荣;王蓉 申请(专利权)人: 国网甘肃省电力公司电力科学研究院
主分类号: G06V30/148 分类号: G06V30/148;G06V30/19;G06V30/14
代理公司: 上海科盛知识产权代理有限公司 31225 代理人: 赵志远
地址: 730070 甘肃*** 国省代码: 甘肃;62
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 对比度 优化 电力 光学 字符 识别 方法 系统
【说明书】:

发明涉及一种基于对比度优化的电力光学字符识别方法及系统,所述方法包括以下步骤:步骤S1、对比度优化:输入采集到的电力光学字符原始图像,采用基于对数映射函数LMF的全局对比度优化算法对电力光学字符原始图像中的像素进行对比度优化;步骤S2、文本检测:输入对比度优化后的电力光学字符图像,采用协同互学习网络CML进行字符检测定位;步骤S3、文本识别:用单一视觉文本识别网络SVTR对定位区域内的电力光学字符进行字符识别。与现有技术相比,本发明可在复杂光照背景下进行准确度高且效率高的电力光学字符识别。

技术领域

本发明涉及光学字符识别领域,尤其是涉及一种基于对比度优化的电力光学字符识别方法及系统。

背景技术

基于光学字符识别技术(Optical Character Recognition,缩写为OCR)的电力光学字符图像自动辨识方法已被广泛用作变电站的主要检查任务。OCR可分为两大类:基于经典模型的方法和基于数据驱动的深度神经网络方法。

基于经典模型的OCR方法紧凑且快速,但是在复杂的场景条件和文本属性(例如字体的方向、密度、艺术风格、字体类型和字体大小文本等)方面较基于数据驱动的深度神经网络方法缺乏足够的通用性。

OCR技术主要包括文本检测和文本识别。文本检测模块主要定位文本的位置和确定图像中的文本属性,同时文本识别模块侧重于预测实际文本本地化文本区域内的语义内容。

然而,一方面现有的OCR方法大多基于输入图像是在理想的环境光照条件下获取的假设,且对输入图像未做有效的预处理;极少数OCR方法考虑了对输入图像的全局或局部对比度进行提升,旨在提高图像质量照明不良的图像,但全局对比度方法无法同时处理黑暗和明亮的图像区域,而局部对比度方法在亮区内对比度优化方面的图像性能较差,进而影响OCR性能。另一方面现有的OCR方法训练参数庞大。这两方面通常会导致:基于在例如反射效应光照条件等复杂环境下捕获的图片上进行OCR时,性能普遍较差,且模型训练耗时耗力。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供了一种基于对比度优化的电力光学字符识别方法及系统,可在复杂光照背景下进行准确度高且效率高的电力光学字符识别。

本发明的目的可以通过以下技术方案来实现:

根据本发明的第一方面,提供了一种基于对比度优化的电力光学字符识别方法,该方法包括以下步骤:

步骤S1、对比度优化:输入采集到的电力光学字符原始图像,采用基于对数映射函数LMF的全局对比度优化算法对电力光学字符原始图像中的像素进行对比度优化;

步骤S2、文本检测:输入对比度优化后的电力光学字符图像,采用协同互学习网络CML进行字符检测定位;

步骤S3、文本识别:用单一视觉文本识别网络SVTR对定位区域内的电力光学字符进行字符识别。

优选地,所述步骤S1采用基于对数映射函数LMF的全局对比度优化算法对电力光学字符原始图像中的像素进行对比度优化,具体为:

对数映射函数LMF的表达式为:

式中,I表示电力光学字符图像的像素;α表示对数映射参数,该参数由对数映射参数权重t与平滑转移系数γ决定:

经过对数映射函数LMF优化后的RGB三通道像素值分别为:

优选地,所述步骤S1还包括采用基于文本上下文信息挖掘的数据增强方法对对比度优化后的电力光学字符图像进行数据增强,具体为:

将任意两个数据样本进行组合串联,形成新的训练样本并加入到原始训练数据集中,以扩展训练数据量。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网甘肃省电力公司电力科学研究院,未经国网甘肃省电力公司电力科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211339856.2/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top