[发明专利]一种基于对比度优化的电力光学字符识别方法及系统在审
| 申请号: | 202211339856.2 | 申请日: | 2022-10-28 |
| 公开(公告)号: | CN115641592A | 公开(公告)日: | 2023-01-24 |
| 发明(设计)人: | 张驯;赵红;张蕾;李志茹;赵金雄;魏峰;白万荣;王蓉 | 申请(专利权)人: | 国网甘肃省电力公司电力科学研究院 |
| 主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V30/19;G06V30/14 |
| 代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 赵志远 |
| 地址: | 730070 甘肃*** | 国省代码: | 甘肃;62 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 对比度 优化 电力 光学 字符 识别 方法 系统 | ||
1.一种基于对比度优化的电力光学字符识别方法,其特征在于,该方法包括以下步骤:
步骤S1、对比度优化:输入采集到的电力光学字符原始图像,采用基于对数映射函数LMF的全局对比度优化算法对电力光学字符原始图像中的像素进行对比度优化;
步骤S2、文本检测:输入对比度优化后的电力光学字符图像,采用协同互学习网络CML进行字符检测定位;
步骤S3、文本识别:用单一视觉文本识别网络SVTR对定位区域内的电力光学字符进行字符识别。
2.根据权利要求1所述的一种基于对比度优化的电力光学字符识别方法,其特征在于,所述步骤S1采用基于对数映射函数LMF的全局对比度优化算法对电力光学字符原始图像中的像素进行对比度优化,具体为:
对数映射函数LMF的表达式为:
式中,I表示电力光学字符图像的像素;α表示对数映射参数,该参数由对数映射参数权重t与平滑转移系数γ决定:
经过对数映射函数LMF优化后的RGB三通道像素值分别为:
3.根据权利要求1所述的一种基于对比度优化的电力光学字符识别方法,其特征在于,所述步骤S1还包括采用基于文本上下文信息挖掘的数据增强方法对对比度优化后的电力光学字符图像进行数据增强,具体为:
将任意两个数据样本进行组合串联,形成新的训练样本并加入到原始训练数据集中,以扩展训练数据量。
4.根据权利要求1所述的一种基于对比度优化的电力光学字符识别方法,其特征在于,所述步骤S2具体为:输入对比度优化后的电力光学字符图像,构建协同互学习网络CML,将大核像素聚合网络LK-PAN作为文本检测教师模块的子网络,将残差挤压激励特征金字塔网络RSE-FPN作为文本检测学生模块的子网络,进行字符检测定位。
5.根据权利要求4所述的一种基于对比度优化的电力光学字符识别方法,其特征在于,所述步骤S2中的协同互学习网络CML的汇总损失函数表达式为:
式中,DKL_RSE-FPN(pl||pk)为RSE-FPN子网络所学特征的KL散度,M为文本检测学生模块的RSE-FPN子网络总数;μ为权衡大核像素聚合网络LK-PAN与残差挤压激励特征金字塔网络RSE-FPN学习的权重系数;Ldistill为文本检测教师模块中所有的LK-PAN子网络的蒸馏损失,表达式为:
式中,K为文本检测教师模块的LK-PAN子网络总数,LCi为第i个LK-PAN子网络训练时的预测值与训练值之间的交叉熵损失,DKL_LK-PAN(pl||pk)为LK-PAN子网络所学特征的KL散度,pl'、p'k分别表示第l、k个LK-PAN子网络学习得到的特征分布。
6.根据权利要求5所述的一种基于对比度优化的电力光学字符识别方法,其特征在于,所述RSE-FPN子网络、LK-PAN子网络所学特征的KL散度的表达式分别为:
式中,f表示子网络学习得到的特征,pl、pk分别表示第l、k个RSE-FPN子网络学习得到的特征分布,pl'、p'k分别表示第l、k个LK-PAN子网络学习得到的特征分布。
7.根据权利要求4所述的一种基于对比度优化的电力光学字符识别方法,其特征在于,所述大核像素聚合网络LK-PAN具体为:将采用对数映射函数LMF对比度优化后的电力光学字符图像作为大核像素聚合网络LK-PAN的输入,经过包括多阶1x1卷积、3x3卷积、9x9卷积层后,汇总卷积特征图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网甘肃省电力公司电力科学研究院,未经国网甘肃省电力公司电力科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211339856.2/1.html,转载请声明来源钻瓜专利网。





