[发明专利]一种基于参数重构网络的字符识别方法及系统有效
申请号: | 202210065743.1 | 申请日: | 2022-01-20 |
公开(公告)号: | CN114418001B | 公开(公告)日: | 2023-05-12 |
发明(设计)人: | 庞枫骞;康营营;赵鸿飞 | 申请(专利权)人: | 北方工业大学 |
主分类号: | G06V10/82 | 分类号: | G06V10/82;G06V10/774;G06N3/0464;G06N3/0442;G06T3/00;G06T3/40;G06V20/62;G06V30/40 |
代理公司: | 北京高沃律师事务所 11569 | 代理人: | 刘芳 |
地址: | 100144 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 参数 网络 字符 识别 方法 系统 | ||
本发明涉及一种基于参数重构网络的字符识别方法及系统,包括:获取待检测图像;利用特征金字塔网络对所述待检测图像进行拼接和提取,得到共享特征图;利用全卷积神经网络对所述共享特征图进行检测,得到带预测文本框的图像;对所述共享特征图和所述带预测文件框的图像进行仿射变换,得到水平特征图;对所述水平特征图进行识别,得到预测文本标签;根据所述带预测文本框的图像和所述预测文本标签得到字符识别结果。本发明能够提高字符识别的准确性。
技术领域
本发明涉及字符识别领域,特别是涉及一种基于参数重构网络的字符识别方法及系统。
背景技术
光学字符识别(Optical Character Recognition,OCR)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题。
由于在文档分析、场景理解、机器人导航和图像检索中的大量实际应用,在自然场景中的光学字符识别已经引起了计算机视觉界越来越多的关注。自然场景中的光学字符识别提供了一种自动快速获取自然场景中体现的文本信息的方式,通常分为两个子问题:场景文本检测和场景文本识别。
得益于深度神经网络提供的强大表示能力,场景文本检测和识别取得了重大进展。自然场景文本定位旨在从自然图像中同时定位和识别文本,已经被广泛研究。遵循传统的方法分别处理文本检测和识别过程,其中文本检测首先被训练的文本检测器命中,然后被送到文本识别模型中。这个架构看起来简单明了,但是可能会导致检测和识别的次优性能,以为这两个任务是相关的,并且是相互补充的。最近,一些研究人员开始将文本检测和识别与端到端可训练网络相结合,该网络由两个子模型组成:用于提取文本实例的检测网络和用于预测每个文本实例的序列标签的序列-序列网络。通过这些方法实现了文本识别的显著性能改进,证明了检测模型和识别模型是互补的,特别是当它们以端到端学习方式训练时。
然而在某些特定的场景下,例如在制造,供应仓储等场景下,对于元器件、电路板的字符图片,由于元器件供应商多,器件种类多,字符的样式多种多样,且针对一家供应商无法大量搜集电路板、元器件上的字符图片样例,同样对于跨境运输的货车,车牌样式,字体均不一致,且数据难以搜集,不太可能获得大量数据,即使存在大量数据,在对数据进行有效标注时将耗费大量人力物力,无法获取足够的带标签的训练样本,使得深度学习容易产生过拟合。
发明内容
本发明的目的是提供一种基于参数重构网络的字符识别方法及系统,以提高字符识别的准确性。
为实现上述目的,本发明提供了如下方案:
一种基于参数重构网络的字符识别方法,包括:
获取待检测图像;
利用特征金字塔网络对所述待检测图像进行拼接和提取,得到共享特征图;
利用全卷积神经网络对所述共享特征图进行检测,得到带预测文本框的图像;
对所述共享特征图和所述带预测文件框的图像进行仿射变换,得到水平特征图;
对所述水平特征图进行识别,得到预测文本标签;
根据所述带预测文本框的图像和所述预测文本标签得到字符识别结果。
可选地,所述利用特征金字塔网络对所述待检测图像进行拼接和提取,得到共享特征图,具体包括:
将所述待检测图像依次输入所述特征金字塔网络的卷积层、池化层和模型重构层,得到重构特征图;
对所述重构特征图进行上采样,得到共享特征图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北方工业大学,未经北方工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210065743.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种平流沉淀池排泥设备
- 下一篇:一种多应用场景的网络货运平台