[发明专利]一种铸坯字符的检测与识别方法、装置、设备及存储介质有效

专利信息
申请号: 202310593815.4 申请日: 2023-05-25
公开(公告)号: CN116434234B 公开(公告)日: 2023-10-17
发明(设计)人: 殷绪成;胡中杰;陈松路;刘琦;陈峰 申请(专利权)人: 珠海亿智电子科技有限公司
主分类号: G06V30/146 分类号: G06V30/146;G06V30/18;G06V20/62;G06V10/82
代理公司: 深圳青年人专利商标代理有限公司 44350 代理人: 吴桂华
地址: 519000 广东省珠海市高新区*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 字符 检测 识别 方法 装置 设备 存储 介质
【说明书】:

发明适用人工智能与计算机视觉领域,提供了一种铸坯字符的检测与识别方法、装置、设备及存储介质,该方法包括:当接收到铸坯字符识别请求时,获取待识别的铸坯图像,通过预先训练好的铸坯字符检测识别网络对铸坯图像进行处理,得到铸坯图像的矫正字符信息,其中,铸坯字符检测识别网络包括第一网络和第二网络,根据矫正字符信息和预设的矫正算法得到铸坯图像中的铸坯字符,从而有效降低了漏识和错识的概率,提高了任意方向且多行分布的铸坯字符的检测和识别性能,同时有效提高了识别准确度。

技术领域

本发明属于人工智能与计算机视觉领域,尤其涉及一种铸坯字符的检测与识别方法、装置、设备及存储介质。

背景技术

钢铁铸坯编号检测和识别是钢厂生产钢铁铸坯环节中必不可少的一环,在实际的生产中,由于铸坯放置的方式随机以及拍摄角度不定,使得图片中字符编号的朝向不同且会出现任意朝向的字符,此外,铸坯编号为多行阅读顺序固定的分布,当字符朝向任意时(倾斜角度过大或者出现倒置),多行之间的字符阅读顺序不能直接用一般的顺序(从左到右,从上到下)来对字符进行排列输出每一行的识别结果,给铸坯号检测和识别带来了一定的挑战。

传统的字符文本检测和识别方法基于字符文本的简单特征,例如边缘,纹理等等进行图像形态学操作,实现字符文本区域的行级或者字符级检测,但是这种方法只能处理场景简单且图像清晰的字符文本,非常容易受到其他因素如光照、干扰字符等影响,而且这种方法只能处理水平规则字符文本,对于任意朝向的字符文本非常容易出现检测错误导致后续的识别错误。此外,传统的识别方法需要在字符文本区域的基础上进行截取再进行字符文本的识别,这种方式同时要求检测识别两种独立的解决方法且对两个方法的精度要求都比较高,否则容易出现累积错误。近年来,深度学习的方法迅速发展,在铸坯编号检测识别领域展现出巨大的潜力,深度学习方法无需手动设置特征,通过模型对铸坯图像数据提取特征进行学习,抗干扰能力和泛化能力都强于传统方法,而铸坯编号识别属于场景文本识别的一种,能够使用场景文本识别的深度学习方法来进行处理,比如基于文本行的检测方法CTPN(Tian Z, Huang W, He T, et al. Detecting text in natural image withconnectionist text proposal network[C]//Computer Vision–ECCV 2016: 14thEuropean Conference, Amsterdam, The Netherlands, October 11-14, 2016,Proceedings, Part VIII 14. Springer International Publishing, 2016: 56-72.)通过将单行文本做为基准来实现文本的识别,但是,由于这类方法需要在检测到文本行区域之后再对单行的文本区域图像进行识别,过程较为繁琐,当需要检测识别的铸坯字符倾斜角度过大时,文本行检测得到文本行结果出现偏差,导致后续的文本行的识别出现字符的漏识和错识,此外,由于该任务处理的铸坯字符分布存在多行顺序这个规则,基于单独的文本行的检测识别方法无法获取文本行之间的顺序信息,导致在最终输出识别结果时出现行结果的输出顺序错误。还有基于通用的旋转目标检测的方法则是通过处理单个字符来实现文本的识别,但是由于这种方法检测框的定义缺陷,无法得到字符360°的朝向信息,当铸坯的字符旋转角度大于180°出现倒置,虽然旋转检测能够准确框出字符的位置,但是无法获取字符的朝向信息,使得字符间的排序方式出现错误,导致最终的识别错误。

发明内容

本发明的目的在于提供一种铸坯字符的检测与识别方法、装置、设备及存储介质,旨在解决由于现有技术无法提供一种有效的铸坯字符的检测与识别方法,导致铸坯字符的漏识和错识的概率高的问题。

一方面,本发明提供了一种铸坯字符的检测与识别方法,所述方法包括下述步骤:

当接收到铸坯字符识别请求时,获取待识别的铸坯图像;

通过预先训练好的铸坯字符检测识别网络对所述铸坯图像进行处理,得到所述铸坯图像的矫正字符信息,其中,所述铸坯字符检测识别网络包括第一网络和第二网络;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海亿智电子科技有限公司,未经珠海亿智电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310593815.4/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top