[发明专利]一种集装箱文字识别方法在审
| 申请号: | 202111070438.3 | 申请日: | 2021-09-13 |
| 公开(公告)号: | CN113762273A | 公开(公告)日: | 2021-12-07 |
| 发明(设计)人: | 丁杰;郑竞恒;王弋;李洁;胡争 | 申请(专利权)人: | 苏州云箱物联科技有限公司 |
| 主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/62;G06N3/08;G06T5/00 |
| 代理公司: | 东莞市卓易专利代理事务所(普通合伙) 44777 | 代理人: | 陈桂香 |
| 地址: | 215434 江苏省苏州市太仓港经济*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 集装箱 文字 识别 方法 | ||
本发明公开了一种集装箱文字识别方法,包括如下步骤:创建图像清晰度恢复数据集和标注集装箱OCR识别样本集;构建深度图像细节恢复网络模型、OCR检测神经网络模型、深度神经网络模型和OCR区域识别网络模型并进行保存;使用训练好的所述OCR区域识别网络模型对拍摄得到的图像进行OCR区域检测,定位出OCR区域;通过OCR检测神经网络模型对定位到的所述OCR区域的长宽进行判断,并筛选出宽度大于长度的OCR区域;对所述宽度大于长度的所述OCR区域通过所述深度图像细节恢复网络模型进行细节恢复。本发明,采用深度图像细节恢复网络模型,能够避免集装箱由于老化腐蚀等原因造成缺损时,通过集装箱侧面的竖版文字识别箱号,提升集装箱箱号识别系统实际应用中的鲁棒性。
技术领域
本发明涉及文字识别技术领域,具体为一种集装箱文字识别方法。
背景技术
目前,因为集装箱的体积较大,因此集装箱在摆放时均会采用水平摆放的方式,而且集装箱上的文字一般要么是水平印刷在集装箱上,要么就垂直印刷在集装箱上,垂直印刷在集装箱上的文字又被称为竖向文字,传统的集装箱文字识别一般只能对横向的文字进行识别,但是针对行业中确实存在一些将集装箱对应的序列号进行竖向书写的情况,现有的识别方法中,无法很好的实现对竖向文字的进行识别。
发明内容
本发明的目的在于提供一种集装箱文字识别方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种集装箱文字识别方法,包括如下步骤:
创建图像清晰度恢复数据集和标注集装箱OCR识别样本集;
构建深度图像细节恢复网络模型、OCR检测神经网络模型、深度神经网络模型和OCR区域识别网络模型并进行保存;
使用训练好的所述OCR区域识别网络模型对拍摄得到的图像进行OCR区域检测,定位出OCR区域;
通过OCR检测神经网络模型对定位到的所述OCR区域的长宽进行判断,并筛选出宽度大于长度的OCR区域;
对所述宽度大于长度的所述OCR区域通过所述深度图像细节恢复网络模型进行细节恢复;
恢复完成后,通过所述深度神经网络模型对所述OCR区域内的文字进行识别;
将识别后输出的结果结合OCR坐标信息进行关键字匹配,最后上传到数据库中进行大数据管理。
优选的,所述深度图像细节恢复网络模型的构建方法包括:
使用图像清晰度恢复数据集中的数据对神经网络进行监督训练,从而构建深度图像细节恢复网络模型;
其中,所述图像清晰度恢复数据集中的图像时基于原始清晰图像进行随机高斯模糊以及添加随机泊松噪声作为所述深度图像细节恢复网络模型构建时的网络输入,所述原始清晰图像作为所述深度图像细节恢复网络模型构建时的输出。
优选的,所述使用训练好的所述OCR区域识别网络模型对拍摄得到的图像进行OCR区域检测,定位出OCR区域进一步包括:
使用置信阈值对OCR检测结果进行筛选,消除模糊目标干扰;
使用非最大值抑制算法对相似区域进行抑制,避免同一区域重复检测;
对OCR区域检测结果进行填充处理,边界进行扩大以便更准确地截取OCR区域。
优选的,所述将识别后输出的结果结合OCR坐标信息进行关键字匹配,进一步包括:
所述深度神经网络模型对所述OCR区域内的文字进行识别时,同时构建对应的坐标系;
识别完成后,将识别出的文字结果和其中文字对应的坐标进行关键字匹配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州云箱物联科技有限公司,未经苏州云箱物联科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111070438.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于板材零件识别的激光打码设备
- 下一篇:视频拍摄方法、电子设备及装置





