[发明专利]图片中字符的识别方法、计算机设备和存储介质在审
申请号: | 201911149126.4 | 申请日: | 2019-11-21 |
公开(公告)号: | CN110929784A | 公开(公告)日: | 2020-03-27 |
发明(设计)人: | 茅心悦 | 申请(专利权)人: | 上海智臻智能网络科技股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 201803 上海市嘉*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图片 字符 识别 方法 计算机 设备 存储 介质 | ||
本发明实施例公开了一种图片中字符的识别方法、计算机设备和存储介质。方法包括:将待处理的图片输入光学字符识别模型;对待处理的图片进行第一深度的图像特征提取,得到第一特征矩阵;对第一特征矩阵进行第一空间变化处理,得到第一次空间变换特征矩阵;对第一次空间变换特征矩阵进行第二深度的图像特征提取,得到第二特征矩阵,第二深度的图像特征提取使用的第一卷积层的层数大于第一深度;对第二特征矩阵进行第二空间变化处理,得到第二次空间变换特征矩阵;根据第二次空间变换特征矩阵,得到对待处理的图片中包括的字符的识别结果。本发明实施例可以对待处理的图片的图像特征进行校正,提高识别准确率。
技术领域
本发明实施例涉及计算机视觉技术领域,尤其涉及一种图片中字符的识别方法、计算机设备和存储介质。
背景技术
基于计算机视觉的光学字符识别(Optical Character Recognition,OCR),已经被广泛应用于商业领域。光学字符识别检测和识别自然场景图像中的文本仍然是具有挑战性的。
包含自然场景的图片会存在很多影响文字识别的因素。例如,大量的光照变化、透视扭曲、图片质量、文本字体、不同的背景等。当需要检测的图片中字符存在倾斜,扭曲或者背景不同的情况下,光学字符识别的识别准确率会受一定的影响。
发明内容
本发明实施例提供一种图片中字符的识别方法、计算机设备和存储介质,以实现对图片中字符进行校正处理,提高识别准确率。
第一方面,本发明实施例提供了一种图片中字符的识别方法,预先利用训练样本集对光学字符识别模型进行训练,方法包括:
将待处理的图片输入光学字符识别模型;
对待处理的图片进行第一深度的图像特征提取,得到第一特征矩阵;
对第一特征矩阵进行第一空间变化处理,得到第一次空间变换特征矩阵;
对第一次空间变换特征矩阵进行第二深度的图像特征提取,得到第二特征矩阵,第二深度的图像特征提取使用的第一卷积层的层数大于第一深度;
对第二特征矩阵进行第二空间变化处理,得到第二次空间变换特征矩阵;
根据第二次空间变换特征矩阵,得到对待处理的图片中包括的字符的识别结果。
第二方面,本发明实施例还提供了一种计算机设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例所述的图片中字符的识别方法。
第三方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明实施例所述的图片中字符的识别方法。
本发明实施例的技术方案,通过将待处理的图片输入光学字符识别模型,对待处理的图片进行第一深度的图像特征提取,得到第一特征矩阵,然后对第一特征矩阵进行第一空间变化处理,得到第一次空间变换特征矩阵;再对第一次空间变换特征矩阵进行第二深度的图像特征提取,得到第二特征矩阵;然后对第二特征矩阵进行第二空间变化处理,得到第二次空间变换特征矩阵,根据第二次空间变换特征矩阵,得到对待处理的图片中包括的字符的识别结果,可以通过对第一特征矩阵进行的第一空间变化处理,以及对第二特征矩阵进行的第二空间变化处理,实现对待处理的图片的图像特征的校正,便于后续识别,提高了对待处理的图片中包括的字符的识别结果的识别准确率。
附图说明
图1a为本发明实施例提供的一种待处理的图片;
图1b是利用霍夫变换对图1a所示的待处理的图片进行校正的效果图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海智臻智能网络科技股份有限公司,未经上海智臻智能网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911149126.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种超级电容器电极结构及增强方法
- 下一篇:一种改进的SHPB试验装置