[发明专利]图像中文字的识别装置在审
| 申请号: | 201911150178.3 | 申请日: | 2019-11-21 |
| 公开(公告)号: | CN112825140A | 公开(公告)日: | 2021-05-21 |
| 发明(设计)人: | 茅心悦 | 申请(专利权)人: | 上海智臻智能网络科技股份有限公司 |
| 主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/32 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 201803 上海市嘉*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图像 文字 识别 装置 | ||
本发明公开了一种图像中文字的识别装置。包括:图像输入模块,用于将目标图像输入文字识别模型;第一特征提取模块,用于对所述目标图像提取第一深度的第一图像特征;第一特征处理模块,用于对所述第一图像特征进行第一空间变换,得到第一空间变换矩阵;第二特征提取模块,用于对所述第一空间变换矩阵提取第二深度的第二图像特征,所述第二深度的特征提取使用的第一卷积层的数目多于所述第一深度;第二特征处理模块,用于对所述第而图像特征进行第二空间变换,得到第二空间变换矩阵;文字识别模块,用于根据所述第二空间变换矩阵,得到对所述目标图像中包括的文字的识别结果。本发明实施例可以对目标图像的图像特征进行校正,提高识别准确率。
技术领域
本发明实施例涉及计算机视觉技术领域,尤其涉及一种图像中文字的识别装置。
背景技术
基于计算机视觉的光学字符识别(Optical Character Recognition,OCR),已经被广泛应用于商业领域。光学字符识别检测和识别自然场景图像中的文本仍然是具有挑战性的。
包含自然场景的图片会存在很多影响文字识别的因素。例如,大量的光照变化、透视扭曲、图片质量、文本字体、不同的背景等。当需要检测的图像中文字存在倾斜,扭曲或者背景不同的情况下,光学文字识别的识别准确率会受一定的影响。
发明内容
本发明实施例提供一种图像中文字的识别装置,能够实现对图像中文字进行校正处理,提高识别准确率。
本发明提供了一种图像中文字的识别装置,预先利用训练样本集对文字识别模型进行训练,装置包括:
图像输入模块,用于将目标图像输入所述文字识别模型;
第一特征提取模块,用于对所述目标图像提取第一深度的第一图像特征;
第一特征处理模块,用于对所述第一图像特征进行第一空间变换,得到第一空间变换矩阵;
第二特征提取模块,用于对所述第一空间变换矩阵提取第二深度的第二图像特征,所述第二深度的图像特征提取使用的第一卷积层的层数大于所述第一深度;
第二特征处理模块,用于对所述第而图像特征进行第二空间变换,得到第二空间变换矩阵;
文字识别模块,用于根据所述第二空间变换矩阵,得到对所述目标图像中包括的文字的识别结果。
优选地,所述第一特征提取模块包括:
像素矩阵获取单元,用于获取所述目标图像的像素矩阵;
卷积计算单元,用于对所述像素矩阵进行预设窗口大小的卷积运算,得到所述第一图像特征。
优选地,所述第一特征处理模块包括:
参数确定单元,用于根据所述第一图像特征以及预设的第一空间变换的形式,确定至少一个变换参数;
映射关系确定单元,用于根据所述变换参数,搜索确定输入特征与输出特征之间的映射关系;
矩阵变换单元,用于根据所述第一图像特征以及所述映射关系,得到第一空间变换矩阵。
优选地,所述第二特征提取模块包括:
特征矩阵获取单元,用于通过密集卷积网络从所述第一空间变换矩阵提取第二图像特征;
其中,所述密集卷积网络包括至少两个稠密块,每个所述稠密块中对输入内容进行预设窗口大小的卷积运算,所述稠密块中包括多个依次相连的第二卷积层,对于每个所述第二卷积层,将该层之前的各第二卷积层输出的所有特征矩阵依次拼接,作为该层的输入。
优选地,所述文字识别模块包括:矩阵输入单元,用于将所述第二空间变换矩阵输入至相连的长短期记忆网络和翻译层中,得到目标图像中文字的识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海智臻智能网络科技股份有限公司,未经上海智臻智能网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911150178.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种喹啉衍生物及其制备方法与应用
- 下一篇:一种液晶组合物及其应用
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





