[发明专利]图像中文字的识别装置在审
| 申请号: | 201911150178.3 | 申请日: | 2019-11-21 |
| 公开(公告)号: | CN112825140A | 公开(公告)日: | 2021-05-21 |
| 发明(设计)人: | 茅心悦 | 申请(专利权)人: | 上海智臻智能网络科技股份有限公司 |
| 主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/32 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 201803 上海市嘉*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图像 文字 识别 装置 | ||
1.一种图像中文字的识别装置,其特征在于,对文字识别模型预先利用训练样本集进行训练,所述装置包括:
图像输入模块,用于将目标图像输入所述文字识别模型;
第一特征提取模块,用于对所述目标图像提取第一深度的第一图像特征;
第一特征处理模块,用于对所述第一图像特征进行第一空间变换,得到第一空间变换矩阵;
第二特征提取模块,用于对所述第一空间变换矩阵提取第二深度的第二图像特征,所述第二深度的图像特征提取使用的第一卷积层的层数大于所述第一深度;
第二特征处理模块,用于对所述第二图像特征进行第二空间变换,得到第二空间变换矩阵;
文字识别模块,用于根据所述第二空间变换矩阵,得到对所述目标图像中包括的文字的识别结果。
2.如权利要求1所述的装置,其特征在于,所述第一特征提取模块包括:
像素矩阵获取单元,用于获取所述目标图像的像素矩阵;
卷积计算单元,用于对所述像素矩阵进行预设窗口大小的卷积运算,得到所述第一图像特征。
3.如权利要求1所述的装置,其特征在于,所述第一特征处理模块和所述第二特征处理模块包括:
参数确定单元,用于根据所述第一图像特征以及预设的第一空间变换的形式,确定至少一个变换参数;
映射关系确定单元,用于根据所述变换参数,搜索确定输入特征与输出特征之间的映射关系;
矩阵变换单元,用于根据所述第一图像特征以及所述映射关系,得到第一空间变换矩阵。
4.如权利要求1所述的装置,其特征在于,所述第二特征提取模块包括:
特征矩阵获取单元,用于通过密集卷积网络从所述第一空间变换矩阵提取第二图像特征;
其中,所述密集卷积网络包括至少两个稠密块,每个所述稠密块中对输入内容进行预设窗口大小的卷积运算,所述稠密块中包括多个依次相连的第二卷积层,对于每个所述第二卷积层,将该层之前的各第二卷积层输出的所有特征矩阵依次拼接,作为该层的输入。
5.如权利要求1所述的装置,其特征在于,所述文字识别模块包括:
矩阵输入单元,用于将所述第二空间变换矩阵输入至相连的长短期记忆网络和翻译层中,得到目标图像中文字的识别结果。
6.如权利要求1-5任一项所述的装置,其特征在于,所述文字识别模型包括:
依次相连的第三卷积层、第一空间变换网络、密集卷积网络、第二空间变换网络、长短期记忆网络以及翻译层;
所述目标图像输入所述第三卷积层的输入端,所述翻译层的输出端输出所述目标图像中文字的识别结果。
7.如权利要求6所述的装置,其特征在于,所述第一空间变换网络与所述第二空间变换网络结构相同,包括:依次相连的本地网络、网格生成器以及采样器;
所述本地网络的输入端为所述空间变换网络的输入端,所述采样器的输出端为所述空间变换网络的输出端;
所述采样器包括两个输入端,分别与所述本地网络的输入端和所述网格生成器的输出端连接。
8.如权利要求1所述的装置,其特征在于,所述训练样本集中包括尺寸相同的样本图像;
所述图像中文字的识别装置还包括尺寸调整模块,用于将目标图像的尺寸统一调整为所述样本图像的尺寸。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海智臻智能网络科技股份有限公司,未经上海智臻智能网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911150178.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种喹啉衍生物及其制备方法与应用
- 下一篇:一种液晶组合物及其应用
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





