[发明专利]一种OCR快速识别方法、装置、设备和介质在审
申请号: | 202110209228.1 | 申请日: | 2021-02-25 |
公开(公告)号: | CN112990278A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 黄家昌;管发乾;杨辉;邱道椿 | 申请(专利权)人: | 福建亿能达信息技术股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 福州市鼓楼区京华专利事务所(普通合伙) 35212 | 代理人: | 林燕 |
地址: | 350000 福建省福州市鼓楼*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 ocr 快速 识别 方法 装置 设备 介质 | ||
本发明提供一种OCR快速识别方法、装置、设备和介质,方法包括:S1、对输入的图像进行预处理;S2、提取预处理后图像的空间潜层信息和时序潜层信息;所述空间潜层信息由空间模型通过卷积、池化、激活函数提取而得,空间模型的增加通道卷积层采用1×1卷积核来增加中间向量的通道数;所述时序潜层信息通过时序模型的多层双向SRN层提取而得,双向SRN层对大部分运算进行并行处理;S3、根据所述空间潜层信息和所述时序潜层信息,由嵌入层通过CTC进行多字符的分类,从而识别出图像上的所有字符。本发明空间模型采用1*1的卷积核来增加中间向量通道,进而降低计算量,同时将时序模型改为SRN来提取数据的时序信息,大大提高了模型的处理和识别速度,从而能实现实时识别。
技术领域
本发明涉及计算机技术领域,特别涉及一种OCR快速识别方法、装置、设备和介质。
背景技术
OCR(Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。
目前在OCR识别领域,很多方法都是基于CRNN(全称为ConvolutionalRecurrentNeural Network,是一种卷积循环神经网络结构,用于解决基于图像的序列识别问题,特别是场景文字识别问题)进行完成。先对输入图像进行预处理操作,CRNN通过多个的卷积层、激活层、池化层提取预处理后图像的空间信息,然后将得到的通过两层双向长短时记忆网络提取数据的时序信息,最后通过全连接层进行字符的分类。
现有的OCR识别方法,存在如下缺点:
1)、在卷积的计算中,随着通道数的增加,会增加计算的参数,降低速度、效率;例如:当前卷积层的卷积核为3×3,上一卷积层通道数为128时候,那么当前卷积层的单个卷积核计算参数为3×3×128;
2)、通过两层双向长短时记忆网络大大降低了识别的速度、效率;长短时记忆网络是时间序列模型,时间t时刻要依赖时间t-1时刻信息,不能并行执行。
由于现有的OCR识别方法具有上述缺点,大大降低了识别速度和效率。
发明内容
本发明要解决的技术问题,在于提供一种OCR快速识别方法、装置、设备和介质,空间模型采用1*1的卷积核来增加中间向量通道,进而降低计算量,同时将时序模型改为SRN来提取数据的时序信息,大大提高了模型的处理和识别速度,从而能实现实时识别。
第一方面,本发明提供了一种OCR快速识别方法,包括下述步骤:
S1、对输入的图像进行预处理;
S2、提取预处理后图像的空间潜层信息和时序潜层信息;
所述空间潜层信息由空间模型通过卷积、池化、激活函数提取而得,所述空间模型包括特征提取卷积层、增加通道卷积层以及池化层,所述增加通道卷积层采用1×1卷积核来增加中间向量的通道数;
所述时序潜层信息通过时序模型的多层双向SRN层提取而得,所述时序模型的构成是:第一层和第三层均为双向SRN层,对大部分运算进行并行处理;第二层和第四层为全连接层;
S3、根据所述空间潜层信息和所述时序潜层信息,由嵌入层通过CTC进行多字符的分类,从而识别出图像上的所有字符。
第二方面,本发明提供了一种OCR快速识别装置,包括:
预处理模块,用于对输入的图像进行预处理;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建亿能达信息技术股份有限公司,未经福建亿能达信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110209228.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种具有倒挂训练保护功能的单杠
- 下一篇:一种碳足迹核算标识管理仪器