[发明专利]一种OCR快速识别方法、装置、设备和介质在审

专利信息
申请号: 202110209228.1 申请日: 2021-02-25
公开(公告)号: CN112990278A 公开(公告)日: 2021-06-18
发明(设计)人: 黄家昌;管发乾;杨辉;邱道椿 申请(专利权)人: 福建亿能达信息技术股份有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06N3/04
代理公司: 福州市鼓楼区京华专利事务所(普通合伙) 35212 代理人: 林燕
地址: 350000 福建省福州市鼓楼*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 ocr 快速 识别 方法 装置 设备 介质
【说明书】:

发明提供一种OCR快速识别方法、装置、设备和介质,方法包括:S1、对输入的图像进行预处理;S2、提取预处理后图像的空间潜层信息和时序潜层信息;所述空间潜层信息由空间模型通过卷积、池化、激活函数提取而得,空间模型的增加通道卷积层采用1×1卷积核来增加中间向量的通道数;所述时序潜层信息通过时序模型的多层双向SRN层提取而得,双向SRN层对大部分运算进行并行处理;S3、根据所述空间潜层信息和所述时序潜层信息,由嵌入层通过CTC进行多字符的分类,从而识别出图像上的所有字符。本发明空间模型采用1*1的卷积核来增加中间向量通道,进而降低计算量,同时将时序模型改为SRN来提取数据的时序信息,大大提高了模型的处理和识别速度,从而能实现实时识别。

技术领域

本发明涉及计算机技术领域,特别涉及一种OCR快速识别方法、装置、设备和介质。

背景技术

OCR(Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。

目前在OCR识别领域,很多方法都是基于CRNN(全称为ConvolutionalRecurrentNeural Network,是一种卷积循环神经网络结构,用于解决基于图像的序列识别问题,特别是场景文字识别问题)进行完成。先对输入图像进行预处理操作,CRNN通过多个的卷积层、激活层、池化层提取预处理后图像的空间信息,然后将得到的通过两层双向长短时记忆网络提取数据的时序信息,最后通过全连接层进行字符的分类。

现有的OCR识别方法,存在如下缺点:

1)、在卷积的计算中,随着通道数的增加,会增加计算的参数,降低速度、效率;例如:当前卷积层的卷积核为3×3,上一卷积层通道数为128时候,那么当前卷积层的单个卷积核计算参数为3×3×128;

2)、通过两层双向长短时记忆网络大大降低了识别的速度、效率;长短时记忆网络是时间序列模型,时间t时刻要依赖时间t-1时刻信息,不能并行执行。

由于现有的OCR识别方法具有上述缺点,大大降低了识别速度和效率。

发明内容

本发明要解决的技术问题,在于提供一种OCR快速识别方法、装置、设备和介质,空间模型采用1*1的卷积核来增加中间向量通道,进而降低计算量,同时将时序模型改为SRN来提取数据的时序信息,大大提高了模型的处理和识别速度,从而能实现实时识别。

第一方面,本发明提供了一种OCR快速识别方法,包括下述步骤:

S1、对输入的图像进行预处理;

S2、提取预处理后图像的空间潜层信息和时序潜层信息;

所述空间潜层信息由空间模型通过卷积、池化、激活函数提取而得,所述空间模型包括特征提取卷积层、增加通道卷积层以及池化层,所述增加通道卷积层采用1×1卷积核来增加中间向量的通道数;

所述时序潜层信息通过时序模型的多层双向SRN层提取而得,所述时序模型的构成是:第一层和第三层均为双向SRN层,对大部分运算进行并行处理;第二层和第四层为全连接层;

S3、根据所述空间潜层信息和所述时序潜层信息,由嵌入层通过CTC进行多字符的分类,从而识别出图像上的所有字符。

第二方面,本发明提供了一种OCR快速识别装置,包括:

预处理模块,用于对输入的图像进行预处理;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建亿能达信息技术股份有限公司,未经福建亿能达信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110209228.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top