[发明专利]一种图片类文档盲去噪系统、方法及装置在审

专利信息
申请号: 201910275858.1 申请日: 2019-04-08
公开(公告)号: CN111797838A 公开(公告)日: 2020-10-20
发明(设计)人: 张怀朋;文剑钧 申请(专利权)人: 上海怀若智能科技有限公司
主分类号: G06K9/40 分类号: G06K9/40;G06K9/32;G06K9/34
代理公司: 上海宏京知识产权代理事务所(普通合伙) 31297 代理人: 邓文武
地址: 200439 上海市宝山*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 图片 文档 盲去噪 系统 方法 装置
【说明书】:

发明属于计算机视觉技术领域,具体涉及一种图片类文档盲去噪系统、方法及装置。所述系统包括:预处理单元,对待处理图片进行高斯模糊处理、灰度化处理和二值化处理,生成第一处理结果;直线检测单元,对第一处理结果进行直线检测,生成第一检测结果;表格检测单元,在第一检测结果的基础上,进行表格检测,生成第二检测结果;文本方向处理单元,在第二检测结果的基础上进行文本方向检测,生成第三检测结果,根据第三检测结果,对第一处理结果进行处理,生成第二处理结果;去拉伸单元,对第二处理结果进行去拉伸处理,生成第三处理结果;去扭曲单元,对第三处理结果进行去拉伸或去扭曲处理,生成最终的处理结果。能够完美适配用于OCR的深度网络模型。

技术领域

本发明属于计算机视觉技术领域,具体涉及一种图片类文档盲去噪系统、方法及装置。

背景技术

OCR作为CV领域长期以来一直备受关注的热门,随着深度学习的崛起,实现了跨越式的进步,在识别精度上,从传统机器学习在句和字符级别长期停滞在75%和85%左右,到如今不断逼近95%和100%;在泛化能力上,复杂度足够的深度网络模型足以学习到不同场景不同质量的图片类文档的特征,并做到真正的泛化,而与之相对比,传统机器学习则对识别的文档质量和场景要求苛刻。无论传统机器学习还是深度学习,OCR仍遵从相同的一套算法流程,即:

1.预处理:将原始图片经处理转换为OCR模型需要的输入格式,包含去噪、二值化等操作,其中去噪又有去歪斜、扭曲、噪点、模糊,等等。深度学习凭借其网络模型的高复杂度,可以直接处理一些简单噪声的图片,但仍需要预处理的工作。

2.特征提取:从图片输入中提取对文本识别有贡献的关键特征(去除无用特征),作为文本识别特征输入。其中,在传统机器学习中,特征提取往往需要复杂的设计和专业的领域知识作为支撑;在深度学习中则作为一个模块与判别器共同组成深度网络模型。

3.文本识别:目前OCR技术分文本检测(Detection)和文字识别(Recognition)两部分进行文本识别。其中文本检测负责从复杂版式的图片中定位文本行的位置,而文本识别则负责将文本检测提取出的文本行中的文字做出识别。此部分未来的研究重心是,复杂场景下的文本检测和识别的精度超过人类,以及将文本检测和文字识别端到端同时处理,以此提升OCR的效率。本发明属于OCR流程中图像预处理的去噪部分。

如前所述,图像的去噪对于OCR乃至CV领域各类应用都必不可少。图片类文档根据来源的不同伴随着各样的噪声,譬如传真文件有倾斜、椒盐、模糊等可能的噪声,照片类文件则有遮挡、光照等噪声。深度学习的出现,使得此前干扰识别精度的一些噪声不再致命,其原因是,不同于传统OCR将去噪和特征提取分开处理,深度学习认为不同背景不同噪声的图像,都能被拥有足够表现力的深度网络模型所拟合。这也是使用深度学习的OCR技术有如此表现的一大原因。然而我们需要认识到,高质量、低干扰的图片总是更易识别的,所以预处理的过程仍对OCR技术的进一步提升起着关键作用。

发明内容

有鉴于此,本发明的主要目的在于提供了一种图片类文档盲去噪系统、方法及装置,能够完美适配深度网络模型,作为OCR的预处理模块,进一步提升OCR的表现。其次,本发明还很大程度上解决了不同去噪算法的兼容问题,从而减低去噪过程耗时,提升效率。。

为达到上述目的,本发明的技术方案是这样实现的:

一种图片类文档盲去噪系统,所述系统包括:

预处理单元,对待处理图片进行高斯模糊处理、灰度化处理和二值化处理,生成第一处理结果;

直线检测单元,对第一处理结果进行直线检测,生成第一检测结果;

表格检测单元,在第一检测结果的基础上,进行表格检测,生成第二检测结果;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海怀若智能科技有限公司,未经上海怀若智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910275858.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top