[发明专利]图像处理方法、装置、电子设备及介质有效

专利信息
申请号: 201810983676.5 申请日: 2018-08-27
公开(公告)号: CN109117814B 公开(公告)日: 2020-11-03
发明(设计)人: 韩月;刘永强;桂晨光;邓超;王超 申请(专利权)人: 京东数字科技控股有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/32
代理公司: 北京律智知识产权代理有限公司 11438 代理人: 袁礼君;阚梓瑄
地址: 北京市北京经济技术开发*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 图像 处理 方法 装置 电子设备 介质
【说明书】:

本公开提供了一种图像处理方法,包括:获取图像,所述图像包括表格类票据图像;根据所述表格类票据图像,确定所述表格类票据图像中标志性区域的第一位置;根据所述标志性区域的第一位置,确定所述表格类票据图像的待识别区域的位置;根据所述标志性区域的第一位置和所述待识别区域的位置,构建所述表格类票据图像中票据的表格模板;根据所述表格类票据图像中票据的票据类型和所述票据类型的先验知识,对所述表格类票据图像中票据的表格模板进行解析,得到所述待识别区域的文字条目。本公开还提供了一种图像处理装置、电子设备及介质。

技术领域

本公开涉及图像处理的技术领域,尤其涉及一种图像处理方法、装置、电子设备及介质。

背景技术

目前,文字定位是指利用计算机视觉及图像处理技术,判断图像中是否存在文字,以及图像中文字的位置。该技术作为光学识别技术中的关键一环,是决定图像识别性能好坏的重要步骤。文字定位技术在自然场景类、纸质扫描类及通用文本场景已经得到了广泛应用。目前文字定位主要包括以下几种方法:(1)基于图像二值化或边缘特征的传统定位方法,首先使用Canny或其它边缘检测算法检测图像边缘,然后对图像边缘进行连通域分析,根据连通域高度等特征信息进行生长合并,最后得到可能的文字行区域;(2)基于深度神经网络的文字目标定位方法,如CTPN、TextBoxes等:首先使用大量包含字符的图像数据,对深度神经网络进行训练,让网络自动学习图像中的字符特征,然后利用学到的字符特征对文字区域进行外边框回归。

在实现本发明的构思过程中,发明人发现现有技术存在以下问题:(1)表格类票据图像中包含大量的表格线,表格线具有明显的阶跃边缘特性,其边缘梯度的变化剧烈程度远大于文字,而二值化边缘特征依赖于梯度的变化程度,因此会对表格线周围文字的边缘特征提取造成极大的影响,造成文字定位困难;(2)CTPN、TextBoxes等文字目标定位方法,对小目标定位效果较差。由于表格类票据中文字目标尺度较小,边缘特征较弱,在定位文字边框时,边框线经常会有一定的波动,因此,在文字定位时无法很好逼近文字边缘,造成文本区域内仅包含部分文字或者包含噪声,对后续识别造成严重影响。

发明内容

有鉴于此,本公开提供一种图像处理方法、装置、电子设备及介质,进而至少部分地解决了由于相关技术的限制和缺陷而导致的一个或者多个问题。

本公开的第一个方面提供了一种图像处理方法,包括:获取图像,所述图像包括表格类票据图像;根据所述表格类票据图像,确定所述表格类票据图像中标志性区域的第一位置;根据所述标志性区域的第一位置,确定所述表格类票据图像的待识别区域的位置;根据所述标志性区域的第一位置和所述待识别区域的位置,构建所述表格类票据图像中票据的表格模板;根据所述表格类票据图像中票据的票据类型和所述票据类型的先验知识,对所述表格类票据图像中票据的表格模板进行解析,得到所述待识别区域的文字条目。

根据本公开的实施例,根据所述标志性区域的第一位置和所述待识别区域的位置,构建所述表格类票据图像中票据的表格模板包括:根据所述待识别区域的位置对所述待识别区域进行检测,得到所述待识别区域的表格线;根据所述待识别区域的表格线校正所述标志性区域的第一位置,得到所述标志性区域的第二位置;根据所述标志性区域的第二位置对所述标志性区域进行检测,得到所述标志性区域的表格线;基于所述标志性区域的表格线和所述待识别区域的表格线,生成所述表格类票据图像中票据的表格模板。

根据本公开的实施例,对所述表格类票据图像中票据的表格模板进行解析包括:对所述表格类票据图像中票据的表格模板进行分割,得到多个表格单元;对所述多个表格单元中的文字分别进行投影。

根据本公开的实施例,该方法还包括:对所述表格类票据图像进行预处理,所述预处理包括以下任意一项或多项倾斜校正、透视校正、噪声去除;对预处理后的表格类票据图像中的标志性区域进行标注;利用标注后的表格类票据图像对卷积神经网络进行训练,得到定位网络。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东数字科技控股有限公司,未经京东数字科技控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810983676.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top