[发明专利]处理表格的方法、计算设备和计算机可读存储介质有效

专利信息
申请号: 202110616829.4 申请日: 2021-06-03
公开(公告)号: CN113065536B 公开(公告)日: 2021-09-14
发明(设计)人: 张世坤;李景阳 申请(专利权)人: 北京欧应信息技术有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/34
代理公司: 北京市金杜律师事务所 11256 代理人: 酆迅
地址: 100020 北京*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 处理 表格 方法 计算 设备 计算机 可读 存储 介质
【权利要求书】:

1.一种处理表格的方法,包括:

对扭曲图像进行文本框检测,以获取所述扭曲图像中的多个文本框的位置数据;

对所述扭曲图像进行表格线检测,以获取所述扭曲图像中的多条表格线;

基于所述多个文本框的位置数据,通过最大匹配行列算法确定多个第一单元格;

基于所述多条表格线对所述多个第一单元格进行曲线拟合以确定每个第一单元格周围的拟合曲线段和延长线数据;以及

基于每个第一单元格周围的拟合曲线段和延长线数据对所述多个第一单元格进行连通域校正以确定所述表格的多个单元格和每个单元格中的文本内容,

其中所述多个文本框的位置数据包括每个文本框的顶点坐标、中心点坐标、宽度数据和高度数据,并且其中通过最大匹配行列算法确定多个第一单元格包括:

将所述多个文本框按照中心点坐标排列;

分别确定所述多个文本框的至少一个水平配对组合和至少一个垂直配对组合,其中每个水平配对组合包括一个或多个水平配对,每个水平配对包括一个文本框及其下一水平文本框,每个垂直配对组合包括一个或多个垂直配对,每个垂直配对包括一个文本框及其下一垂直文本框;

从所述至少一个水平配对组合中选择水平配对数量最多的一个水平配对组合来确定所述多个文本框的水平向量,并且从所述至少一个垂直配对组合中选择垂直配对数量最多的一个垂直配对组合来确定所述多个文本框的垂直向量;

基于所述多个文本框的水平向量和垂直向量确定所述多个文本框的第一方向和第二方向,其中所述第二方向垂直于所述第一方向;以及

基于所述多个文本框的位置数据、所述第一方向和所述第二方向确定所述多个第一单元格。

2.如权利要求1所述的方法,其中分别确定所述多个文本框的至少一个水平配对组合和至少一个垂直配对组合包括:

对于所述多个文本框中的一个目标文本框,确定所述目标文本框的下一水平文本框与所述目标文本框的上边距或者下边距是否小于第一预定阈值;

如果确定所述目标文本框的下一水平文本框与所述目标文本框的上边距或者下边距小于所述第一预定阈值,确定所述下一水平文本框与所述目标文本框的中心位置距离是否大于第二预定阈值;

如果确定所述下一水平文本框与所述目标文本框的中心位置距离大于所述第二预定阈值,将所述目标文本框和所述下一水平文本框组织成标记为第一值的水平配对;以及

如果确定所述下一水平文本框与所述目标文本框的上边距或者下边距大于或等于所述第一预定阈值,或者确定所述下一水平文本框与所述目标文本框的中心位置距离小于或等于所述第二预定阈值,将所述目标文本框和所述下一水平文本框组织成标记为第二值的水平配对。

3.如权利要求1所述的方法,其中分别确定所述多个文本框的至少一个水平配对组合和至少一个垂直配对组合包括:

对于所述多个文本框中的一个目标文本框,确定所述目标文本框的下一垂直文本框与所述目标文本框的左边距或者右边距是否小于第一预定阈值;

如果确定所述目标文本框的下一垂直文本框与所述目标文本框的左边距或者右边距小于所述第一预定阈值,确定所述下一垂直文本框与所述目标文本框的中心位置距离是否大于第二预定阈值;

如果确定所述下一垂直文本框与所述目标文本框的中心位置距离大于所述第二预定阈值,将所述目标文本框和所述下一垂直文本框组织成标记为第一值的垂直配对;以及

如果确定所述下一垂直文本框与所述目标文本框的左边距或者右边距大于或等于所述第一预定阈值,或者确定所述下一垂直文本框与所述目标文本框的中心位置距离小于或等于所述第二预定阈值,将所述目标文本框和所述下一垂直文本框组织成标记为第二值的垂直配对。

4.如权利要求1所述的方法,其中确定每个第一单元格周围的拟合曲线段和延长线数据包括:

基于所述多个第一单元格周围的表格线拟合所述多个第一单元格的周围曲线,并且为每个第一单元格记录该周围曲线在所述第一单元格周围的拟合曲线段;以及

基于所述多个第一单元格的周围曲线,确定所述第一单元格的前一第一单元格的拟合曲线段作为所述第一单元格的延长线数据。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京欧应信息技术有限公司,未经北京欧应信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110616829.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top