[发明专利]处理表格的方法、计算设备和计算机可读存储介质有效
| 申请号: | 202110616829.4 | 申请日: | 2021-06-03 |
| 公开(公告)号: | CN113065536B | 公开(公告)日: | 2021-09-14 |
| 发明(设计)人: | 张世坤;李景阳 | 申请(专利权)人: | 北京欧应信息技术有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34 |
| 代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 酆迅 |
| 地址: | 100020 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 处理 表格 方法 计算 设备 计算机 可读 存储 介质 | ||
1.一种处理表格的方法,包括:
对扭曲图像进行文本框检测,以获取所述扭曲图像中的多个文本框的位置数据;
对所述扭曲图像进行表格线检测,以获取所述扭曲图像中的多条表格线;
基于所述多个文本框的位置数据,通过最大匹配行列算法确定多个第一单元格;
基于所述多条表格线对所述多个第一单元格进行曲线拟合以确定每个第一单元格周围的拟合曲线段和延长线数据;以及
基于每个第一单元格周围的拟合曲线段和延长线数据对所述多个第一单元格进行连通域校正以确定所述表格的多个单元格和每个单元格中的文本内容,
其中所述多个文本框的位置数据包括每个文本框的顶点坐标、中心点坐标、宽度数据和高度数据,并且其中通过最大匹配行列算法确定多个第一单元格包括:
将所述多个文本框按照中心点坐标排列;
分别确定所述多个文本框的至少一个水平配对组合和至少一个垂直配对组合,其中每个水平配对组合包括一个或多个水平配对,每个水平配对包括一个文本框及其下一水平文本框,每个垂直配对组合包括一个或多个垂直配对,每个垂直配对包括一个文本框及其下一垂直文本框;
从所述至少一个水平配对组合中选择水平配对数量最多的一个水平配对组合来确定所述多个文本框的水平向量,并且从所述至少一个垂直配对组合中选择垂直配对数量最多的一个垂直配对组合来确定所述多个文本框的垂直向量;
基于所述多个文本框的水平向量和垂直向量确定所述多个文本框的第一方向和第二方向,其中所述第二方向垂直于所述第一方向;以及
基于所述多个文本框的位置数据、所述第一方向和所述第二方向确定所述多个第一单元格。
2.如权利要求1所述的方法,其中分别确定所述多个文本框的至少一个水平配对组合和至少一个垂直配对组合包括:
对于所述多个文本框中的一个目标文本框,确定所述目标文本框的下一水平文本框与所述目标文本框的上边距或者下边距是否小于第一预定阈值;
如果确定所述目标文本框的下一水平文本框与所述目标文本框的上边距或者下边距小于所述第一预定阈值,确定所述下一水平文本框与所述目标文本框的中心位置距离是否大于第二预定阈值;
如果确定所述下一水平文本框与所述目标文本框的中心位置距离大于所述第二预定阈值,将所述目标文本框和所述下一水平文本框组织成标记为第一值的水平配对;以及
如果确定所述下一水平文本框与所述目标文本框的上边距或者下边距大于或等于所述第一预定阈值,或者确定所述下一水平文本框与所述目标文本框的中心位置距离小于或等于所述第二预定阈值,将所述目标文本框和所述下一水平文本框组织成标记为第二值的水平配对。
3.如权利要求1所述的方法,其中分别确定所述多个文本框的至少一个水平配对组合和至少一个垂直配对组合包括:
对于所述多个文本框中的一个目标文本框,确定所述目标文本框的下一垂直文本框与所述目标文本框的左边距或者右边距是否小于第一预定阈值;
如果确定所述目标文本框的下一垂直文本框与所述目标文本框的左边距或者右边距小于所述第一预定阈值,确定所述下一垂直文本框与所述目标文本框的中心位置距离是否大于第二预定阈值;
如果确定所述下一垂直文本框与所述目标文本框的中心位置距离大于所述第二预定阈值,将所述目标文本框和所述下一垂直文本框组织成标记为第一值的垂直配对;以及
如果确定所述下一垂直文本框与所述目标文本框的左边距或者右边距大于或等于所述第一预定阈值,或者确定所述下一垂直文本框与所述目标文本框的中心位置距离小于或等于所述第二预定阈值,将所述目标文本框和所述下一垂直文本框组织成标记为第二值的垂直配对。
4.如权利要求1所述的方法,其中确定每个第一单元格周围的拟合曲线段和延长线数据包括:
基于所述多个第一单元格周围的表格线拟合所述多个第一单元格的周围曲线,并且为每个第一单元格记录该周围曲线在所述第一单元格周围的拟合曲线段;以及
基于所述多个第一单元格的周围曲线,确定所述第一单元格的前一第一单元格的拟合曲线段作为所述第一单元格的延长线数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京欧应信息技术有限公司,未经北京欧应信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110616829.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种系统评测方法及装置
- 下一篇:一种可见光激发的智能隔热变色的玻璃幕墙系统





