[发明专利]表格检测方法和装置有效
| 申请号: | 202110195238.4 | 申请日: | 2021-02-22 |
| 公开(公告)号: | CN112560820B | 公开(公告)日: | 2021-06-01 |
| 发明(设计)人: | 孔令军 | 申请(专利权)人: | 金陵科技学院 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 张芳 |
| 地址: | 211112 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 表格 检测 方法 装置 | ||
1.一种表格检测方法,其特征在于,包括以下步骤,
获取包含表格的图片;
利用交叉点峰值图模型对所述表格进行预测,获取所述表格中交叉点的峰值图;
将所述交叉点的峰值图转换成交叉点坐标;
按照原表格结构连接各交叉点,得到完整的表格;
其中所述交叉点峰值图模型的构造过程为:
人工标记样本表格中的所有交叉点的坐标;
将所述交叉点通过高斯分布转换为峰值图;
利用卷积网络对多个样本表格进行训练,得到所述交叉点峰值图模型;
所述利用交叉点峰值图模型对所述表格进行预测,获取所述表格中交叉点的峰值图后,图中任意点p的峰值概率符合以下公式
其中,j表示交叉点,p代表峰值图中的某个点,lk代表图片里对p点影响最大的交叉点,Dist(p,lk)表示p点与lk点之间的距离;σ表示控制峰值概率的衰减速度。
2.根据权利要求1所述的表格检测方法,其特征在于,所述峰值图中的任意点p受到同一表格中多个交叉点影响,选取受影响最大的交叉点计算其峰值概率。
3.根据权利要求1所述的表格检测方法,其特征在于,所述利用交叉点峰值图模型对所述表格进行预测,获取所述表格中交叉点的峰值图具体为,
将包含待检测表格的图片作为所述交叉点峰值图模型的输入,获取峰值图;
遍历所述峰值图中的所有点,判断当前点的峰值大小,如果当前点的峰值大于其周围点的峰值,则当前点为峰值点;
将低于预设阈值的峰值点过滤掉,剩下的峰值点为表格中的交叉点。
4.根据权利要求1所述的表格检测方法,其特征在于,在所述交叉点峰值图模型的构造过程中还包括样本增强过程,具体为依次经过随机亮度、随机对比度、随机旋转、随机平移,并将图片切割成固定大小的多个小图片。
5.一种表格检测装置,其特征在于,包括
图片获取模块,用于获取包含表格的图片;
交叉点峰值图模型,用于对所述表格进行预测,得到所述交叉点的峰值图;
表格重构模块,用于将所述交叉点的峰值图转换成交叉点坐标,并按照原表格结构连接各交叉点,得到完整的表格;
所述交叉点峰值图模型包括:
峰值图转换子模块,用于将包含待检测表格的图片中的交叉点通过高斯分布转换成峰值图;
峰值点判断子模块,用于判断交叉点峰值图中任意点p的峰值,p的峰值概率符合以下公式
其中,j表示交叉点,p代表峰值图中的某个点,lk代表图片里对p点影响最大的交叉点,Dist(p,lk)表示p点与lk点之间的距离;σ表示控制峰值概率的衰减速度。
6.根据权利要求5所述的表格检测装置,其特征在于,所述交叉点峰值图模型还包括交叉点识别子模块,用于将低于预设阈值的峰值点过滤掉,剩下的峰值点为表格中的交叉点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于金陵科技学院,未经金陵科技学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110195238.4/1.html,转载请声明来源钻瓜专利网。





