[发明专利]用于不规则表格图像拉平的表格结构检测方法在审
| 申请号: | 202210727928.4 | 申请日: | 2022-06-23 |
| 公开(公告)号: | CN115171133A | 公开(公告)日: | 2022-10-11 |
| 发明(设计)人: | 冯杰;孟泽正;刘新天;朱明航;张海翔 | 申请(专利权)人: | 浙江理工大学 |
| 主分类号: | G06V30/412 | 分类号: | G06V30/412;G06V30/414;G06V30/146;G06V30/18 |
| 代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 王琛 |
| 地址: | 310018 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 不规则 表格 图像 拉平 结构 检测 方法 | ||
1.一种用于不规则表格图像拉平的表格结构检测方法,包括如下步骤:
(1)对原始图像进行表格区域检测,得到表格区域图片;
(2)对所述表格区域图片进行表格规范性检查;
(3)对不符合规范的表格区域图片进行预处理;
(4)对表格区域图片进行边框识别。
2.根据权利要求1所述的表格结构检测方法,其特征在于:所述步骤(1)的具体实现方式为:将含有表格的原始图像输入预训练的深度学习目标检测模型中,以检测输出图像中表格的区域位置信息,进而对表格进行提取,得到一张经裁剪后的表格区域图片。
3.根据权利要求1所述的表格结构检测方法,其特征在于:所述步骤(2)的具体实现过程如下:
2.1将表格区域图片转为灰度图,接着使用自适应阈值对灰度图进行二值化处理和膨胀操作;
2.2对经步骤2.1处理后的图片进行轮廓边缘检测,检测出图片中表格的所有框线并对这些框线进行膨胀操作;
2.3根据各框线的坐标位置信息从图片中找出面积最大的轮廓,该轮廓即为表格轮廓;
2.4根据表格轮廓四个顶点的坐标信息判断表格是否规范。
4.根据权利要求3所述的表格结构检测方法,其特征在于:所述步骤2.4中判断表格是否规范的标准为:若满足以下所有条件的则判定表格符合规范,否则判定表格不符合规范;
y1∈[y2-5,y2+5]y3∈[y4-5,y4+5]
x1∈[x3-10,x3+10]x2∈[x4-10,x4+10]
其中:表格轮廓左上角顶点的坐标为(x1,y1),右上角顶点的坐标为(x2,y2),左下角顶点的坐标为(x3,y3),右下角顶点的坐标为(x4,y4)。
5.根据权利要求1所述的表格结构检测方法,其特征在于:所述步骤(3)的具体实现过程如下:
3.1将不符合规范的表格区域图片转为灰度图,接着使用自适应阈值对灰度图进行二值化处理和膨胀操作;
3.2对经步骤3.1处理后的图片进行轮廓边缘检测,检测出图片中表格的所有框线并对这些框线进行膨胀操作;
3.3根据各框线的坐标位置信息从图片中找出面积最大的轮廓,该轮廓即为表格轮廓;
3.4对于表格轮廓的四条曲线,利用边缘检测得到的轮廓点坐标通过最小二乘法拟合出这四条曲线的曲线函数;
3.5对于任一条曲线,将其细分成多段,每段可视为直线,利用曲线函数计算获得每段直线首末两点的坐标,进而计算出每段直线的长度,累加后即作为曲线的长度;
3.6利用表格轮廓四个顶点的坐标信息以及四条曲线的长度,通过透视变换对表格区域图片进行矫正。
6.根据权利要求5所述的表格结构检测方法,其特征在于:所述步骤3.6的具体实现方式为:首先将表格轮廓按10×10分割成多个区块,根据四个顶点的坐标信息以及四条曲线的长度计算获得每个区块四个顶点的坐标;然后将表格轮廓下边和左边两条曲线作分别为新坐标系中的x轴和y轴,换算出每个区块四个顶点在新坐标系中的坐标,进而根据这些点在原坐标系和新坐标系中的坐标通过透视变换将表格区域图片投影到一个新的视平面,从而完成矫正。
7.根据权利要求1所述的表格结构检测方法,其特征在于:所述步骤(4)的具体实现过程如下:
4.1将表格区域图片转为灰度图,接着使用自适应阈值对灰度图进行二值化处理,并做图像预处理;
4.2对预处理后的图片依次进行侵蚀和膨胀处理,从而获得一幅有水平线图像和一幅垂直线图像;
4.3将水平线图像和垂直线图像进行结合处理,得到一幅完整的光栅单元图像,并对该图像继续进行侵蚀处理;
4.4最后通过边缘检测获得光栅单元图像中各单元格的坐标数据,生成各个单元格信息的文本文件。
8.根据权利要求7所述的表格结构检测方法,其特征在于:所述步骤4.2中对图片进行膨胀处理的公式如下:
dilation(x,y)=max(x′,y′):k(x′,y′)≠0I(x+x′,y+y′)
对图片进行侵蚀处理的公式如下:
erosion(x,y)=min(x′,y′):k(x′,y′)≠0I(x+x′,y+y′)
其中:I为需要进行操作的图像,k为操作的卷积内核,x'和y'为卷积内核的尺寸,(x,y)为图像的像素点坐标,卷积计算后该像素点的值等于以该像素点为中心的x'*y'范围内的最大值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江理工大学,未经浙江理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210727928.4/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





