[发明专利]一种纸质表格中表格框检测方法在审
| 申请号: | 202210632922.9 | 申请日: | 2022-06-01 |
| 公开(公告)号: | CN114973289A | 公开(公告)日: | 2022-08-30 |
| 发明(设计)人: | 张新娜;翁佳成;项雄标 | 申请(专利权)人: | 中国计量大学 |
| 主分类号: | G06V30/414 | 分类号: | G06V30/414;G06V30/413 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 310000 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 纸质 表格 检测 方法 | ||
本发明提出了一种纸质表格中表格框检测方法,所述方法包括:S1,获取拍摄的纸质表格图像;S2,对图像表格进行倾斜矫正,使得图像中的表格处于水平状态;S3,获取倾斜矫正后图像表格的二值化横纵表格框线图;S4,对图像表格进行从原图像到标准图像的映射转换;S5,将各个表格框从标准图像表格中裁剪出来并标号。本发明能够解决人工拍摄纸质表格过程中存在图像表格倾斜问题和拍摄的图片由于纸张不平整的原因导致图像中表格线的表格线扭曲问题,从而实现将图像中的表格框进行有效裁剪,为图像表格下一步的表格框内容识别提供基础。
技术领域
本发明属于图像处理领域,尤其涉及一种纸质表格中表格框检测方法。
背景技术
表格文档作为文本文档的重要形式之一,广泛应用于工业生产、工作学习和生活中并起着重要的作用。传统纸质表格存储为电子表格大多采用人工录入,存在工作量大、繁琐和准确率低等问题。伴随着人工智能和大数据的快速发展,就需要加快文档识别技术的发展以实现信息的数字化管理。
纸质表格在图像处理技术和深度学习网络实现数字化的过程中,面对纸质表格中表格框检测研究至少存在以下缺点:1、人工拍摄纸质表格的过程中存在图像倾斜问题;2、拍摄的图片由于纸张不平整原因导致图像中表格线发生扭曲问题;3、在检测图像表格框的端点坐标中,因图片中噪点等问题,无法提取到表格框的有效坐标,从而无法进一步分割表格框。
发明内容
本发明提出一种纸质表格中表格框检测方法,通过图像处理技术,解决纸质表格中表格框检测存在的图片表格倾斜、图片表格框线扭曲和表格框坐标的有效提取问题,为图像表格下一步的表格框内容识别提供基础。
为实现上述目的,本发明采用以下技术方案来实现,具体包括以下步骤:
步骤S1:获取拍摄的纸质表格图像;
步骤S2:对图像表格进行倾斜矫正,使得图像中的表格处于水平状态;
步骤S3:获取倾斜矫正后图像表格的二值化横纵表格框线图;
步骤S4:对图像表格进行从原图像到标准图像的映射转换;
步骤S5:将各个表格框从标准图像表格中裁剪出来并标号。
进一步地,所述步骤S2具体包括:
步骤S21:将获取的纸质表格彩色图像转换为灰度图像;
步骤S22:使用高斯模糊算法对表格的灰度图进行降噪,使用自动阈值得到二值化图像;
步骤S23:将二值化图像进行开运算和闭运算操作。开运算对图像进行先腐蚀后膨胀,能够消除小物体,同时不明显改变其面积。闭运算对图像进行先膨胀后腐蚀,能够排除小型空洞,同时也能够填补断裂的轮廓线;
步骤S24:在二值化图像中检索矩形轮廓,获取二值化图像中最大轮廓矩形表格框,并得到最大轮廓矩形表格框的四个顶点坐标值;
步骤S25:通过计算最大轮廓矩形表格框的四个顶点坐标值,对图像表格进行倾斜矫正工作。
进一步地,所述步骤S3具体包括:
步骤S31:将倾斜矫正都图像表格的彩色图像转换为灰度图像;
步骤S32:对图像表格灰度图的基础上运用了adaptiveThreshold来达成自动阈值的二值化,从而获得图像表格的二值化图像;
步骤S33:对获取的二值化图像进行先腐蚀后膨胀,设置腐蚀和膨胀的操作区域为一个比较大的横向直条,从而得到图像表格水平方向腐蚀膨胀图;
步骤S34:对获取的二值化图像进行先腐蚀后膨胀,设置腐蚀和膨胀的操作区域为一个宽为1的竖向直条,从而得到图像表格竖直方向腐蚀膨胀图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国计量大学,未经中国计量大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210632922.9/2.html,转载请声明来源钻瓜专利网。





