[发明专利]用于不规则表格图像拉平的表格结构检测方法在审
申请号: | 202210727928.4 | 申请日: | 2022-06-23 |
公开(公告)号: | CN115171133A | 公开(公告)日: | 2022-10-11 |
发明(设计)人: | 冯杰;孟泽正;刘新天;朱明航;张海翔 | 申请(专利权)人: | 浙江理工大学 |
主分类号: | G06V30/412 | 分类号: | G06V30/412;G06V30/414;G06V30/146;G06V30/18 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 王琛 |
地址: | 310018 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 不规则 表格 图像 拉平 结构 检测 方法 | ||
本发明公开了一种用于不规则表格图像拉平的表格结构检测方法,包括:1.对原始图像进行表格区域检测,得到表格区域图片;2.对表格区域图片进行表格规范性检查;3.对不符合规范的表格区域图片进行预处理;4.对表格区域图片进行边框识别。本发明采用了一种新的方法一种能将不规则的表格进行预处理拉平的技术,使得表格变得规则,该方法可以有效的解决表格不规则的问题,从而提升算法的可操作性,也能提取不规则表格的语义信息,并且该算法相比较于深度学习的算法而言有省去了训练模型的时间,大大提高了识别表格的时间效率。
技术领域
本发明属于图像检测技术领域,具体涉及一种用于不规则表格图像拉平的表格结构检测方法。
背景技术
OCR是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程,这种算法可以将扫描文档的数字图像转换为机器可读的信息。而表格文字识别则是OCR中的一种检测表格图片的技术,该技术可以应用于教育行业、金融行业等领域,比如可以解析图片上的学生各科成绩自动录入系统;在金融行业,可以通过纸质报表去解析表中数据,可以进行录入,表格文字识别这项技术对人们的日常生活有着重要的实际意义。
表格文字识别可以简单地分为两部分:一部分是图像中表格的目标检测,目前常用的目标检测算法进行对于图片中的表格进行位置识别,这些方法在提取表格边框上,应该是效果属于十分理想的。另一部分是进行表格内结构识别,目前的表格识别技术方案包括:(1)使用图像处理方法对表格线进行分割;(2)根据文字检测坐标编写规则进行表格重建;(3)使用深度学习方法对表格线进行分割,使用规则进行表格重建;该技术方案使用的是图像处理方法对表格线进行分割,这种相对于用深度学习的方法检测表格结构速度更快,也更加的直观,且针对pdf内的表格结构提取效果十分理想,但是对于用户自己拍摄的照片或者是一些歪斜的表格来说,自然检测表格结构的效果就会变得很差。
公开号为CN110163198A的中国专利提供了一种表格识别重建的方法,该方法采用了表格框线模型对表格进行框线分割,从分割图像中检测表格的行线和列线得到它们的位置信息,根据表格线的位置信息以及单元格的位置信息生成相应格式的电子表格文件,但其缺点在于针对那些不规则的表格图片,需要人工确认生成的边框是否合理,并且该专利技术针对的是表格的重建,并无法对原图中的表格做出真正的表格语义,就无法进行之后表格内文字识别。
公开号为CN106407883A的中国专利提供了一种复杂表格及其内部手写数字识别方法,其先对复杂表格模板进行预处理、直线检测、角点集的行列分类排序、模板表格定来实现对单元格的结构描述,在获得电子手写表格后,对其进行倾斜矫正并与模板表格适配,获得其单元格位置描述,随后对每个单元格进行处理,去除边线的同时,尽可能完整地保留单元格内的字符,然后提取单元格中数字图像,通过对数据集训练好的分类器,对数字图像进行识别,最后对手写字符进行后处理,将识别结果填入模板表格中;但其缺点是在图片预处理过程中,只针对纸质手写表格文档,并不对那些拍摄的表格照片进行预处理。
发明内容
鉴于上述,本发明提供了一种用于不规则表格图像拉平的表格结构检测方法,使得表格变得规则,该方法可以有效的解决表格不规则的问题,从而提升算法的效率以及可操作性。
一种用于不规则表格图像拉平的表格结构检测方法,包括如下步骤:
(1)对原始图像进行表格区域检测,得到表格区域图片;
(2)对所述表格区域图片进行表格规范性检查;
(3)对不符合规范的表格区域图片进行预处理;
(4)对表格区域图片进行边框识别。
进一步地,所述步骤(1)的具体实现方式为:将含有表格的原始图像输入预训练的深度学习目标检测模型中,以检测输出图像中表格的区域位置信息,进而对表格进行提取,得到一张经裁剪后的表格区域图片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江理工大学,未经浙江理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210727928.4/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序