[发明专利]表格结构的识别方法及装置有效
| 申请号: | 202010462936.1 | 申请日: | 2020-05-27 |
| 公开(公告)号: | CN111797685B | 公开(公告)日: | 2022-04-15 |
| 发明(设计)人: | 李壮 | 申请(专利权)人: | 贝壳找房(北京)科技有限公司 |
| 主分类号: | G06V30/412 | 分类号: | G06V30/412;G06V30/414;G06V30/19;G06N3/04 |
| 代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 张秀程 |
| 地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 表格 结构 识别 方法 装置 | ||
本发明实施例提供一种表格结构的识别方法及装置,其中,识别方法包括:将具有表格结构的目标图像输入至预先训练的神经网络模型中,获得目标图像中的表格线段;根据目标图像中的表格线段获得表格结构;其中,神经网络模型为改进的L‑CNN模型,改进的L‑CNN模型以具有表格结构的样本图像作为样本,以样本图像中的表格线段作为样本标签训练而成;样本图像中弯曲的表格线段用由多条连续的直线线段构成的折线进行表征;改进的L‑CNN模型中的线特征图损失占计算损失时的比重大于点特征图损失。本发明实施例使得改进的L‑CNN模型能够很好地应用于表格识别领域,相比现有技术的识别效率和准确率具有显著的提高。
技术领域
本发明涉及图像处理技术领域,更具体地,涉及表格结构的识别方法及装置。
背景技术
表格作为一种有效的数据组织与展现方法被广泛应用,也成为各类文档中常见的页面对象,如科学期刊,报告,财务报表等。通常人们需要手动处理表格文档,提取和采集需要的信息,而随着文档数目的爆炸性增长,这将会耗费巨大的人力成本。
由于光学字符识别(Optical Character Recognition,OCR)技术的发展,人们开始利用深度学习技术提取图片中的有效文字信息,并且取得了一定的成果。表格作为特殊形式的信息载体,不同于单纯的文字OCR,它需要严格的行列对应关系,并提取出每个单元格中的文字内容以及单元格与单元格之间的相互关系。因此,表格结构提取就成为了表格信息结构化提取的前置任务,如何高效地从表格中获取内容与结构信息即表格结构识别,成为了一个亟待解决的问题。
发明内容
本发明实施例提供一种克服上述问题或者至少部分地解决上述问题的表格结构的识别方法及装置。
第一个方面,本发明实施例提供一种表格结构的识别方法,包括:
将具有表格结构的目标图像输入至预先训练的神经网络模型中,获得所述目标图像中的表格线段;
根据所述目标图像中的表格线段获得表格结构;
其中,所述神经网络模型为改进的L-CNN模型,所述改进的L-CNN模型以具有表格结构的样本图像作为样本,以所述样本图像中的表格线段作为样本标签训练而成;
所述样本图像中弯曲的表格线段用由多条连续的直线线段构成的折线进行表征;
所述改进的L-CNN模型中的线特征图损失占计算损失时的比重大于点特征图损失。
进一步地,所述根据所述目标图像中的表格线段获得表格结构,具体为:
根据表格线段的倾角,将表格线段定义为水平线段或者竖直线段;将符合夹角和距离要求的水平/竖直线段进行合并,获得水平/竖直框线;
确定水平框线和竖直框线的所有交点,从所述所有交点中选择一个交点作为起点,查找与所述交点构成最小表格单元的其他交点,直至所有交点所在的最小表格单元查找完毕。
进一步地,所述根据表格线段的倾角,将表格线段定义为水平线段或者竖直线段,具体为:
在所述目标图像中确定水平的基准线,计算表格线段与所述基准线的夹角,作为表格线段的倾角;将倾角大于45°的表格线段定义为竖直线段,将倾角小于45°的表格线段定义为水平线段。
进一步地,所述将符合夹角和距离要求的水平/竖直线段进行合并,获得水平/竖直框线,具体为:
创建第一集合,对水平线段执行以下操作,直至所有水平线段执行完毕:对于当前操作的水平线段,判断所述水平线段与所述第一集合中的各子集合中的水平线段是否符合合并条件;若符合,则将所述水平线段归入符合合并条件的子集合中,若不符合,则在所述第一集合中创建新的子集合,并将所述水平线段归入所述新的子集合;在所有水平线段执行完毕后,将第一集合中的每个子集合的水平线段合并为一条水平框线;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贝壳找房(北京)科技有限公司,未经贝壳找房(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010462936.1/2.html,转载请声明来源钻瓜专利网。





