[发明专利]表格识别方法和装置、计算机可读存储介质在审
| 申请号: | 201911357969.3 | 申请日: | 2019-12-25 |
| 公开(公告)号: | CN111144282A | 公开(公告)日: | 2020-05-12 |
| 发明(设计)人: | 祁立 | 申请(专利权)人: | 北京同邦卓益科技有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32 |
| 代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 王莉莉 |
| 地址: | 100176 北京市大兴区北京经济技*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 表格 识别 方法 装置 计算机 可读 存储 介质 | ||
1.一种表格识别方法,包括:
识别待识别表格的第一轮廓线;
根据第一轮廓线,确定待识别表格的多个第一文字区域;
对多个第一文字区域分别按行和列进行聚类,以计算待识别表格的行列分割点;
根据行列分割点,识别待识别表格的第二轮廓线;
根据第二轮廓线,确定待识别表格的多个第二文字区域,每个第二文字区域对应一个单元格;
使用文本识别模型,识别每个第二文字区域中的文字;
将识别出的各个第二文字区域中的文字内容分别填入相应的单元格中。
2.根据权利要求1所述的表格识别方法,其中,对多个第一文字区域分别按照行和列进行聚类,以计算待识别表格的行列分割点包括:
提取多个第一文字区域的行坐标区间段和列坐标区间段;
分别根据行坐标区间段、列坐标区间段的交叠程度,判断是否合并相应的第一文字区域;
基于合并的结果,计算待识别表格的行列分割点。
3.根据权利要求2所述的表格识别方法,其中,判断是否合并相应的第一文字区域包括:
分别对第一文字区域的行坐标区间段、列坐标区间段有交叠的情况确定聚类评分;
在合并后的聚类评分大于合并前的聚类评分的情况下,判断为合并相应的第一文字区域。
4.根据权利要求3所述的表格识别方法,其中,分别对第一文字区域的行坐标区间段、列坐标区间段有交叠的情况确定聚类评分包括:
将提取出的行坐标区间段或列坐标区间段视为样本,样本数记为N,N为大于1的自然数;
根据聚类内有交集的样本对的数目和不同聚类间无交集的样本对的数目,对第一文字区域的行坐标区间段或列坐标区间段有交叠的情况确定聚类评分。
5.根据权利要求4所述的表格识别方法,其中:
聚类评分与聚类内有交集的样本对的数目正相关,与不同聚类间无交集的样本对的数目负相关。
6.根据权利要求1至5中任一项所述的表格识别方法,其中,根据第一轮廓线,确定待识别表格的多个第一文字区域包括:
根据第一轮廓线,利用正负向偏置对比,确定待识别表格的多个第一文字区域。
7.一种表格识别装置,包括:
第一识别单元,被配置为识别待识别表格的第一轮廓线;
第一确定单元,被配置为根据第一轮廓线,确定待识别表格的多个第一文字区域;
聚类单元,被配置为对多个第一文字区域分别按行和列进行聚类,以计算待识别表格的行列分割点;
第二识别单元,被配置为确定待识别表格的第二轮廓线;
第二确定单元,被配置为根据第二轮廓线,确定待识别表格的多个第二文字区域,每个第二文字区域对应一个单元格;
第三识别单元,被配置为使用文本识别模型,识别每个第二文字区域中的文字;
填充单元,被配置为将识别出的各个第二文字区域中的文字内容,分别填入相应的单元格中。
8.一种表格识别装置,包括:
存储器;和
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如权利要求1-6中任一项所述的表格识别方法。
9.一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如权利要求1-6中任一项所述的表格识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京同邦卓益科技有限公司,未经北京同邦卓益科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911357969.3/1.html,转载请声明来源钻瓜专利网。





