[发明专利]基于深度学习的表格结构重建方法在审
| 申请号: | 202011280981.1 | 申请日: | 2020-11-16 |
| 公开(公告)号: | CN112381082A | 公开(公告)日: | 2021-02-19 |
| 发明(设计)人: | 蔡雨欣 | 申请(专利权)人: | 长治市瞬莱通讯器材有限公司 |
| 主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 重庆百润洪知识产权代理有限公司 50219 | 代理人: | 郝艳平 |
| 地址: | 046000 *** | 国省代码: | 山西;14 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 深度 学习 表格 结构 重建 方法 | ||
1.基于深度学习的表格结构重建方法,其特征在于,包括
获取训练图像,所述训练图像显示有表格;
对训练图像进行预处理;
提取预处理后图像的特征图;
利用特征图进行学习和参数更新,获得表格线分类和定位模型;
获取用于表格重建的待重建图像,所述待重建图像显示有待重建表格;
根据表格线分类和定位模型得到待重建表格的结构信息;
对待重建图像进行文字识别和图像目标检测,得到表格内容信息;
将待重建表格的结构信息和表格内容信息匹配,重建表格。
2.根据权利要求1所述的基于深度学习的表格结构重建方法,其特征在于,所述对训练目标图像进行预处理,包括:
对训练图像进行数据增广,生成增广训练数据;
将增广训练数据与真实表格数据混合,然后进行归一化处理;
获取每张训练图像的标签,所述标签包括每个像素点相对于表格结构的相对位置关系。
3.根据权利要求2所述的基于深度学习的表格结构重建方法,其特征在于,所述提取预处理后图像的特征图,包括:
将预处理后的图像数据和标签作为输入,送入基于深度学习的分割网络进行训练提取出特征图;
所述分割网络采用改进后的Unet分割网络,其选择加权交叉熵损失函数来进行训练。
4.根据权利要求3所述的基于深度学习的表格结构重建方法,其特征在于,所述根据待重建图像得到待重建表格的结构信息,包括:
将待重建图像送入所述分割网络,得到表格线分类的像素概率矩阵;
根据所得像素概率矩阵生成表格线二值图;
根据表格线二值图提取单元格交叉点;
根据单元格交叉点对单元格的行列进行组合,得到待重建表格的结构信息。
5.根据权利要求4所述的基于深度学习的表格结构重建方法,其特征在于,所述根据所得像素概率矩阵生成表格线二值图,包括对像素概率矩阵进行映射,具体包括:
设定概率阈值,如果表格横竖线的像素概率大于概率阈值,则对应的像素点映射为255,反之则映射为0,从而对表格横竖线进行分割。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长治市瞬莱通讯器材有限公司,未经长治市瞬莱通讯器材有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011280981.1/1.html,转载请声明来源钻瓜专利网。





