[发明专利]表格重建方法、装置、电子设备及存储介质在审
申请号: | 201910988791.6 | 申请日: | 2019-10-17 |
公开(公告)号: | CN110738030A | 公开(公告)日: | 2020-01-31 |
发明(设计)人: | 周康明;王庆峰 | 申请(专利权)人: | 上海眼控科技股份有限公司 |
主分类号: | G06F40/183 | 分类号: | G06F40/183;G06F40/18;G06F40/177 |
代理公司: | 31219 上海光华专利事务所(普通合伙) | 代理人: | 庞红芳 |
地址: | 200032 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 表格图像 字符串位置 表格区域 二值化图像 字符串 列数 行数 重构 重建 预处理 报表表格 存储介质 电子设备 阈值获取 二值化 构建 填入 预设 检测 财务 申请 | ||
1.一种表格重建方法,其特征在于,包括:
获取待处理表格图像并对获取的所述待处理表格图像进行预处理,形成初始表格图像;
获取所述初始表格图像中的字符高度,并根据所述字符高度和预设的二值化阈值获取所述初始表格图像对应的二值化图像;
检测所述初始表格图像中的表格区域并定位所述表格区域中的字符串位置;
根据所述表格区域、所述字符串位置以及所述二值化图像确定表格的行数和列数,并构建对应行数、列数的重构表格;
根据所述字符串位置识别所述初始表格图像中的对应字符串,并将识别的所述字符串填入对应的所述重构表格。
2.根据权利要求1所述的表格重建方法,其特征在于,所述获取所述初始表格图像中的字符高度的一种实现方式包括:
对所述初始表格图像进行自适应二值化处理形成第一图像;
获取所述第一图像中的字符连通区域,并计算所述字符连通区域中的字符高度;
根据所述初始表格图像的缩放比例和所述字符连通区域中的字符高度确定所述初始表格图像中的字符高度。
3.根据权利要求2所述的表格重建方法,其特征在于,所述表格重建方法还包括:
根据获取的所述初始表格图像中的字符高度和预设高度阈值判断所述初始表格图像是否可以缩放,若是,则将所述初始表格图像进行缩放,形成缩放图像。
4.根据权利要求3所述的表格重建方法,其特征在于,所述表格重建方法还包括:
根据红章特征和表格线灰度图特征识别并去除所述缩放图像中的红章,生成去章图像;
对所述去章图像进行灰度变换,生成单通道图像。
5.根据权利要求4所述的表格重建方法,其特征在于,所述根据所述字符高度和预设的二值化阈值获取所述初始表格图像对应的二值化图像的一种实现方式包括:
根据所述字符高度构造匹配的水平结构元素和竖直结构元素;
根据构造的所述水平结构元素和所述竖直结构元素对所述单通道图像进行卷积处理以增强所述单通道图像中的表格线;
根据所述字符高度设置自适应二值化函数的核尺寸;
根据二值化函数和预设的二值化阈值获取所述单通道图像的二值化图像。
6.根据权利要求1所述的表格重建方法,其特征在于,所述根据所述表格区域、所述字符串位置以及所述二值化图像确定表格的行数和列数,并构建对应行数、列数的重构表格的一种实现方式包括:
获取表格区域的边界位置以及表头区域和/或表尾区域;
根据所述表格区域的边界位置从定位的字符串中选取属于所述表格区域的字符串;
根据所述字符串的左上角坐标和所述字符串的高度进行行列排序;
根据所述字符串的行列排序和所述二值化图像对所述字符串进行合并和/或分开操作,以确定表格的行数和列数;
构建对应行数、列数的重构表格。
7.根据权利要求1所述的表格重建方法,其特征在于,所述表格重建方法还包括:
根据预设的标准映射表对所述重构表格进行校验、统计和报警的任一种或多种组合操作。
8.一种表格重建装置,其特征在于,包括:
初始化模块,用于获取待处理表格图像,并对获取的所述待处理表格图像进行预处理,形成初始表格图像;
二值化图像模块,用于获取所述初始表格图像中的字符高度,并根据所述字符高度和预设的二值化阈值获取所述初始表格图像对应的二值化图像;
表格区域检测模块,用于检测所述初始表格图像中的表格区域;
字符串定位模块,用于定位所述表格区域中的字符串位置;
重构模块,用于根据所述表格区域、所述字符串位置以及所述二值化图像确定表格的行数和列数,并构建对应行数、列数的重构表格;
字符识别模块,用于根据所述字符串位置识别所述初始表格图像中的对应字符串,并将识别的所述字符串填入对应的所述重构表格。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海眼控科技股份有限公司,未经上海眼控科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910988791.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:复合材料铺层数据导入方法
- 下一篇:读书笔记的生成方法、装置及设备