[发明专利]基于比例计算还原表格图片为可编辑的WORD文件表格的方法有效
| 申请号: | 202011530378.4 | 申请日: | 2020-12-22 |
| 公开(公告)号: | CN112632934B | 公开(公告)日: | 2023-01-17 |
| 发明(设计)人: | 马超;孙凡;武博;张春魁;汪伟岚 | 申请(专利权)人: | 上海精密计量测试研究所 |
| 主分类号: | G06F40/18 | 分类号: | G06F40/18;G06V30/413 |
| 代理公司: | 上海航天局专利中心 31107 | 代理人: | 余岢 |
| 地址: | 201109 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 比例 计算 还原 表格 图片 编辑 word 文件 方法 | ||
1.一种基于比例计算还原表格图片为可编辑的WORD文件表格的方法,其特征在于,包括:
步骤S1,获取与待识别的表格图片最接近的长宽比页面类型的实际纸张版式,作为页面匹配数据;
步骤S2,求出所述待识别的表格图片中的表格的最大长度与最大宽度,作为表格边框匹配数据;求出所述表格图片中的表格的位置,作为表格位置匹配数据;
步骤S3,获取所待识别的述表格图片的表格的单元格的文字的长宽比,作为单元格文字大小匹配数据;
步骤S4,根据所述页面匹配数据、表格边框匹配数据和表格位置匹配数据,在WORD文件中自动绘制表格,并根据单元格文字大小匹配数据自动对应的文字录入自动绘制表格内。
2.如权利要求1所述的基于比例计算还原表格图片为可编辑的WORD文件表格的方法,其特征在于,步骤S1,获取与待识别的表格图片最接近的长宽比页面类型的实际纸张版式,作为页面匹配数据之前,还包括:
准备表格图片,通过图像识别算法求出整张表格图片的最大外切矩形,并对表格图片的最大外切矩形进行水平修正,对待表格图片文件根据修正后的最大外切矩形进行裁剪,仅保留最大外切矩形以内的图片作为待识别的表格图片。
3.如权利要求1所述的基于比例计算还原表格图片为可编辑的WORD文件表格的方法,其特征在于,步骤S1,获取与待识别的表格图片最接近的长宽比页面类型的实际纸张版式,作为页面匹配数据,包括:
步骤S11,根据图片识别算法,获取待识别的表格图片的长度像素点的数量与宽度像素点的数量,得到待识别的表格图片的长宽像素比,以作为页面匹配数据;
步骤S12,基于所述待识别的表格图片的长宽像素比,计算出WORD文件中常用页面类型的长宽比,作为页面字典。
4.如权利要求3所述的基于比例计算还原表格图片为可编辑的WORD文件表格的方法,其特征在于,步骤S2,求出所述待识别的表格图片中的表格的最大长度与最大宽度,作为表格边框匹配数据,包括:
基于图片识别算法,获取待识别的表格图片内的表格的边框的长度像素点的数量与宽度像素点的数量;
基于表格的边框的长度像素点的数量与宽度像素点的数量与所述待识别的表格图片的长宽像素比,匹配计算获得表格的边框在整个表格图片内的长度宽度占比及计算表格内的单元格长宽占比,以作为表格边框匹配数据。
5.如权利要求4所述的基于比例计算还原表格图片为可编辑的WORD文件表格的方法,其特征在于,步骤S2,求出所述表格图片中的表格的位置,作为表格位置匹配数据,包括:
基于图片识别算法,获取待识别的表格图片中的表格的最小外切矩形的左上角焦点的像素点,计算该像素点在整个待识别的表格图片中的位置,将该位置作为表格长宽在WORD文件的页面还原的起点位置,将所述起点位置作为表格位置匹配数据。
6.如权利要求5所述的基于比例计算还原表格图片为可编辑的WORD文件表格的方法,其特征在于,步骤S3,获取所待识别的述表格图片的表格的单元格的文字的长宽比,作为单元格文字大小匹配数据,包括:
计算出WORD文件中常用页面类型中常用的字体的长宽度在整个页面中的长宽占比,并作为字体大小字典;
基于图片识别算法,计算出所述待识别的表格图片的的表格的单元格内的文字的最小外切矩形,根据单元格内文字的最小外切矩形长度像素点的数量和宽像素点的数量,求出该最小外切矩形的长度像素点在整个表格图片的长度像素点中的第一占比,求出该最小外切矩形的宽度像素点在整个表格图片的宽度像素点中的第二占比,将所述第一占比和第二占比作为单元格文字大小匹配数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海精密计量测试研究所,未经上海精密计量测试研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011530378.4/1.html,转载请声明来源钻瓜专利网。





