[发明专利]基于人工智能的表格识别方法、装置及电子设备在审
| 申请号: | 201910965184.8 | 申请日: | 2019-10-11 |
| 公开(公告)号: | CN110796031A | 公开(公告)日: | 2020-02-14 |
| 发明(设计)人: | 李鑫 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06F40/18;G06F40/174 |
| 代理公司: | 44232 深圳市隆天联鼎知识产权代理有限公司 | 代理人: | 刘抗美 |
| 地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 表格单元格 电子表格 文本信息 图像 人工智能 线条图像 表格识别装置 自然语言处理 计算机视觉 表格结构 表格内容 表格识别 电子设备 关系确定 机器学习 图像分割 图像语义 文本识别 填充 线条 分割 | ||
1.一种基于人工智能的表格识别方法,其特征在于,包括:
基于图像语义对待识别图像进行图像分割以得到前景线条图像;
根据所述前景线条图像中的线条关系确定多个表格单元格,并根据所述多个表格单元格建立电子表格;
对所述待识别图像进行文本识别以得到所述待识别图像中的文本信息;
根据所述文本信息在所述待识别图像中的位置以及所述表格单元格在所述电子表格中的位置,将所述文本信息填充至所述电子表格中。
2.根据权利要求1所述的基于人工智能的表格识别方法,其特征在于,所述根据所述前景线条图像中的线条关系确定多个表格单元格,包括:
对所述前景线条图像进行线条拟合以确定多个图像线条;
根据各个所述图像线条之间的位置关系确定多个由所述图像线条相交形成的线条交点;
根据各个所述线条交点之间的位置关系确定多个以所述线条交点为顶点的表格单元格。
3.根据权利要求2所述的基于人工智能的表格识别方法,其特征在于,所述图像线条包括沿第一方向分布的横向线条和沿第二方向分布的纵向线条;所述对所述前景线条图像进行线条拟合以确定多个图像线条,包括:
利用横向线条卷积核对所述前景线条图像进行卷积处理以得到横向线条图像;
在所述横向线条图像中确定多个沿第一方向分布的第一像素连通区域;
分别对各个所述第一像素连通区域中的像素点进行线条拟合以确定多个横向线条;
利用纵向线条卷积核对所述前景线条图像进行卷积处理以得到纵向线条图像;
在所述纵向线条图像中确定多个沿第二方向分布的第二像素连通区域;
分别对各个所述第二像素连通区域中的像素点进行线条拟合以确定多个纵向线条。
4.根据权利要求3所述的基于人工智能的表格识别方法,其特征在于,所述根据各个所述图像线条之间的位置关系确定多个由所述图像线条相交形成的线条交点,包括:
获取各个所述图像线条的直线拟合函数并确定各个所述图像线条的线条端点;
根据所述直线拟合函数确定任意一个横向线条与任意一个纵向线条的待定交点;
根据所述线条端点和所述待定交点的位置关系确定由所述横向线条和所述纵向线条相交形成的线条交点。
5.根据权利要求4所述的基于人工智能的表格识别方法,其特征在于,所述根据所述线条端点和所述待定交点的位置关系确定由所述横向线条和所述纵向线条相交形成的线条交点,包括:
获取所述横向线条的第一横向端点、第二横向端点以及所述待定交点两两之间的横向位置距离;
根据所述横向位置距离确定所述横向线条与所述待定交点之间的横向线条距离;
获取所述纵向线条的第一纵向端点、第二纵向端点以及所述待定交点两两之间的纵向位置距离;
根据所述纵向位置距离确定所述纵向线条与所述待定交点之间的纵向线条距离;
在所述横向线条距离和所述纵向线条距离之中的较大值小于距离阈值时,将所述待定交点确定为所述横向线条和所述纵向线条相交形成的线条交点。
6.根据权利要求2所述的基于人工智能的表格识别方法,其特征在于,所述根据各个所述线条交点之间的位置关系确定多个以所述线条交点为顶点的表格单元格,包括:
遍历位于所述前景线条图像上的所述多个线条交点,以在所述前景线条图像上查找与当前线条交点构成最小矩形的三个关联线条交点;
在所述前景线条图像上存在与所述当前线条交点相关的所述三个关联线条交点时,确定以所述当前线条交点和所述三个关联线条交点为顶点的表格单元格。
7.根据权利要求1所述的基于人工智能的表格识别方法,其特征在于,所述基于图像语义对待识别图像进行图像分割以得到前景线条图像,包括:
基于图像语义对待识别图像中的像素点进行分类以确定图像线条所在的前景像素点;
根据所述前景像素点对所述待识别图像进行图像分割以得到前景线条图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910965184.8/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





