[发明专利]图像中表格信息的识别方法、装置、电子设备及存储介质在审
| 申请号: | 202110112546.6 | 申请日: | 2018-12-13 |
| 公开(公告)号: | CN112818812A | 公开(公告)日: | 2021-05-18 |
| 发明(设计)人: | 郑磊波;王洪伟;刘天悦 | 申请(专利权)人: | 北京金山数字娱乐科技有限公司;成都金山互动娱乐科技有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06N3/08 |
| 代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 项京;马敬 |
| 地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图像 表格 信息 识别 方法 装置 电子设备 存储 介质 | ||
1.一种图像中表格信息的识别方法,其特征在于,所述方法包括:
接收具有表格的目标图像;
从所述目标图像中确定包含表格的表格图像;
对所述表格图像进行文本行检测,确定所述表格图像中文本行的位置;
去除所述表格图像的表格线;
根据所述文本行的位置,从去除表格线后的表格图像中分割出文本图像;
对所述分割出的文本图像进行识别,得到所述表格图像的文字信息;
基于所述表格图像中文本行的位置,去除所述表格图像中的字符;
确定去除字符后的表格图像中交点数量及封闭单元格的数量;
根据所述表格线的交点数量确定所述表格的单元格数量;
基于所述封闭单元格的数量与所述单元格数量,确定所述表格图像的表格线是否完整;
如果所述表格图像的表格线不完整,将所述表格图像的表格线补全;
对表格线完整的表格图像进行表格识别,得到所述表格图像的表格结构信息。
2.如权利要求1所述的方法,其特征在于,所述基于所述封闭单元格的数量与所述单元格数量,确定所述表格图像的表格线是否完整的步骤,包括:
判断所述封闭单元格的数量与所述单元格数量是否相等;
如果所述封闭单元格的数量与所述单元格数量相等,确定所述表格图像的表格线完整;
如果所述封闭单元格的数量与所述单元格数量不相等,确定所述表格图像的表格线不完整。
3.如权利要求1所述的方法,其特征在于,所述对所述分割出的文本图像进行识别,得到所述表格的文字信息的步骤,包括:
对所述分割出的文本图像进行文字识别,得到所述表格图像的文字识别结果;
对所述文字识别结果进行语义分析,得到各文本行对应的语义;
根据所述各文本行对应的语义,对所述文字识别结果进行分类,得到每个文字识别结果对应的类别;
根据所述文字识别结果对应的类别,对所述文字识别结果进行存储,得到所述表格图像的文字信息。
4.如权利要求1-3任一项所述的方法,其特征在于,所述从所述目标图像中确定包含表格的表格图像的步骤,包括:
将所述目标图像输入预先训练完成的深度学习模型,得到所述目标图像中表格的目标位置;
根据所述目标位置,判断所述目标位置对应的表格区域是否扭曲;
如果是,对所述表格区域进行仿射变换处理,得到所述目标图像对应的表格图像。
5.如权利要求1-3任一项所述的方法,其特征在于,所述对所述表格图像进行文本行检测,确定所述表格图像中文本行的位置的步骤,包括:
利用pixel link算法对所述表格图像进行文本行检测,确定所述表格图像中文本行的位置。
6.如权利要求1-3任一项所述的方法,其特征在于,所述表格图像中文本行的位置包括所述表格图像中所有文本行的位置;
所述文本行的位置为所述文本行的最小外接矩形的顶点坐标,所述顶点坐标为所述最小外接矩形的四个顶点的坐标,或,所述顶点坐标为所述最小外接矩形的对角顶点的坐标。
7.如权利要求1-3任一项所述的方法,其特征在于,所述去除所述表格图像的表格线的步骤,包括:
将所述表格图像的表格线的颜色填充为所述表格图像的背景色。
8.如权利要求1-3任一项所述的方法,其特征在于,所述基于所述表格图像中文本行的位置,去除所述表格图像中的字符的步骤,包括:
将所述表格图像中文本行的位置对应的矩形区域填充为所述表格图像的背景色。
9.如权利要求1-3任一项所述的方法,其特征在于,所述确定去除字符后的表格图像中交点数量及封闭单元格的数量的步骤,包括:
采用findContours算法检测去除字符后的表格图像中封闭单元格的数量以及表格线的交点数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山数字娱乐科技有限公司;成都金山互动娱乐科技有限公司,未经北京金山数字娱乐科技有限公司;成都金山互动娱乐科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110112546.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:事件操作过程的共享方法及装置
- 下一篇:一种碳钢工作台深浅孔径检测装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





