[发明专利]图像识别转换装置、方法及计算机可读取的记录媒介物在审
申请号: | 202111215548.4 | 申请日: | 2021-10-19 |
公开(公告)号: | CN113947777A | 公开(公告)日: | 2022-01-18 |
发明(设计)人: | 顾炯 | 申请(专利权)人: | 理光图像技术(上海)有限公司 |
主分类号: | G06V30/412 | 分类号: | G06V30/412;G06V10/44;G06F40/151 |
代理公司: | 上海德昭知识产权代理有限公司 31204 | 代理人: | 郁旦蓉 |
地址: | 200233 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 转换 装置 方法 计算机 读取 记录 媒介物 | ||
本发明的目的在于提供一种将含有由表格线形成有多个单元格的图像表格以及含有与各个单元格相对应的表格内容的待转换图像转换为结构化数据的图像识别转换装置、图像识别转换方法以及计算机可读取的记录媒介物。本发明的图像识别转换装置包括:直线识别设定部,识别表格线并设定对应的表格直线;初始表格形成部,根据表格直线形成初始表格;分界线区域获取部,获取相邻两个网格之间的分界线区域;分界线判断部,判断各个分界线区域是否存在表格分界线;单元格设定部,在判断为存在表格分界线时将相邻两个网格分别设定为单元格,并在判断不存在时将相邻两个网格合并后设定为单元格;以及最终表格形成部,形成结构化数据表格作为最终表格。
技术领域
本发明属于OCR识别领域,具体涉及一种图像识别转换装置、图像识别转换方法以及计算机可读取的记录媒介物。
背景技术
OCR(Optical Character Recognition,光学字符识别)是一种识别图像(例如扫描图像)中的文字并将其转换为计算机可识读文字的技术。当待识别的图像为报表、票据、证件等包含表格的图像时,不仅需要识别其中的文字,还需要正确地识别出其中的表格并将文字内容与表格对应。
现有技术中,表格的识别通常采用直线识别的方式获取表格线,根据获取的表格线绘制表格后再将图像分隔为与各单元格分别对应的小块进行文字识别,然后将文字识别的结果与表格中的单元格对应后形成结构化数据(如excel文档、html文档等)进行输出。在这种方法中,一旦图像中表格线出现扭曲、模糊或断裂等不清晰的情况,则无法准确获得表格线,导致识别出错。不仅如此,表格中还存在一些合并单元格的绘制方式,即将相邻单元格合并为一个后再在其中输入内容,这种表格在打印形成纸质文件后,常因为合并单元格内存在文字内容而难以准确直接判断表格的分界情况(例如,无法判断分界线位置处的像素是文字内容还是模糊的表格线),使得最终输出的数据化表格中,同一个合并单元格中的内容被误拆分为两个独立单元格,或者两个独立单元格的内容被误合并为同一个单元格。
发明内容
本发明是为了解决上述问题而进行的,目的在于提供一种将含有由表格线形成有多个单元格的图像表格以及含有与各个单元格相对应的表格内容的待转换图像转换为结构化数据的图像识别转换装置、图像识别转换方法以及计算机可读取的记录媒介物。
本发明为了达到以上的目的,采用了以下方案:
方案一
作为第一种方案,本发明提供了一种图像识别转换装置,用于将含有由表格线形成有多个单元格的图像表格以及含有与各个单元格相对应的表格内容的待转换图像转换为结构化数据,其特征在于,包括:直线识别设定部,识别待转换图像中存在的表格线并设定对应的表格直线;初始表格形成部,根据表格直线形成含有多个网格的初始表格;分界线区域获取部,根据预定顺序以及预定获取规则从初始表格中依次获取相邻两个网格之间的分界线所对应的分界线区域;分界线判断部,判断待转换图像中的各个分界线区域处是否存在对应的表格分界线;单元格设定部,在判断为分界线区域处存在表格分界线时将该分界线区域处的相邻两个网格分别设定为单元格,并在判断为分界线区域处不存在表格分界线时将该分界线区域处的相邻两个网格合并后设定为单元格;以及最终表格形成部,根据单元格设定部所设定的单元格形成与待转换图像中的图像表格相对应的结构化数据表格作为最终表格。
方案二
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于理光图像技术(上海)有限公司,未经理光图像技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111215548.4/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序