[发明专利]文本行获取装置和方法有效
申请号: | 201710670454.3 | 申请日: | 2017-08-08 |
公开(公告)号: | CN109389114B | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 汪留安;孙俊 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/46 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 康建峰;韩雪梅 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 获取 装置 方法 | ||
本发明公开了一种文本行获取装置和方法。该方法包括:分别经由包括灰度通道和多个颜色通道的多个通道来提取待处理图像中的连通部件;对与多个通道中的一个通道对应的连通部件进行连接以构建第一有向图,并且对与多个通道中除所述一个通道以外的其余通道对应的连通部件进行连接以构建第二有向图;基于第一有向图来获取待处理图像的第一文本行;基于第一文本行来转换第二有向图;基于转换后的第二有向图来获取待处理图像的第二文本行;以及去除第一文本行和第二文本行中的虚警文本行和重复的文本行,从而得到最终文本行。
技术领域
本发明总体上涉及文本行获取装置和方法,具体而言,涉及从图像中获取文本行的装置和方法。
背景技术
自动检测与识别文档图像中的文本内容是光学字符识别领域的重要技术,文本识别结果能帮助用户来识别、标注、检索、分类、或搜索文档中的内容。
现有的获取文本行的方法包括:通过最小化归一化后的MSER变化率来提取MSER,然后采用单连接聚类算法把候选连通部件组合成文本行;使用最小代价流模型(该模型能够解决关于字符和文本行方向的错误累加问题)来获取自然场景中的文本行;以及把文本行检测任务归一化成二值(文本和非文本区域)标签分割问题,其中不同的文本信息被整合到一个图模型框架中,然后使用最小图割方法,优化代价函数来得到最后的文本行标签。
然而,由于图像背景复杂、文本行方向不同、文档图像质量低等因素,快速的文本行提取算法仍是非常具有挑战的任务。
因此,期望能够提供一种快速的、性能更好且精度更高的文本行获取技术。
引用文献
CN 106845474A
发明内容
在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
鉴于现有技术的上述缺陷,本发明的目的之一是提供一种快速的、性能更好且精度更高的文本行获取装置和方法。
根据本发明的一个方面,提供了一种文本行获取方法,包括:分别经由包括灰度通道和多个颜色通道的多个通道来提取待处理图像中的连通部件;对与所述多个通道中的一个通道对应的连通部件进行连接以构建第一有向图,并且对与所述多个通道中除所述一个通道以外的其余通道对应的连通部件进行连接以构建第二有向图;基于所述第一有向图来获取所述待处理图像的第一文本行;基于所述第一文本行来转换所述第二有向图;基于转换后的第二有向图来获取所述待处理图像的第二文本行;以及去除所述第一文本行和所述第二文本行中的虚警文本行和重复的文本行,从而得到最终文本行。
根据本公开的另一方面,提供了一种文本行获取装置,包括:提取单元,用于分别经由包括灰度通道和多个颜色通道的多个通道来提取待处理图像中的连通部件;构建单元,用于对与所述多个通道中的一个通道对应的连通部件进行连接以构建第一有向图,并且对与所述多个通道中除所述一个通道以外的其余通道对应的连通部件进行连接以构建第二有向图;第一获取单元,用于基于所述第一有向图来获取所述待处理图像的第一文本行;转换单元,用于基于所述第一文本行来转换所述第二有向图;第二获取单元,用于基于转换后的第二有向图来获取所述待处理图像的第二文本行;以及去除单元,用于去除所述第一文本行和所述第二文本行中的虚警文本行和重复的文本行,从而得到最终文本行。
根据本发明的又一方面,还提供了一种存储介质。所述存储介质包括机器可读的程序代码,当在信息处理设备上执行所述程序代码时,所述程序代码使得所述信息处理设备执行根据本发明的上述方法。
根据本发明的再一方面,还提供了一种程序。所述程序包括机器可执行的指令,当在信息处理设备上执行所述指令时,所述指令使得所述信息处理设备执行根据本发明的上述方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710670454.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多功能足迹采集设备
- 下一篇:文本识别方法、装置、存储介质和计算机设备