[发明专利]文档处理装置、文档处理方法以及扫描仪有效
申请号: | 201210177541.2 | 申请日: | 2012-05-31 |
公开(公告)号: | CN103455806B | 公开(公告)日: | 2017-06-13 |
发明(设计)人: | 潘屹峰;孙俊;何源;直井聪 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/20 | 分类号: | G06K9/20 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 王萍,陈炜 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 处理 装置 方法 以及 扫描仪 | ||
技术领域
本公开涉及一种文档处理装置、文档处理方法以及扫描仪,尤其涉及一种用于确定所输入的文档的朝向的文档处理装置、文档处理方法和扫描仪。
背景技术
随着对数字图书馆和文档电子化的日益增加的需求,大量的具有实体载体形式的文档(诸如纸质文档、胶卷文档等)需要通过文档图像处理系统(Document Image Processing System,DIPS)来扫描并转换成具有指定格式的电子文档。而作为文档图像处理系统的一个重要步骤,往往需要从所扫描的文档图像中自动判别出文档的方向(例如从左至右、从右至左、从下到上和从上到下这四种候选方向)。而进行该判别处理的性能往往会影响到文档图像处理系统的整体性能。
现有的判别方法主要包括以下两类。第一种是基于图像特征的方法,第二种是基于光学字符识别(Optical Character Recognition,OCR)的方法。
发明内容
然而,需要更好地判别文档的朝向,特别是在扫描得到的文档图像质量较差时,无论使用上面提到的哪种方法,都无法得到满意的判别效果。
因此,至少为了解决这一问题,本公开的发明人提出了一种新的用于进行文档朝向判别的方法:通过综合利用图像特征信息和光学字符识别信息,考虑到文档所属的语言来进行判别。
具体地,本公开提出了一种文档处理设备,其包括:文本行提取单元,其被配置为从所输入的文档中提取至少一个文本行;语言分类单元,其被配置为通过图形特征识别处理来确定所输入的文档的语言是否需要进行光学字符识别处理;光学字符识别单元,其被配置为在确定所输入的文档的语言需要进行光学字符识别时,通过进行光学字符识别处理来为至少一部分文本行中的每个确定针对各候选方向的光学字符识别置信度;图形特征识别单元,其被配置为通过进行图形特征识别处理来为每个文本行确定针对各候选方向的图形特征识别置信度;以及确定单元,其被配置为基于所确定的图形特征识别置信度以及光学字符识别置信度中的至少一项来为所述至少一部分文本行中的每个确定针对各候选方向的组合置信度,并且基于组合置信度来确定所输入的文档的朝向。
本公开还提出了一种扫描仪,其包括上述文档处理设备用来确定所输入的文档的朝向。
本公开还提出了一种文档处理方法,其包括:从所输入的文档中提取至少一个文本行;通过图形特征识别处理来确定所输入的文档的语言是否需要进行光学字符识别处理;在确定所输入的文档的语言需要进行光学字符识别时,通过进行光学字符识别处理来为至少一部分文本行中的每个确定针对各候选方向的光学字符识别置信度;通过进行图形特征识别处理来为每个文本行确定针对各候选方向的图形特征识别置信度;以及基于所确定的图形特征识别置信度以及光学字符识别置信度中的至少一项来为所述至少一部分文本行中的每个确定针对各候选方向的组合置信度,并且基于组合置信度来确定所输入的文档的朝向。
根据本公开的实施例,还提供了一种程序,其用于使得计算机设备执行上述文档处理方法,用于确定所输入的文档的朝向。
根据本公开的实施例,还提供了相应的计算机可读存储介质,该计算机可读存储介质上存储有能够由计算设备执行的程序,所述程序在执行时能够使所述计算设备执行上述文档处理方法。
根据本公开所提出的文档处理装置、文档处理方法和扫描仪,能够较好地完成对文档的朝向的判别,特别是在扫描得到的文档图像质量较差时,也能够较好地完成对文档的朝向的判别。
在上文中给出了关于本公开的技术方案的简要概述,以便提供对本公开的技术方案的某些方面的基本理解。应当理解的是,以上概述并不是关于本公开的技术方案的穷举性概述。以上概述并不是意图确定本公开的技术方案的关键或重要部分,也不是意图限定本公开的技术方案的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
通过以下结合附图对本公开的优选实施例的详细说明,本公开的技术方案的这些以及其他优点将更加明显。
附图说明
本公开的技术方案可以通过参考下文中结合附图所给出的描述而得到更好的理解,其中在所有附图中使用了相同或相似的附图标记来表示相同或者相似的部件。所述附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分,而且用来进一步举例说明本公开的优选实施例和解释本公开的原理和优点。在附图中:
图1是示意性地示出了根据本公开的实施例的信息处理装置的结构的框图。
图2是具有灰度图像的文档的示例的示意图。
图3是标出了候选文本行的、二值化之后的文档的示例的示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210177541.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:分布式冷热电联供系统并网运行在线优化方法
- 下一篇:信息查询发布系统