[发明专利]图像处理装置以及文字识别方法有效
申请号: | 201310087207.2 | 申请日: | 2013-03-18 |
公开(公告)号: | CN103324927B | 公开(公告)日: | 2017-04-12 |
发明(设计)人: | 岛崎克仁 | 申请(专利权)人: | 株式会社PFU |
主分类号: | G06K9/20 | 分类号: | G06K9/20 |
代理公司: | 上海市华诚律师事务所31210 | 代理人: | 徐晓静 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 处理 装置 以及 文字 识别 方法 | ||
技术领域
本发明涉及一种图像处理装置以及文字识别方法,特别是涉及一种对多种原稿进行文字识别的图像处理装置以及文字识别方法。
背景技术
作为对由扫描仪装置等读取原稿而获取的图像数据内的文字进行识别的技术,存在一种OCR(Optical Character Recognition;光学文字识别)技术。在OCR技术中,现在寻求不仅是对只记载有文字的原稿,对文字、图片、照片等混在一起的原稿也能够识别文字。因此,为了能从各种原稿高精度地进行文字识别,OCR处理正变得复杂,处理需要较长时间。
专利文献1中公开了一种包括CPU、串行运算处理部、并行运算处理部的信息处理装置。该信息处理装置中,对由CPU、串行运算处理部以及并行运算处理部中哪一个来执行包含于图像处理的各种运算处理能实现高速运行进行事先验证,并预先存储设定了由哪一个来执行各种运算处理的表格。并且,CPU针对已命令执行的各种运算处理,参照已存储的表格,确定哪一个为执行主体。
专利文献2中公开了进行文字识别处理和压缩处理的图像处理装置。该图像处理装置针对文章、图形、图片混在一起的原稿,识别图像数据的属性(标题、文章、图形以及图片)并分割区域。并且,使用对包含标题、文章等的文字的区域进行简单二值化后得到的二值数据来进行文字识别处理。另外,专利文献2中记载了对针对包含标题、文章等的文字的区域进行简单二值化后得到的二值数据进行压缩处理,对针对图片、照片等的中间色调区域通过误差扩散法等进行二值化后得到的中间色调二值数据进行压缩处理。
【现有技术文献】
【专利文献】
【专利文献1】特开2011-191903号公报
【专利文献2】特开平8-315159号公报
发明内容
【发明要解决的技术问题】
由于专利文献1中公开的信息处理装置对各被包含于图像处理的运算处理,选择能够最快执行该处理的处理部,因此能够高速地执行各运算处理。然而,由该信息处理装置进行文字识别处理的情况下,由于对所有原稿一律执行预先设定的运算处理,即使是对只记载有文字的原稿也需要与有文字、图片、照片等混在一起的原稿几乎相同的处理时间。
由于专利文献2中公开的图像处理装置不对图片、照片等的区域进行文字识别处理,因而能够高速地执行文字识别处理。然而,该图像处理装置在图片、照片等的区域包含有文字的情况下,无法识别该文字。
本发明的目的在于,提供一种在确保文字识别的精度的同时可以高速地进行文字识别的图像处理装置以及文字识别方法。
【解决问题的技术手段】
本发明的一方面所涉及的一种图像处理装置包括:直方图生成部,其基于输入图像中的各像素的像素值来生成直方图;成分判定部,其基于直方图对输入图像中是否包含有文字成分、是否包含有除文字成分和背景成分之外的非文字成分进行判定;二值化部,其在输入图像中包含有文字成分和非文字成分两者的情况下,通过基于各像素的边缘强度对该输入图像进行二值化的第1处理来生成二值图像,在输入图像中包含有文字成分且不包含非文字成分的情况下,通过基于各像素的亮度值对该输入图像进行二值化的第2处理来生成二值图像;文字识别部,其对二值图像进行文字识别。
又,本发明的另一方面所涉及的一种文字识别方法包含:基于输入图像中的各像素的像素值来生成直方图的步骤;基于直方图对输入图像中是否包含有文字成分、是否包含有除文字成分和背景成分之外的非文字成分进行判定的步骤;在输入图像中包含有文字成分和非文字成分两者的情况下,通过基于各像素的边缘强度对该输入图像进行二值化的第1处理来生成二值图像,在输入图像中包含有文字成分且不包含非文字成分的情况下,通过基于各像素的亮度值对该输入图像进行二值化的第2处理来生成二值图像的步骤;对二值图像进行文字识别的步骤。
【发明的效果】
根据本发明的一个实施方式,能够提供一种在确保文字识别的精度的同时可以高速地进行文字识别的图像处理装置以及文字识别方法。
附图说明
图1是实施方式所涉及的图像处理系统的概略构成图。
图2是图像处理部的概略构成图。
图3是示出图像读取处理的动作的示例的流程图。
图4是示出文字识别处理的动作的示例的流程图。
图5是用于说明区域分割处理的示意图。
图6是示出区域分割处理的动作的示例的流程图。
图7(a)~(c)是用于说明成分判定处理的示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社PFU,未经株式会社PFU许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310087207.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型搅拌棒
- 下一篇:图像检索系统、图像检索装置以及图像检索方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序