[发明专利]文档图像处理装置、文档图像处理方法、及存储计算机程序的命令的可计算机读出的存储介质有效
申请号: | 201110041846.6 | 申请日: | 2011-02-22 |
公开(公告)号: | CN102194116A | 公开(公告)日: | 2011-09-21 |
发明(设计)人: | 小平直朗 | 申请(专利权)人: | 株式会社东芝;东芝解决方案株式会社 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06T9/00 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 黄剑锋 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 图像 处理 装置 方法 存储 计算机 程序 命令 读出 介质 | ||
技术领域
本发明所说明的实施方式(多数形式)全部涉及文档图像处理装置、文档图像处理方法、及存储计算机程序的命令的可计算机读出的存储介质。
背景技术
利用扫描仪等将帐票等文档变换为数字数据时,由于使数据量减少等目的而多作为黑白图像或灰色标度图像保存。但是,近年由于彩色打印等的普及而彩色文档变多,随之,将其作为彩色图像进行保存的必要性增多。
彩色图像因为相比黑白图像或灰度标准图像数据量庞大,所以,通常实施一些压缩处理进行保存。
作为一般的彩色图像的压缩方法,有JPEG(Jojnt Photgraphic Experts Group)方式的压缩。但是,已知,若增大包含文字等的文档图像的压缩率,则由于方框噪声而文字的边缘部分产生模糊,可视性降低。
作为其对策,首先可以列举将图像进行减色化进行压缩的技术。当用扫描仪读取文档时,由于量子化误差或读取时的位置偏差,其色数成为庞大的数。在文档图像中,为了进行有效的压缩处理,有效的是通过减少其色数的减色处理实现数据量的削减。该减色处理例如对色空间的频率分布进行Hough变换或主成分分析决定色数。同时,求上述色空间的色的直线状的分布,使用将其分布进行分类得到的数据族的数色进行减色化。
另外,也可以列举在准备了预先记入栏等的帐票中只取出用手写等补记的图像的技术。用扫描仪读取帐票,在通过通信装置向远地发送该帐票图像数据的情况下,若将读取数据全部发送,则成为庞大的数据量浪费成本。通常,在帐票中,在将予设定的项目进行字或印刷的用纸中,多为人通过手写等向項目栏记入内容。
但是,事前已知已经进行了印字或印刷的图像数据(以下,称为预印数据),用手写等补记的数据为重要的数据。从而,若从用扫描仪读取的图像只取出用手写等补记的数据的图像,将取出的图像数据向远地发送,则效率高。而且,在接收侧合成接收的图像数据和预准备的预印数据,从而可以复原显示和发送侧相同的图像数据。
但是,文字的边缘部分的图像,特别是由于扫描时的彩色边纹等多为与实际使用的墨水色分离。例如,受墨水色和底色的双方的影响成为中间色。该情况下,因为与直线分布分离的色的处理不明,所以不能对应。
另外,帐票等的文档图像中,存在通过设置为网点(網点)而意图将特定的栏设为中间色的情况。而且,也存在在其网点(半色调点)上用和网点相同色的墨水印刷文字的情况。该情况下,若进行文档图像的色的置换处理,则文字和网点作为相同的色被识别,存在难以读出文字的问题。另外,用同系色对文字、格线、其它图像进行印字的帐票的读取图像数据难以分类。例如,在读取对红色的文字、格线进行印字,然后添加印章的盖章的红色的文档的图像的情况下,难以将红色的文字、格线和红色作为不同的颜色进行分类。
发明内容
本发明实施方式的文档图像处理装置具备:取出部,其从输入文档图像的像素取出第一文档要素,从对应所述输入文档图像的预印数据的像素取出第二文档要素;推定部,其推定所述第一文档要素各色空间的第一代表色和第二文档要素各色空间的第二代表色;算出部,其算出在所述色空间上分离各所述第一代表色的第一分离平面和在所述空间上分离各所述第二代表色的第二分离平面;置换部,其将分布于通过所述第一分离平面分离的所述色空间的分离区域的所述第一文档要素的各第一像素的色置换为分布于同所述分离区域的所述第一代表色,将分布于通过第二分离平面分离的所述色空间的分离区域的所述第二文档要素的各第二像素的色置换为分布于同所述分离区域的所述第二代表色;生成部,其生成置换的各第一像素和置换的各第二像素的差分图像。
本发明其它实施方式的文档图像处理装置,具备:取出部,其从输入文档图像取出文档要素;推定部,其推定取出的所述文档要素的色空间的代表色;算出部,其算出在所述色空间上分别分离所述代表色的分离平面;置换部,其将分布于通过所述分离平面分离的所述色空间的分离区域的所述文档要素的各像素的色置换为分布于同所述分离区域的所述代表色;生成部,其生成将各像素的色置换为所述代表色的所述输入文档图像的各像素和对应已经实施了所述代表色的置换的所述输入文档图像的预印数据的各像素的差分图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝;东芝解决方案株式会社,未经株式会社东芝;东芝解决方案株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110041846.6/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序