[发明专利]图像处理系统和图像处理方法有效
申请号: | 201911300853.6 | 申请日: | 2019-12-17 |
公开(公告)号: | CN111385424B | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 大石刚 | 申请(专利权)人: | 佳能株式会社 |
主分类号: | H04N1/00 | 分类号: | H04N1/00;G06V30/148;G06N3/04;G06N3/08 |
代理公司: | 北京怡丰知识产权代理有限公司 11293 | 代理人: | 迟军;李艳丽 |
地址: | 日本国东京都*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 处理 系统 方法 | ||
本发明公开了图像处理系统和图像处理方法。提供了一种图像处理系统,该图像处理系统使用神经网络来校正通过光学字符识别(OCR)获得的文本,该神经网络已经基于OCR的错误识别部分和在错误识别部分附近的文本执行了学习。该图像处理系统获取已经基于学习数据执行了学习的神经网络模型,在学习数据中,包括在打印数据中的第一文本信息和通过对基于打印数据的图像执行光学字符识别(OCR)处理而获取的第二文本信息彼此关联;获取读取的图像;获取通过对读取的图像执行OCR处理而生成的第三文本信息;以及基于神经网络模型根据第三文本信息的输入而输出第四文本信息。
技术领域
本发明的各方面一般而言涉及图像处理系统和图像处理方法。
背景技术
将图像数据中包括的字符图像识别为字符并因此将字符图像转换成文本数据的已知技术包括称为“光学字符识别”(以下称为“OCR”)的技术。OCR用于利用计算机化的数据中包括的字符信息。例如,称为例如多功能外围设备(MFP)的图像处理装置配备有将通过OCR获取的文本数据与图像数据进行组合以生成可搜索的便携式文档格式(PDF)数据的功能。可搜索的PDF数据允许搜索作为字符包括在图像数据中的字符图像,因此便利性极好。
此外,现有的OCR技术可能经常错误地识别图像中包括的字符并输出包含错误的文本数据。这种错误识别的原因包括字符以外的信息(诸如图像中包括的背景或格线)的影响、图像的倾斜以及图像中包括的噪声的影响。如果以上面提到的方式在通过OCR获得的文本中包含错误,那么使用字符信息的各种功能的便利性会降低。
日本专利申请公开No.2011-150436讨论了一种创建用于OCR的错误规则和用于校正的字典以校正通过OCR获得的文本的技术。错误规则是用于检测文本校正目标的规则,并且包括例如在汉字(日语书写系统中使用的中文字符)和汉字之间出现片假名(日语音节,日语书写系统的一个组成部分)的一个字母的情况下将片假名的这个字母设置为校正目标的规则。在这个规则的情况下,包括在字符“重カ(片假名)加速度”中的字符“カ”被设置为校正目标。而且,用于校正的字典将错误识别和正确内容的模式(pattern)保留为字典。例如,将字符“重カ(片假名)”和字符“重力(汉字)”的对保留在字典中,并且在出现适用的模式的情况下,执行用对应的正确内容替换错误识别的字符的处理。
但是,在日本专利申请公开No.2011-150436中讨论的技术在文本校正的准确性上有提高的空间。例如,在字符“動”被错误地识别为词“重力”的这种类型的错误识别的情况下,在日本专利申请公开No.2011-150436中描述的错误规则无法检测到这种错误识别。而且,如果使用在检测到词“重力”时必然将词“重力”转换成字符“動”的规则和校正字典,那么已通过OCR被正确识别为字符“重力加速度”的术语可能用不同的术语(诸如字符“動加速度”)替换。因而,期望将在OCR之后执行的文本校正处理不是将基于逐个词或逐个字符来执行的校正处理,而是将考虑有关的一个或多个字符周围的上下文来执行的校正处理。换句话说,期望使用神经网络来执行文本校正处理,该神经网络已经不仅基于被OCR错误识别的部分的文本而且还基于出现在错误识别的部分周围的文本来执行学习。
发明内容
根据本发明的一个方面,一种图像处理系统,包括:被配置为获取神经网络模型的单元,该神经网络模型已经基于学习数据进行了训练,在学习数据中,打印数据中包括的第一文本信息和通过对基于打印数据的图像执行光学字符识别(OCR)处理而获取的第二文本信息彼此关联;被配置为获取扫描仪获得的图像的单元;被配置为获取通过对扫描仪获得的图像执行OCR处理而生成的第三文本信息的单元;以及被配置为基于神经网络模型根据第三文本信息的输入来输出第四文本信息的单元。
通过参考附图对示例性实施例的以下描述,本发明的其它特征将变得清楚。
附图说明
图1是例示根据第一示例性实施例的图像处理系统的配置的图。
图2A是例示图像处理装置的配置的图。图2B是例示学习装置的配置的图。图2C是例示图像处理服务器的配置的图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳能株式会社,未经佳能株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911300853.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基片处理装置和基片处理方法
- 下一篇:装配于带印刷装置的盒
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序