[发明专利]文档图像处理装置和文档图像处理方法有效
申请号: | 200710129606.5 | 申请日: | 2007-07-23 |
公开(公告)号: | CN101354703A | 公开(公告)日: | 2009-01-28 |
发明(设计)人: | 吴波;窦建军;乐宁;吴亚栋;贾靖 | 申请(专利权)人: | 夏普株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/72;G06K9/46 |
代理公司: | 北京集佳知识产权代理有限公司 | 代理人: | 雒运朴;徐谦 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 图像 处理 装置 方法 | ||
技术领域
本发明涉及将文档作为图像来输入并存储的文档图像处理装置和文档图像处理方法,特别是涉及具有对于所存储的文档的检索功能的文档图像处理装置和文档图像处理方法。
背景技术
一种利用图像扫描仪等图像输入装置将文档转换成图像,并以电子方式进行存储,且在之后可以检索的文档归档装置已得到实用化。关于这样的文档归档装置的技术已公开在中国公开专利公报CN1402854A、中国公开专利公报CN1535430A以及中国公开专利公报CN1851713A中。
在对于作为图像数据而读取的文档图像进行检索时,需要进行对各文档图像人工附加用于检索的索引信息的作业,因而非常消耗劳力。
另外,还提出了一种定位文档图像的文字区域(文本区域),进行OCR(Optical Character Reader)识别,并可利用文本内容进行全文检索的装置。作为利用了OCR识别的以往技术,例如有日本专利特开平7-152774号公报所述的技术。
然而,在OCR识别中存在着需要进行大量的计算而消耗时间的问题。并且,由于文字识别率不高,所以还存在着因误识别而检索不到的可能性,在检索精度上存在问题。
另一方面,在日本专利特开平10-74250号公报中,公开了一种不使用OCR识别,而可自动进行全文检索的技术。
上述公报的构成中,准备好将预先利用图像特征对文字进行类似的每一个文字分类到类似文字类别中的类别字典。然后,在登记文档图像时,对文本区域(文字区域)的各文字不进行文字识别,而抽出图像特征,并根据图像特征分类到文字类别中,将对按照每一个文字识别出来的类别列与输入图像一同储存。在进行检索时,将检索关键词的各文字转换为对应的类别,且将在一部分中包含被转换的类别列的文档图像作为检索结果取出。
而且,作为基于该构成的效果,记载了可提供一种在文档登记时能够以少的计算机能力高速地进行登记处理,并且在检索时可实现遗漏少的检索的文档归档装置。
例如,在基于日本专利特开平10-74250号公报的技术,来制作用于进行检索的索引信息时,对于构成标题的各文字,将图像特征近似的文字,按照类似度的顺序,作为候补文字记载在索引信息中。
在将检索关键词与索引信息进行比较时,主要利用索引信息所具有的类似度。
由于类似度只不过是针对各文字分别独立设定的参数,标题语的作为惯用语的特征未反映在索引信息中,所以在检索精度上还不够充分。
发明内容
本发明的目的是,通过改进索引信息,而提供一种检索精度更高的文档图像处理装置、文档图像处理方法。
本发明提供一种文档图像处理装置,其特征在于,具有:
字形特征字典,其以单个文字为单位储存有文字图像的图像特征;
文字列抽出部,其以由两个或两个以上文字构成的文字列为单位,抽取出所输入的文档图像中存在的文字图像;
图像特征抽出部,其将由上述文字列抽出部抽取出的文字列的文字图像以1个文字为单位进行分割,并抽出各文字图像的图像特征;
特征匹配部,其以由上述图像特征抽出部抽出的文字图像的图像特征为基础,从上述字形特征字典中,按照图像特征的匹配度从高到低的顺序选择N个(N>1的整数)文字图像作为候补文字,在将上述文字列的文字数设为M个(M>1的整数)时,制作M×N维的第1索引矩阵,并且对于由构成该第1索引矩阵的第1列的两个或两个以上候补文字构成的候补文字列,适用基于预定的语言模型的词汇解析,而制作出调整成有意义的文字列的第2索引矩阵;
索引信息储存部,其将由上述特征匹配部制作的第2索引矩阵与上述所输入的文档图像相对应地进行储存;
检索部,其在检索时,以所输入的检索式中的构成检索关键词的1个检索文字为单位,检索上述索引信息储存部,而取出具有包含检索文字的第2索引矩阵的文档图像。
根据本发明,图像特征抽出部将由文字列抽出部定位并抽取出的文档图像中的文字列的图像以1个文字为单位进行分割,并抽出各文字图像的图像特征。然后,特征匹配部基于该图像特征,从以单个文字为单位储存有文字图像的图像特征的字形特征字典中,按照图像特征的匹配度从高到低的顺序选择N个(N>1的整数)文字图像作为候补文字,并制作抽取出的文字数为M×N维的第1索引矩阵。
并且,对于由构成该第1索引矩阵的第1列的两个或两个以上候补文字构成的候补文字列,通过适用基于预定的语言模型的词汇解析,而制作出将候补文字列调整成有意义的文字列的第2索引矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于夏普株式会社,未经夏普株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710129606.5/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序