[发明专利]文档图像的检索装置及文档图像的检索方法有效
| 申请号: | 200710090670.7 | 申请日: | 2007-03-30 |
| 公开(公告)号: | CN101276363A | 公开(公告)日: | 2008-10-01 |
| 发明(设计)人: | 陈芒;吴波;吴亚栋;许晨 | 申请(专利权)人: | 夏普株式会社 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/00 |
| 代理公司: | 北京集佳知识产权代理有限公司 | 代理人: | 雒运朴;徐谦 |
| 地址: | 日本*** | 国省代码: | 日本;JP |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文档 图像 检索 装置 方法 | ||
技术领域
本发明涉及对以文字和图表为主要内容的图像即文档图像,采用图像的特征进行检索的文档图像的检索装置及检索方法。
背景技术
一种利用图像扫描仪等图像输入装置将文档转换成图像,以电子形式进行储存,并且之后能够检索的图像归档系统已经步入实用化。在将文档作为图像来读取的图像检索中,可采用图像检索技术。
以往,作为图像检索技术,有基于附加在图像中的文本的检索、和基于图像的视觉内容的检索。
其中,所谓基于附加在图像中的文本的检索,是指作为图像所附属的信息而制作说明图像的文本信息,将该文本信息作为关键词检索图像的技术,作为现有技术,例如有专利文献1、2。
然而,虽然计算机视觉和人工智能技术正在日益发展,但在现阶段还不能依靠它来对图像自动地附加文本。因此,在基于文本的检索中,需要人工来附加文本,因此需要烦琐的作业。
而且,由于由人工来进行,所以有可能加入人的主观意识,在附加的文本中产生意思上的差异。另外,由于对于向图像附加文本的附加方法,还没有制定规则,所以关于关键词的解释也存在一定程度的差异。这些的结果,会导致通过检索所得到的图像不一定是用户的目标图像,对检索的正确率产生影响。
并且,在基于文本的图像的检索技术中,由于一概不使用图像的视觉特征(例如色彩或纹理),所以不能说是充分表达了图像的信息。
相对于此,由于基于图像的视觉内容的检索是基于图像的特征来检索图像的,且根据图像来检索图像,所以不需要依赖于人工来输入文本,且不需要烦琐的作业,也不会加入人的主观意识。
作为图像的特征,通常采用色彩特征、纹理特征、以及形状特征这3种特征。
色彩特征是图像的整体属性,其利用图像的色彩信息来表现图像的表面性质,作为现有技术,例如有专利文献3、4。
纹理特征是反映图像的局部构造的特征,且表现图像的表面性质的特征,其需要在包含多个像素点的区域内进行局部统计计算。作为现有技术,例如有专利文献5、6。
形状特征是对于图像的特定区域首先进行图像的分割、区域识别,然后从其中抽出与形状特征有关的特征。作为现有技术,例如有专利文献7、8。
专利文献1:CN1851713“基于多图像文本的图像检索及显示方法”
专利文献2:CN1402853“图像检索系统及图像检索方法”
专利文献3:CN1365067“基于色彩和图像特征组合的图像检索方法”
专利文献4:CN1426002“不受照明变化影响的图像检索方法和装置”
专利文献5:CN1570972“一种基于图像纹理特征的图像检索方法”
专利文献6:CN1342300“用频域中的伽柏滤波器的纹理描述方法和基于纹理的图像检索方法”
专利文献7:CN1570969“一种基于显著兴趣点的图像检索方法”
专利文献8:CN1570973“一种利用显著边缘进行图像检索的方法”
然而,在上述以往的基于图像的视觉内容的检索中,存在着如下问题。
图像通常受到干扰,受其影响产生变形或歪扭。在以纹理和色彩作为图像特征的检索方法中,若产生变形或歪扭,则不能获得理想的检索效果。
另外,由于色彩相对图像区域的方向和尺寸的变化不敏感,所以根据色彩的特征不能顺利地捕捉到局部特征。
特别是专利文献4,考虑到照明对图像形成时的色彩信息所产生的影响,而对图像去除低亮度和本身的亮度,并将剩余的像素转换成标准亮度空间下的色彩。然而,由于低亮度值的确定标准及确定方法、且本身的亮度的极限值的选择,会直接影响到对图像的后续处理,所以对检索结果产生较大影响。
另外,单纯地利用纹理特征的检索方法中,不能获得高品质的图像内容。而且,如果图像的析像度发生变化,则在由此计算获得的纹理中产生较大的偏差。不仅如此,在图像受到光的照射和反射状况的影响时,形成虚拟纹理,有可能被引导向错误的方向。
另一方面,基于图像的形状特征的检索,对于轮廓不明显的图像基本没有效果。通常,被抽出的形状特征所反映的目标形状的信息,由于与人的直观完全不一致,并且难以制作完全的数学模型,所以难以对特征进行计算,且需要大量的计算时间和存储器。另外,在图像的形状发生变化时,准确性大大降低。
特别是,专利文献8适用于边缘清晰的图像,在本发明作为对象的以文字和图表为主要内容的文档图像中,容易捕捉到图像中的边缘。然而,难以确定能够表现全图像的边缘。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于夏普株式会社,未经夏普株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710090670.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:接触检测器
- 下一篇:电池极片尾部贴胶装置及方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





