[发明专利]文档图像的检索装置及文档图像的检索方法有效

专利信息
申请号: 200710090670.7 申请日: 2007-03-30
公开(公告)号: CN101276363A 公开(公告)日: 2008-10-01
发明(设计)人: 陈芒;吴波;吴亚栋;许晨 申请(专利权)人: 夏普株式会社
主分类号: G06F17/30 分类号: G06F17/30;G06K9/00
代理公司: 北京集佳知识产权代理有限公司 代理人: 雒运朴;徐谦
地址: 日本*** 国省代码: 日本;JP
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文档 图像 检索 装置 方法
【说明书】:

技术领域

本发明涉及对以文字和图表为主要内容的图像即文档图像,采用图像的特征进行检索的文档图像的检索装置及检索方法。

背景技术

一种利用图像扫描仪等图像输入装置将文档转换成图像,以电子形式进行储存,并且之后能够检索的图像归档系统已经步入实用化。在将文档作为图像来读取的图像检索中,可采用图像检索技术。

以往,作为图像检索技术,有基于附加在图像中的文本的检索、和基于图像的视觉内容的检索。

其中,所谓基于附加在图像中的文本的检索,是指作为图像所附属的信息而制作说明图像的文本信息,将该文本信息作为关键词检索图像的技术,作为现有技术,例如有专利文献1、2。

然而,虽然计算机视觉和人工智能技术正在日益发展,但在现阶段还不能依靠它来对图像自动地附加文本。因此,在基于文本的检索中,需要人工来附加文本,因此需要烦琐的作业。

而且,由于由人工来进行,所以有可能加入人的主观意识,在附加的文本中产生意思上的差异。另外,由于对于向图像附加文本的附加方法,还没有制定规则,所以关于关键词的解释也存在一定程度的差异。这些的结果,会导致通过检索所得到的图像不一定是用户的目标图像,对检索的正确率产生影响。

并且,在基于文本的图像的检索技术中,由于一概不使用图像的视觉特征(例如色彩或纹理),所以不能说是充分表达了图像的信息。

相对于此,由于基于图像的视觉内容的检索是基于图像的特征来检索图像的,且根据图像来检索图像,所以不需要依赖于人工来输入文本,且不需要烦琐的作业,也不会加入人的主观意识。

作为图像的特征,通常采用色彩特征、纹理特征、以及形状特征这3种特征。

色彩特征是图像的整体属性,其利用图像的色彩信息来表现图像的表面性质,作为现有技术,例如有专利文献3、4。

纹理特征是反映图像的局部构造的特征,且表现图像的表面性质的特征,其需要在包含多个像素点的区域内进行局部统计计算。作为现有技术,例如有专利文献5、6。

形状特征是对于图像的特定区域首先进行图像的分割、区域识别,然后从其中抽出与形状特征有关的特征。作为现有技术,例如有专利文献7、8。

专利文献1:CN1851713“基于多图像文本的图像检索及显示方法”

专利文献2:CN1402853“图像检索系统及图像检索方法”

专利文献3:CN1365067“基于色彩和图像特征组合的图像检索方法”

专利文献4:CN1426002“不受照明变化影响的图像检索方法和装置”

专利文献5:CN1570972“一种基于图像纹理特征的图像检索方法”

专利文献6:CN1342300“用频域中的伽柏滤波器的纹理描述方法和基于纹理的图像检索方法”

专利文献7:CN1570969“一种基于显著兴趣点的图像检索方法”

专利文献8:CN1570973“一种利用显著边缘进行图像检索的方法”

然而,在上述以往的基于图像的视觉内容的检索中,存在着如下问题。

图像通常受到干扰,受其影响产生变形或歪扭。在以纹理和色彩作为图像特征的检索方法中,若产生变形或歪扭,则不能获得理想的检索效果。

另外,由于色彩相对图像区域的方向和尺寸的变化不敏感,所以根据色彩的特征不能顺利地捕捉到局部特征。

特别是专利文献4,考虑到照明对图像形成时的色彩信息所产生的影响,而对图像去除低亮度和本身的亮度,并将剩余的像素转换成标准亮度空间下的色彩。然而,由于低亮度值的确定标准及确定方法、且本身的亮度的极限值的选择,会直接影响到对图像的后续处理,所以对检索结果产生较大影响。

另外,单纯地利用纹理特征的检索方法中,不能获得高品质的图像内容。而且,如果图像的析像度发生变化,则在由此计算获得的纹理中产生较大的偏差。不仅如此,在图像受到光的照射和反射状况的影响时,形成虚拟纹理,有可能被引导向错误的方向。

另一方面,基于图像的形状特征的检索,对于轮廓不明显的图像基本没有效果。通常,被抽出的形状特征所反映的目标形状的信息,由于与人的直观完全不一致,并且难以制作完全的数学模型,所以难以对特征进行计算,且需要大量的计算时间和存储器。另外,在图像的形状发生变化时,准确性大大降低。

特别是,专利文献8适用于边缘清晰的图像,在本发明作为对象的以文字和图表为主要内容的文档图像中,容易捕捉到图像中的边缘。然而,难以确定能够表现全图像的边缘。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于夏普株式会社,未经夏普株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200710090670.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top