[发明专利]图像检索装置无效
| 申请号: | 200910140212.9 | 申请日: | 2009-07-07 |
| 公开(公告)号: | CN101944091A | 公开(公告)日: | 2011-01-12 |
| 发明(设计)人: | 李季檩;范志刚;吴亚栋;乐宁 | 申请(专利权)人: | 夏普株式会社 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;H04N1/00 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 雒运朴;张浩 |
| 地址: | 日本*** | 国省代码: | 日本;JP |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图像 检索 装置 | ||
技术领域
本发明涉及一种从被登记的图像数据中检索特定的图像数据的图像检索装置。
背景技术
在复印机、传真装置、打印机以及兼具多个这几种功能的复合机等图像形成装置中,将被输入的原稿图像等图像数据存储于大容量的存储装置中,并具备如下功能,即只要是曾被输入过一次且被登记的图像数据,则无论在何时都能够读出并再次输出。
虽然能够再次输出的功能十分方便,然而由于如果被登记的数据量增多,则很难找到想要再次输出的数据,因此从多个图像数据当中检索出所需的图像数据的图像检索技术变得很重要。
在检索图像数据时,需要比较被登记的图像数据与被输入的图像数据并算出类似性,而在被登记的图像数据中,有文档图像数据和非文档图像数据(照片或图形、插图图像等)。
文档图像数据由文字图像构成,因此相当于对文字图像彼此之间进行比较,与非文档图像数据相比很难判断类似性。
专利文献1所记载的文档图像检索装置中,从输入部输入的文档图像数据或检索文档数据中识别标点符号,计测标点符号之间的文字数,将所计测出的文字数作为索引来登记,检索具有与所计测的检索文档数据的各标点符号之间的文字数相同的文字数的索引。
日本特开2008-152502号公报所记载的文档图像检索装置中,将标点符号之间的文字数作为索引来检索,这种索引是表示比较大的配置信息的量。即使是标点符号之间的文字数相同,由于很有可能会有文字本身不同的文档图像数据,因此在利用标点符号之间的文字数来进行判断的情况下,无法使检索精度足够高。
另外,标点符号是与文字相比更小的图像,在从被登记的文档图像数据、输入图像数据中识别标点符号时产生误认的可能性高,如果在识别标点符号的阶段产生误认,则被登记的索引就会缺乏正确性。
如果为了提高检索精度,而想要提高标点符号的识别精度,则需要提高读取的析像度,其结果,一个一个的文档图像数据的数据量增多,导致存储容量的增大、处理速度的降低。
发明内容
本发明的目的在于,提供能够使检索处理涉及的处理速度高速化、提高文档图像数据的检索精度的图像检索装置。
本发明提供一种图像检索装置,是从预先登记的文档图像数据当中检索与被输入的文档图像数据类似的文档图像数据的图像检索装置,其特征在于,具备:
特征量提取部,其检测出被输入的文档图像数据中所包含的单词并进行单词分割,按相邻接的每两个单词,算出这两个单词的单词长度的比,将对算出的单词长度的比按照单词的排列顺序进行排列的该单词长度的比的数组,作为被输入的文档图像数据的特征量来提取;
登记图像存储部,其将上述被登记的文档图像数据、和上述被登记的文档图像数据的上述特征量相关联地进行存储;
检索部,其基于上述被登记的文档图像数据的特征量、和由上述特征量提取部生成的上述被输入的文档图像数据的特征量,从上述被登记的文档图像数据当中,检索与上述被输入的文档图像数据类似的图像数据;
显示部,其基于由检索部进行的检索结果,显示上述被登记的文档图像数据当中的与上述被输入的文档图像数据类似的文档图像数据。
根据本发明,特征量提取部检测出被输入的文档图像数据中所包含的单词并进行单词分割,按相邻接的每两个单词,算出这两个单词的单词长度的比,将对算出的单词长度的比按照单词的排列顺序进行排列的单词长度的比的数组,作为被输入的文档图像数据的特征量来提取。在登记图像存储部中,将上述被登记的文档图像数据、和上述被登记的文档图像数据的上述特征量相关联地进行存储,检索部基于上述被登记的文档图像数据的特征量、和由上述特征量提取部生成的上述被输入的文档图像数据的特征量,从上述被登记的文档图像数据当中,检索出与上述被输入的文档图像数据类似的图像数据。
显示部基于由检索部进行的检索结果,显示上述被登记的文档图像数据当中的与上述被输入的文档图像数据类似的文档图像数据。
通过将相邻接的两个单词的单词长度的比作为特征量来采用,与如以往技术那样的将标点符号之间的文字数作为特征量来检索的情况相比,虽然是不同的文章但形成相同的特征量的可能性很低,因此能够提高文档图像数据的检索精度。
此外,由于即使是以比较低的析像度来读取的文档图像数据,单词长度也不会被误检测,因此能够使用低析像度的文档图像数据,还能够将检索处理涉及的处理速度高速化,削减用于存储文档图像数据的存储容量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于夏普株式会社,未经夏普株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910140212.9/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





