[发明专利]用于彩色图像表示与检索的方法和装置有效
申请号: | 00809556.6 | 申请日: | 2000-04-28 |
公开(公告)号: | CN1358296A | 公开(公告)日: | 2002-07-10 |
发明(设计)人: | L·茨普林斯基 | 申请(专利权)人: | 三菱电机信息技术中心欧洲有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06F17/30 |
代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 王勇,陈霁 |
地址: | 英国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 彩色 图像 表示 检索 方法 装置 | ||
本发明涉及用于以检索为目的的进行彩色图像或者图像区表示的方法和装置,以及用于检索彩色图像或者图像区的方法和装置。
已知基于图像内容的用于恢复来自例如多媒体数据库的静止图像和视频图像的检索技术。许多图像特点包括颜色、纹理、边沿信息、形状和运动,已经为这种技术所采用。这种技术的应用包括互联网搜索引擎、交互式电视、远距离治疗和远距离购物。
为对来自图像数据库的图像进行恢复,用描述符包括基于图像中颜色的描述符表示图像或者图像区。已知许多不同类型的基于颜色的描述符,包括图像区的平均颜色、基于图像区范围内颜色变化的统计矩、代表颜色诸如覆盖图像区中最大区域的颜色,以及颜色直方图,其中的直方图是通过对一组预设颜色中的每一种颜色区中的像素进行计数导出的。
一种已知的基于内容的图像恢复系统是QBIC(图像内容查询:query by image content)(见US5579471,MPEG文件MPEGM4582/P165:用于MPEG-7的颜色描述符,IBM公司Almaden研究中心)。在该系统的运行模式中的一个模式中,数据库中的每一个图像被分成块。每一块被分成具有相似颜色的子集并且选择这种最大的子集。将所选子集的平均颜色选作各自块的代表颜色。该代表颜色信息被存储在数据库中。可以通过选择查询图像进行数据库中的查询。采用上述相同的方式导出针对该查询图像的代表颜色信息。然后利用一种算法将该查询信息与存储在该数据库中的图像的信息进行比较以确定最接近的匹配。
MPEG文件M4582/P437和US5586197公开了一种相似的方法,但采用的是一种更为灵活的将图像分成块和不同的比较图像的方法。在MPEG文件M4582/P576中所述的另一变型中:视觉目标的颜色表示,对每区两种代表色中的每一种颜色采用一个单一值。
一些基于颜色直方图的图像表示方法已经得到开发,诸如MPEG文件M4582/P76:一种针对MPEG-7的颜色描述符:可变方块的颜色直方图。其它技术采用了图像区中颜色分布的统计描述。例如,MPEG文件M4582/P549:利用视频序列中子区的图片信息测度的颜色描述符,公开了一种技术,该技术将图像分成高熵和低熵区并且对每一类区计算颜色分布特点。MPEG文件M4852/P319:MPEG-7颜色描述符建议对采用一个平均值和一个协方差值作为图像区的描述符进行了描述。
所有上述方法都有严重的缺点。它们中的一些方法精度高,具体指颜色直方图技术,但是需要相对大量的存储和处理时间。其它方法诸如采用一种或者两种代表颜色的方法有高的存储和计算效率,但是精度不够高。这些统计描述符在这两类技术之间进行折衷,但是它们都缺乏灵活性,特别是当出现像素颜色在一个区内进行大范围变化的情况。
本发明提供了一种通过利用若干分量分布进行近似彩色分布以导出图像区的描述符来表示图像的方法,每一个该分量分布对应于图像区中的一种代表颜色。
本发明还提供一种利用这种描述符检索图像的方法。
本发明还提供一个计算机程序用于实施所述方法以及计算机可读的存储这种计算机程序的介质。该计算机可读介质可以是可分离介质诸如软盘或者CD-ROM或者诸如RAM的存储器。
将参照以下附图对本发明的一个实施方案进行描述:
图1是根据本发明的一个实施方案的系统的方框图;
图2是第一检索方法的流程图;和
图3是第二检索方法的流程图。
图1展示出根据本发明的一个实施方案的系统。该系统包括控制单元2例如用于控制系统运行的计算机、与控制单元2相连接用于显示包括图像和文字的输出的显示单元4例如监视器、以及给控制单元2输入指令的指示装置6例如鼠标。该系统还包括存储多个视频序列的数字版本的图像数据库8以及存储描述符信息的描述符数据库10,这将在下文中针对出现在存储图像数据库8中的图像中的每一个进行更详细的描述。图像数据库8和描述符数据库10中的每一个数据库都与控制单元2相连接。该系统还包括一个检索引擎12,检索引擎12是一个受控制单元2控制的计算机程序并且运行在描述符数据库10上。
在该实施方案中,系统元在一个单一位置例如图像库被提供,在该位置上系统部件被永久链接。
描述符数据库10存储存储在图像数据库中所有图像的描述符。更具体而言,在该实施方案中,描述符数据库10包含针对每一图像的多个区中的每一个的描述符。对该描述符的导出将在下文中进行描述。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三菱电机信息技术中心欧洲有限公司,未经三菱电机信息技术中心欧洲有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/00809556.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:交互式设备网络注册协议
- 下一篇:多位沟道电容器
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序