[发明专利]图像描述符生成方法和系统、图像检测方法和系统有效

申请号：	201210045691.8	申请日：	2012-02-24
公开（公告）号：	CN103295186A	公开（公告）日：	2013-09-11
发明（设计）人：	张文文;姜涌;胥立丰	申请（专利权）人：	佳能株式会社
主分类号：	G06T3/00	分类号：	G06T3/00;G06T9/00;G06T7/00
代理公司：	中国国际贸易促进委员会专利商标事务所 11038	代理人：	康建忠
地址：	日本***	国省代码：	日本;JP
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	图像描述生成方法系统检测
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及图像描述符生成方法和系统，以及图像检测方法和系统。

特别地，本发明涉及用于基于图像中包含的多个像素区域各自的像素区域类别生成该图像的描述符的方法和系统。

本发明还涉及利用上述的图像描述符生成方法的图像检测方法和系统。

背景技术

在图像处理、计算机视觉和图案识别等领域中，如文档1和文档2所公开的，诸如脸部、人、汽车等的特定对象或类别的检测在近数十年来得到飞速发展。可通过训练大量的样本来提取公共的而且有辨别力(discriminative)的图案或特征以描述图像的形态(morphology)。然而对于一般的或者无训练的对象检测，有效的且鲁棒的特征描述符是最重要的。

传统的图像区域描述方法利用特征向量，该特征向量代表图像的特征的全局分布而具有任何空间或结构相关信息，因此其具有有限的辨别力并且易于误检(false positive)。

近年来，基于图像分割的方法已被提出。一般来说，基于图像分割的方法首先将整个图像分割成预先限定的区域；然后独立地对于每个分割后的图像区域生成特征向量，最后将所有生成的特征向量集合成用于整个图像的单个描述符。因此，用于整个图像的单个描述符集成了该图像的空间或结构相关信息，并且将更加有效地代表该图像。

特别地，两种类型的基于图像分割的方法已被广泛使用。一种基于图像分割的方法被称为基于网格的图像分割方法，如图1所示。基于网格的图像分割方法首先将图像划分成多个规则的网格，例如方形网格，然后提取每个网格区域中的特征向量，最终依次将所有网格区域特征向量集合成单个图像向量以获得图像的描述符。

用于整个图像的单个描述符通常以如图1所示的直方图的形式被示出，在图1中横坐标指示特定颜色空间中的分区段的颜色分量，而纵坐标指示与每种颜色分量对应的像素的出现频率，该出现频率通常由像素数表示。

但是，基于网格的图像分割方法对于面内旋转敏感，例如当图像旋转90°时，描述符的直方图将大不相同。也就是说，通过基于网格的图像分割方法生成的描述符对于面内旋转敏感并且不是那么鲁棒。

另一种基于图像分割的方法被称为基于圆的图像分割方法，如图2所示。基于圆的图像分割方法将图像划分成多个同心圆区域，该多个同心圆区域的共同中心为该图像的中心。因此，通过基于圆的图像分割方法生成的描述符对于面内旋转是鲁棒的。但是，该基于圆的图像分割方法没有考虑图像特征，这样限制了其的鲁棒性。此外，该方法对于面外旋转和变形是敏感的。

如上文描述可见，尽管基于图像分割的方法可产生包括图像的空间或结构相关信息并且可相对有效地代表图像的图像描述符，但是基于图像分割的方法对于图像的旋转(诸如图像的面内旋转或面外旋转)是敏感的，因此通过基于图像分割的方法生成的描述符的鲁棒性受限。

近年来，基于像素分类的方法已被提出以克服基于图像分割的方法的不足并且实现更加鲁棒的描述符。基于像素分类的方法首先将图像中所包含的像素分成若干类别，然后生成各类别的特征向量，最后将所有特征向量组合成单个描述符。

两种基于像素分类的颜色特征描述方法已被引入并且被广泛用于基于内容的图像检索。

一种基于像素分类的方法被称为如文档3中所引用的BIC(边界/内部颜色)方法。BIC方法首先利用预定量化方案将指定颜色空间中的像素量化；此后，将像素分类为边界像素或内部像素。当像素位于图像本身的边界时(例如，如图3所示，位于图像外边界处的像素)或者该像素的四个相邻像素之中的至少一个具有不同的量化颜色时(例如，位于量化边界处的像素)，该像素被分类为边界像素，当像素的全部四个相邻像素都具有相同的量化颜色时，该像素被分类为内部像素。最后，生成由两个颜色直方图构成的描述符(如图3所示)，这两个颜色直方图分别代表内部和边界像素的统计颜色分布。

但是，尽管通过BIC方法生成的描述符的鲁棒性稍有提高，但是由于图像边界对于照度变化和噪声敏感，因此该描述符对于照度变化和噪声是敏感的。此外，由于量化后的边界依赖于颜色量化方案，这使得量化过程与颜色特征相耦合，因此该描述符也是特征相关的。

另一种基于像素分类的方法被称为如文档4中所引用的CCV(颜色连贯向量(color coherent vector))方法。CCV分类方法基于相连分量的大小并且引入了经验大小阈值。当像素为具有大于该预定的阈值的大小的连续区域的一部分时，将该像素分类为连贯像素(例如，图4中的红色和绿色像素)；否则，将该像素分类为不连贯像素(例如，图4中的蓝色像素)。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于佳能株式会社，未经佳能株式会社许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201210045691.8/2.html，转载请声明来源钻瓜专利网。

上一篇：图像处理方法和设备以及物体检测方法和系统
下一篇：一种营养评估系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06T 一般的图像数据处理或产生
G06T3-00 在图像平面内的图形图像转换，例如，从位像到位像地建立一个不同图像
G06T3-20 .整个或部分图形的线性转换，如面位显示
G06T3-40 .整个或部分图形的定标
G06T3-60 .整个或部分图形的旋转

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]图像描述符生成方法和系统、图像检测方法和系统有效

专利文献下载