[发明专利]匹配图像的系统和方法有效
| 申请号: | 201080010602.5 | 申请日: | 2010-01-15 |
| 公开(公告)号: | CN102341813A | 公开(公告)日: | 2012-02-01 |
| 发明(设计)人: | M·A·鲁宗;D·坦圭 | 申请(专利权)人: | A9.COM有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 钱孟清 |
| 地址: | 美国加利*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 匹配 图像 系统 方法 | ||
技术领域
本发明通常涉及数字图像处理领域。更具体地,本发明涉及一种将图像与另一图像匹配的方法和系统。
背景技术
图像匹配是用于计算机视觉、对象识别、运动跟踪、3D建模等中的基本技术。实施图像匹配用来检查两个图像是否具有相同内容。该两个图像不需要完全相同。例如,可旋转一个图像或从不同视角使用一个图像,在与另一个图像比较时,或者其可以是另一个图像的缩放版本。进一步地,可在不同的光照条件下使用该两个图像。尽管在该两个图像中有这样的变化,他们包含相同的内容,场景或对象。因此,使用图像匹配技术来有效地匹配图像。
常见图像匹配算法利用了对象或场景的图像包含多个特征点的事实。特征点是在图像中的特定点,其对于在图像旋转、成比例、视角或光照环境中的变化而言是健壮的。这意味着这些特征点将经常出现在两个图像中,即使该两个图像在较早描述的方式中不同。因此,该图像匹配算法的第一阶段是找到在该图像中的这些特征点。通常,构建图像金字塔用来确定该图像的特征点。该图像金字塔是该图像的尺度空间表示,即,其包含了各种金字塔图像,其每一个是以特定尺度的图像表示。该尺度空间表示使得该图像匹配算法来匹配在整个尺度上不同的图像。在确定了该图像金字塔中该金字塔图像的特征点后,基于在该特征点处的本地图像梯度来确定该特征点的取向。这些取向对于旋转提供了该特征点的不变性。该特征向量表示为在局部变形和照明中的显著变化作准备,即,该特征向量对于在光照环境中的变形和变化而言是不变的。
该特征点,他们的取向和该金字塔图像的特征向量形成了该图像的完全表示。这些表示可在图像中比较以找到匹配图像。基于图像的特征点匹配,一对图像相匹配。可将该对图像确定为匹配,当充分数量的特征点与另一个图像的相应特征点在视觉上和几何上都匹配时。相互接近的特征向量在视觉上相同,该对应特征点被称为‘假定对应’或‘对应’。一般地,该假定对应由统计算法来处理以测试几何上的一致。
一般地,对于图像的几何匹配,所用的统计算法是随机取样一致性(RANSAC)算法,尽管可使用RANSAC类似算法的其他变体或其他统计算法。在RANSAC中,一小组假定对应被随机取样。此后,使用这些取样特征点来生成几何变换。在生成该变换后,确定了适合该模型的假定对应。适合该模型的假定对应在几何上是一致的并被称为‘内窗层’。此后确定了该内窗层的总数。重复上述步骤,直到重复/试验的次数大于预定阈值或该图像的内窗层数量足够多到将图像确定为匹配。该RANSAC算法返回具有对应于该模型的最高数量内窗层的模型。
与使用该类型方法相关的一个问题在于,该统计算法所生成的该组可能变换可能大于该组物理有效变换。例如,该变换可能翻动矩形的一边,导致不可能获取坚固对象的旋转。在另一实施例中,其可能翻动该整个矩形,仅仅通过拍摄该对象的倒影来实现变换。这可能引导不正确的图像匹配。进一步地,这可能导致无用的计算,因为进行了该变换所生成的参数/点的分析,即使该变换本身可能是物理上无效或不切实际的。
在该假定对应中的每一个特征点具有与其相关的取向。在需要旋转不变性的应用中,对于成为有效的变换,更可取的应当保留在假定对应中两个特征点的取向。使用RANSAC的许多应用并不考虑这个限制。
即使确定了该假定对应是紧密匹配,一般地,该假定对应单独无法确保该图像对形成最后的匹配。假定对应仅仅给出在该图像对特征点之间视觉相似性相关的信息。这一般不足以确定在该图像对之间的最后匹配。存在一种可能,两个图像的对应区域可能生成多个假定对应。例如,如果图像特征在超过一个尺度处显著,可生成多个特征点,也许形成多个假定对应。选择这些假定对应之一以生成另一个假定对应将同样成为内窗层的该变换方式,因而创建了错误意义的信息,即用该变换的匹配的该两个图像是真正匹配。移走一组对应特征点的所有除了一个,先验是错误的方式,因为对应不同查询图像可能不存在多个假定对应,以及决不告诉哪一个是最好,因为可能不存在多个被错误解释的假定对应。换句话说,仅仅使用假定对应一般无法提供足够信息以便建立在该查询图像和该数据库图像之间的清楚匹配。
而且,该两个图像可共享该图像的元件或一小部分,类似公司或其他实体的标记,会成为可能。该图像同样可能共享以相同字体的文本片段。这些共享元件可能创建了足够的内窗层用来宣布图像匹配,而实际上该两个图像不相同。进一步地,可能存在的情况是,查询图像可能具有多个图像对象,其中每一个表示在分开的数据库图像中。该数据库图像是多个该查询图像需要进行匹配的图像。
存在对一种克服上述限制的改善的图像匹配方法的需求。
发明概述
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于A9.COM有限公司,未经A9.COM有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201080010602.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电致变色材料和包括其的电致变色器件
- 下一篇:光电模块及其发光方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





