[发明专利]用于图像辨识的描述符小块的快速子空间投影无效
申请号: | 201080054401.5 | 申请日: | 2010-12-02 |
公开(公告)号: | CN102782708A | 公开(公告)日: | 2012-11-14 |
发明(设计)人: | 奥努尔·C·哈姆西奇;尤里娅·列兹尼克;约翰·H·洪;桑迪普·瓦达迪;重·U·李 | 申请(专利权)人: | 高通股份有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46 |
代理公司: | 北京律盟知识产权代理有限责任公司 11287 | 代理人: | 宋献涛 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 图像 辨识 描述 小块 快速 空间 投影 | ||
根据35U.S.C.§119主张优先权
本专利申请案主张2009年12月2日申请的标题为“用于图像辨识的描述符小块的快速子空间投影(Fast Subspace Projection of Descriptor Patches for Image Recognition)”的第61/265,950号美国临时申请案,和2010年11月11日申请的标题为“尺度空间中的快速描述符提取(Fast Descriptor Extraction in Scale-Space)”的第61/412,759号美国临时申请案的优先权,两申请案均转让给其受让人且特此以引用的方式明确并入本文中。
技术领域
一个特征涉及计算机视觉,且更特定来说,涉及用于改进图像的辨识和检索性能、处理和/或压缩的方法和技术。
背景技术
各种应用可受益于具有能够识别视觉表示中的目标(例如,图像或图片)的机器或处理器。计算机视觉的领域试图提供准许识别图像中的目标或特征的技术和/或算法,其中目标或特征可通过识别一个或一个以上关键点的描述符而表征。这些技术和/或算法常常也适用于人脸辨识、目标检测、图像匹配、3维结构构造、立体对应和/或运动追踪,以及其它应用。一般来说,出于特征识别、图像检索和/或目标辨识的目的,目标或特征辨识可涉及识别图像中的兴趣点(也称作关键点)。优选地,可选择和/或处理关键点,使得其对于图像尺度改变和/或旋转为不变的并跨越失真的实质性范围、视点改变和/或噪声和照度改变提供稳健匹配(robust matching)。另外,为了良好地适合于例如图像检索和目标辨识的任务,特征描述符可优选地在以下意义上有区别,单一特征可以高概率与来自多个目标图像的特征的大数据库正确地匹配。
在检测和定位图像中的关键点之后,可通过使用各种描述符来识别或描述所述关键点。举例来说,描述符可表示图像中的内容的视觉特征,例如,形状、颜色、纹理、旋转和/或运动,以及其它图像特性。描述符可表示关键点和所述关键点周围的局部邻域。描述符提取的目的为获得关键点周围的局部信息的稳健、无噪声表示。此可通过将描述符投影到无噪声主成分分析(PCA)子空间来完成。PCA涉及正交线性变换,所述正交线性变换将数据(例如,图像中的关键点)变换为新坐标系,使得通过数据的任何投影所产生的最大方差位于第一坐标(称作第一主成分)上,第二最大方差位于第二坐标(第二主成分)上,等等。然而,到PCA子空间的这种投影需要计算上复杂的与高维投影向量的内积。
对应于关键点且由描述符表示的个别特征与来自已知目标的特征的数据库匹配。因此,可将对应搜索系统分离为三个模块:关键点检测器、特征描述符和对应定位器。在这三个逻辑模块中,描述符的构造复杂性和维数对特征匹配系统的性能具有直接和显著影响。已提议多种描述符,其中每个描述符具有不同优点。尺度不变特征变换(SIFT)开放12σ×12σ小块,所述小块与邻域中的主定向对准且经大小设计以与所检测关键点σ的尺度层级成比例。此区中的梯度值在4×4单元中相加,其中每个单元中有8个频率组定向直方图。PCA-SIFT展示邻域中的梯度值可以极小子空间表示。
描述符提取程序中的大多数对减少维数以消除噪声并改进辨识准确性的优点意见一致。然而,与将描述符投影到低维子空间相关联的大的计算复杂性妨碍了其实际使用。举例来说,PCA-SIFT小块大小为39×39,此导致在x方向和y方向上考虑梯度值的2*392维投影向量。因此,查询图像中的每个描述符针对到d维子空间的投影需要2*392*d次乘法和加法。尽管此对于大功率的服务器侧机器可能不产生显著低效率,但在具有有限处理资源的实施(例如,移动电话)中可能是瓶颈。
这些特征描述符正越来越多地发现实时目标辨识、3D重建、全景拼接、机器人映射、视频跟踪和类似任务中的应用。取决于应用,特征描述符(或等效物)的传输和/或存储可限制目标检测的计算速度和/或图像数据库的大小。在移动装置(例如,相机电话、移动电话等)或分布式相机网络的情况下,可在节点之间的描述符提取中花费显著通信和处理资源。描述符提取的计算密集过程倾向于妨碍或复杂化其在资源有限装置(例如,移动电话)上的应用。
因此,存在对快速且有效地产生局部特征描述符的方式的需要。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201080054401.5/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序