[发明专利]用于查找最近邻的方法和设备有效
| 申请号: | 201180060459.5 | 申请日: | 2011-12-15 |
| 公开(公告)号: | CN103403704A | 公开(公告)日: | 2013-11-20 |
| 发明(设计)人: | 摩塔萨姆·彻海博尔 | 申请(专利权)人: | 伊维赛斯公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/46;G06K9/62 |
| 代理公司: | 北京派特恩知识产权代理事务所(普通合伙) 11270 | 代理人: | 归莹;张颖玲 |
| 地址: | 丹麦哥*** | 国省代码: | 丹麦;DK |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 查找 近邻 方法 设备 | ||
技术领域
本发明涉及一种用于查找最近邻的方法和装置。更特别地,本发明涉及多维数据(例如,矢量)的分类、搜索和匹配以查找最近邻。该方法作为尺度不变特征转换(SIFT)算法的一部分尤其有用。
背景技术
美国专利6711293B1的发明人罗尔(Lowe)利用了被认为是最优柱优先(Best-bin-first)搜索的k维树算法(k-d tree algorithm)的修正,最优柱优先搜索算法能够只利用有限量的计算以很大的概率识别最近邻。
US2010/0067745公开了一种用于视频中的对象收集和识别的方法。尤其是,它涉及人脸图像的识别。该方法利用了很可能与同一人相关联的视频对象的集群。如果新图像到现有集群的距离小于预定的第一阈值距离,则该新图像被视为属于该集群。如果新图像到该集群的距离大于第二阈值距离(该第二阈值距离小于该第一阈值距离),则该新图像成为该集群的一部分。
Ye,L.等人的“Autocannibalistic and Anyspace Indexing Algorithms with Applications toSensor Data Mining”,加利福尼亚大学计算机科学与工程系,Riverside,US,85-96,提供了变化的Orchard算法(Orchard algorithm)。在此,牺牲了速度以减少对内存的需求。这一设计仔细推敲了牺牲多少速度以节约内存。然而,无论再怎样的情况下,该算法都要求了空间的最小值。在Orchard算法中,对于数据集的每项都计算出其近邻的分类表。对较大的数据集,这就需要大量的内存。在变化的Orchard算法中,相互接近的项与项的行被删除以节约空间。因此,搜索算法牺牲了速度以换取存储空间。Ye等人.进一步提出了动态的内存分配以对算法进行优化。
Vidal Ruiz,E.,“An algorithm for finding nearest neighbours in(approximately)constantaverage time”,Pattern Recognition Letters4(1986),145-157,涉及以近似恒定的平均时间复杂度(例如,与数据集的规模无关)查找给定样本的最近邻的算法。
发明内容
最近邻的搜索问题(最近邻搜索,也被认为是接近度搜索、相似度搜索或最近点搜索)出现在众多应用领域当中,包括,但并不仅限于:模式识别(尤其用于光学特性识别);统计分类(k最近邻算法);计算机视觉;数据库中基于内容的图像检索;编码理论;数据压缩;推荐系统;网络销售;DNA测序;拼写检查(建议正确的拼写);剽窃检测;用于预测职业运动员的职业道路的相似度分数;集群分析(将一组观察数据分配到子集,(例如,集群)以便相同集群里的观察数据在某种程度上是相似的,该分配通常基于欧氏距离(Euclideandistance));多元密度估计和模式分类;以及机器学习。
本发明的发明人发明出允许更短的查找时间,并且更能够容易地适用于并行处理以允许另外缩短查找时间的方法。
根据本发明的一个方面,本发明涉及一种在由多个矢量组成的数据集中对一特定矢量进行匹配的方法,该方法包括以下步骤:
i.选择一参考点矢量;
ii计算所述参考点矢量与所述数据集中的所述矢量之间的距离d;
iii.将所述数据集中的所述矢量分类到不同的组中,所述每个组中的矢量与所述参考点矢量有相同距离dgroup;
iv.随后将包括两个以上矢量的所述每个组进行重新排列,以便所述组中的第二矢量到所述组中的第一矢量有最小距离,并且所述组中每个后续的矢量到组中的前一个矢量都有最小距离;
v.识别对于所述特定矢量的最佳匹配,通过:
a.计算所述参考点矢量和所述特定矢量之间的距离dspecific;
b.识别具有最接近于计算的所述距离dspecific的距离d的矢量的一个或多个组;
c.在所识别的一个或多个组中识别具有与所述特定矢量最近的距离dminimum的一个或多个矢量;
d.识别与所述参考点矢量距离为d的任一额外的组,所述距离d从所述参考点矢量开始并且在从零矢量和dspecific-dminimum中的较大的一个到dspecific+dminimum的区间上;以及
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于伊维赛斯公司,未经伊维赛斯公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180060459.5/2.html,转载请声明来源钻瓜专利网。





