[发明专利]用于在大索引树中使用的划分高维向量的方法和装置有效
申请号: | 200980136125.4 | 申请日: | 2009-07-23 |
公开(公告)号: | CN102160034A | 公开(公告)日: | 2011-08-17 |
发明(设计)人: | 罗素·托希奥·中野 | 申请(专利权)人: | 那哈瓦有限公司 |
主分类号: | G06F9/44 | 分类号: | G06F9/44;G06F15/00;G06F17/16 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 李冬梅;郑霞 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 索引 使用 划分 向量 方法 装置 | ||
相关的申请
本专利申请要求2008年7月24日提交的、题目为“Method And Apparatus For Partitioning High-Dimension Vectors For Use In A Massive Index Tree”的美国临时申请序列号61/083404的优先权,其与本申请是同一发明人,且由此其全部内容通过引用在此并入。本专利申请要求2009年7月22日提交的、题目为“Method And Apparatus For Partitioning High-Dimension Vectors For Use In A Massive Index Tree”的美国申请序列号12/507271的优先权,其与本申请是同一发明人,且由此其全部内容通过引用在此并入。
技术领域
本发明涉及数据集。更具体地,本发明涉及用于在大索引树中使用的划分高维向量的方法和装置。
背景技术
当计算不能方便地由诸如数字或字母串的总排列表示的项的相似度时,产生了高维向量。这提出了问题。例如,在一种方法中,使用从诸如FFT和DCT的波谱技术得到的高维向量中获取的“特征(signature)”,能够计算图像的相似度[Celentano 1997(@inproceedings{celentano97fftbased,author=“Augusto Celentano and Vincenzo Di Lecce”,title=“{FFT}-Based Technique for Image-Signature Generation”,booktitle=“Storage and Retrieval for Image and Video Databases({SPIE})”,pages=“457-466”,year=“1997”,url=“citeseer.ist.psu.edu/597114.html”})]。可以通过梅尔频率声谱系数(MFCC)计算歌曲或片段中的音乐(帧)的短节之间的匹配性[Logan 2001(@misc{logan01 contentbased,author=“B.Logan and A.Salomon”,title=“A content-based music similarity function”,text=“B.Logan and A.Salomon.A content-based music similarity function.Technical report,Compaq Cambridge Research Laboratory,June 2001.”,year=“2001”,url=“citeseer.ist.psu.edu/logan01 contentbased.html”})],其通过离散余弦变换(DCT)得到。存储在基因组数据库中的染色体之间的相似度能够通过将核苷酸系列表示为从马尔可夫转换模型获得的高维稀疏向量来计算[Nakano 2004(Russell Nakano,“Method and apparatus for fundamental operations on token sequences:computing similarity,extracting terms values,and searching efficiently”,U.S.Patent Application,20040162827,August 19,2004.)]。
附图说明
本发明通过实例进行说明,且不限于附图中的图,附图中;
图1示出了其中可实现本发明的方法和装置的网络环境;
图2是其中可实现本发明的某些实施方式和其中可使用本发明的某些实施方式的计算机系统的框图;
图3示出了本发明的一个实施方式,其示出了用于平衡二叉树的术语;
图4示出了具有两个向量输入和一个向量输出的“优化(majorize)”辅助函数的一个实施方式;
图5示出了“initialGuess”方法的一个实施方式,其展示了作为向量集合的输入和作为分裂向量猜测的输出;
图6示出了具有多个向量的输入和一个分裂向量的输出的计算分裂向量方法的一个实施方式。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于那哈瓦有限公司,未经那哈瓦有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200980136125.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自废锂电池中回收有价金属的工艺
- 下一篇:燃烧器装置