[发明专利]基于位置敏感哈希的分布式向量检索方法及系统在审
| 申请号: | 201711242168.3 | 申请日: | 2017-11-30 |
| 公开(公告)号: | CN107992573A | 公开(公告)日: | 2018-05-04 |
| 发明(设计)人: | 李勋;吴松洋;陈以山;张涛 | 申请(专利权)人: | 公安部第三研究所 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
| 代理公司: | 上海天翔知识产权代理有限公司31224 | 代理人: | 刘常宝 |
| 地址: | 200031*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 位置 敏感 分布式 向量 检索 方法 系统 | ||
1.基于位置敏感哈希的分布式向量检索方法,其特征在于,包括:
利用图像哈希值比对形成相似图像的目标图像集;
利用分布式计算资源计算目标图像集中图像与待检索图像的特征向量的距离,以此确定相似图像。
2.根据权利要求1所述的分布式向量检索方法,其特征在于,所述方法中利用映射技术生成的图像哈希值。
3.根据权利要求1所述的分布式向量检索方法,其特征在于,所述方法中形成目标图像集包括如下步骤:
针对每个图像的特征向量分别进行多种映射计算,得到对应每个图像的一组哈希值;
将计算得到的每个图像的一组哈希值中的每个哈希值与待检索图像的一组哈希值中的每个哈希值进行比对,查找相似目标图像,形成目标图像集。
4.根据权利要求3所述的分布式向量检索方法,其特征在于,以Hadoop文件方式进行组织哈希库文件,每个文件以哈希值作为文件名,文件中一行内容代表一个图像。
5.根据权利要求1所述的分布式向量检索方法,其特征在于,所述方法中计算比较目标图像集中图像特征向量距离和待检索图像特征向量距离,由确定最终相似图像。
6.根据权利要求5所述的分布式向量检索方法,其特征在于,所述方法中由Hadoop计算框架来计算图像的特征向量的距离。
7.基于位置敏感哈希的分布式向量检索系统,其特征在于,所述检索系统包括:
基础图像库维护服务器,所述基础图像库维护服务器用于接收新的基础图像,并计算新图像的特征向量、哈希值,并把新图像的特征信息交给分布式计算服务器存储;
分布式计算服务器,所述分布式计算服务器用于存储基础图像库的特征向量、哈希值,并提供特征向量比对服务;
图像检索服务器,所述图像检索服务器用于处理图像检索请求,计算待检索的图像特征向量、哈希值,并把待检索的图像特征信息交给分布式计算服务器,并从分布式计算服务器获对应的取相似图像。
8.根据权利要求7所述的分布式向量检索系统,其特征在于,所述基础图像库维护服务器包括图像库维护模块,特征向计算模块以及特征向映射模块,所述图像库维护模块用于监听是否有新的基础图像;所述特征向计算模块用于计算图像库维护模块监听到的新基础图像的特征向量;所述特征向映射模块根据特征向计算模块计算得到的特征向量计算新基础图像的一组哈希值。
9.根据权利要求7所述的分布式向量检索系统,其特征在于,所述分布式计算服务器包括哈希值存储模块,哈希值对比模块,以及特征向量距离计算模块,所述哈希值存储模块用于存储基础图像库维护服务器维护的基础图像库的特征向量、哈希值;所述哈希值比对模块根据图像检索服务器发送的待检索图像的一组哈希值通过哈希值比对从哈希值存储模块中提取对应的目标文件;所述特征向量距离计算模块用于计算图像检索服务器发送的待检索图像的特征向量和目标文件中特征向量的距离,确定相似图像。
10.根据权利要求7所述的分布式向量检索系统,其特征在于,所述图像检索服务器包括图像检索模块,特征向量计算模块以及特征向量映射模块,所述图像检索模块处理图像检索请求,将待检索图像发送至特征向量计算模块;所述特征向量计算模块计算待检索图像的特征向量;所述特征向量映射模块根据特征向量计算模块计算得到的待检索图像特征向量进行映射得到待检索图像对应的一组哈希值;所述图像检索模块将待检索图像的特征向量和一组哈希值交给分布式计算服务器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于公安部第三研究所,未经公安部第三研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711242168.3/1.html,转载请声明来源钻瓜专利网。





