[发明专利]一种基于GPU并行运算的以图搜图系统及方法有效
申请号: | 201910806586.3 | 申请日: | 2019-08-29 |
公开(公告)号: | CN110633379B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 徐英浩;于伟 | 申请(专利权)人: | 北京睿企信息科技有限公司;日照睿安信息科技有限公司 |
主分类号: | G06F16/51 | 分类号: | G06F16/51;G06F16/55;G06F16/583 |
代理公司: | 北京纽乐康知识产权代理事务所(普通合伙) 11210 | 代理人: | 秦月贞 |
地址: | 100007 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 gpu 并行 运算 图搜图 系统 方法 | ||
本发明涉及一种基于GPU并行运算的以图搜图系统及方法,包括图片上传模块、目标检测模块、特征提取模块、聚类索引模块、三级缓存模块、并行检索模块。本发明可基于海量图片数据,使用特征提取算法和聚类算法对数据进行聚类梳理建立索引,并通过基于并行运算的高速检索算法为用户提供高速搜图功能,实现对上百亿图片数据的秒内搜索。
技术领域
本发明涉及大数据检索领域,具体来说,涉及一种基于GPU并行运算的以图搜图系统及方法。
背景技术
用户在日常工作中经常需要对图片、照片等线索进行排查,但要在海量的数据库中进行图片搜索是一个技术挑战,而且现有搜索技术的时间效率也比较差,单次搜索的时间往往需要十秒以上甚至数十秒。用户在进行图像视频检索时通常需要多次检索,而搜索的响应速度就成了影响效率的重要因素。在这一背景下,需要搭载一个集成目标检测、特征提取等人工智能算法和基于图形计算单元(以下简称GPU)并行运算的高速检索技术的以图搜图系统,为用户提供多种基于不同条件的搜索功能,进而大大提升海量图片数据库的检索效率和用户的日常工作效率。
针对相关技术中的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术中的上述技术问题,本发明提出一种基于GPU并行运算的以图搜图系统及方法,可基于海量图片数据,使用特征提取算法和聚类算法对数据进行聚类梳理建立索引,并通过基于并行运算的高速检索算法为用户提供高速搜图功能,实现对上百亿图片数据的秒内搜索。
为实现上述技术目的,本发明的技术方案是这样实现的:
一种基于GPU并行运算的以图搜图系统,包括:
图片上传模块,用于将待搜索图片上传到系统中;
目标检测模块,用于对上传的图片进行检测和分割;
特征提取模块,用于对待搜索图片进行特征提取,并将图片抽象化成高维向量;
聚类索引模块,用于对图片库中未整理过的图片向量按照不同聚类类别分别进行聚类并建立一级索引,然后对结果再次进行聚类并建立二级索引;
三级缓存模块,用于将所述的一级索引和二级索引分别预加载在内存和显存中,并将向量放在SSD固态硬盘上等待读取;
并行检索模块,用于依照所述的二级索引、一级索引、向量的顺序进行搜索,得到与待搜索图片最相似的搜索结果。
优选的,根据权利要求1所述的一种基于GPU并行运算的以图搜图系统,其特征在于,用户上传图片格式为jpg、png。
优选的,所述目标检测模块将图片中人、车、物分割作为候选搜索目标,另外,图片整体同样也作为候选搜索目标。
优选的,特征提取时将图片送入预训练好的模型来获取向量结果。
优选的,所述聚类类别包括图片时间、拍摄地点以及图片类别。
一种基于GPU并行运算的以图搜图方法,包括以下步骤:
S1、将待搜索图片上传到系统中;
S2、对上传的图片进行检测和分割;
S3、对待搜索图片进行特征提取,并将图片抽象化成高维向量;
S4、对图片库中未整理过的图片向量按照不同聚类类别分别进行聚类并建立一级索引,然后对结果再次进行聚类并建立二级索引;
S5、将一级索引和二级索引分别预加载在内存和显存中,并将向量放在SSD固态硬盘上等待读取;
S6、依照二级索引、一级索引、向量的顺序进行搜索,得到与待搜索图片最相似的搜索结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京睿企信息科技有限公司;日照睿安信息科技有限公司,未经北京睿企信息科技有限公司;日照睿安信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910806586.3/2.html,转载请声明来源钻瓜专利网。