[发明专利]一种基于深度学习的以图搜图方法及装置在审
申请号: | 202210132113.1 | 申请日: | 2022-02-14 |
公开(公告)号: | CN114168770A | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 韩威宏;刘俊良;王怡君;张国兵;马华均;印龙兵;刘智勇 | 申请(专利权)人: | 成都四方伟业软件股份有限公司 |
主分类号: | G06F16/532 | 分类号: | G06F16/532;G06F16/583;G06V10/74;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610041 四川省*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 图搜图 方法 装置 | ||
1.一种基于深度学习的以图搜图方法,其特征在于,包括以下步骤:
S1、构建ResNET50网络模型,使用数据集训练该模型;
S2、对图片库的所有图片和待检索图片进行预处理,然后通过步骤S1的模型进行图片特征向量提取;
S3、将步骤S2中图片库的图片特征向量写入索引数据库中构成图片特征索引数据库;
S4、将步骤S2中待检索图片的图片特征向量分别与步骤S3的图片特征索引数据库中所有图片的特征向量计算相似度,得到相似度列表List;
S5、对步骤S4中相似度列表List进行大小排序,选取设定数量的相似度返回结果。
2.根据权利要求1所述的一种基于深度学习的以图搜图方法,其特征在于,步骤S1中使用DL4J深度学习框架构建ResNET50网络模型。
3.根据权利要求1所述的一种基于深度学习的以图搜图方法,其特征在于,步骤S1中使用ImageNet2012数据集训练ResNET50网络模型。
4.根据权利要求1所述的一种基于深度学习的以图搜图方法,其特征在于,步骤S2的预处理包括将图片尺寸大小统一缩放到224*224,若尺寸不足224,则进行边缘pad补充“0”扩展到224。
5.根据权利要求1所述的一种基于深度学习的以图搜图方法,其特征在于,步骤S2中预处理后的图片通过DL4J加载到步骤S1得到的ResNET50网络模型,提取“flatten_1”层的输出数据作为图片的特征向量。
6.根据权利要求1所述的一种基于深度学习的以图搜图方法,其特征在于,步骤S3中图片特征索引数据库的设计为:其中表的字段包括“id”是图片序号、“locaPath”是图片在服务器上的存储路径地址、“imgName”是图片名、“imgFeature”是图片特征向量字符串;建表语句:CREATE TABLE `image_features` ( `id` int NOT NULL AUTO_INCREMENT, `localPath` varchar(100) DEFAULT 'pathOnServer', `imgName` varchar(100)DEFAULT NULL, `imgFeature` text NOT NULL, PRIMARY KEY (`id`)) ENGINE=InnoDBAUTO_INCREMENT=5001 DEFAULT CHARSET=utf8。
7.根据权利要求1所述的一种基于深度学习的以图搜图方法,其特征在于,步骤S4中采用余弦计算相似度;其计算公式如下:
其中, ,表示n维向量x的模,x、y分别表示两个图片特征向量, 表示向量x第n维的值,n表示向量x为n维向量;表示向量y第n维的值,n表示向量y为n维向量。
8.根据权利要求1所述的一种基于深度学习的以图搜图方法,其特征在于,步骤S5的具体过程为:将List按照从大到小的顺序进行排序得到ListSorted,选取ListSorted前设定数量的值对应图片路径信息“localPath”作为返回结果。
9.一种基于深度学习的以图搜图装置,其特征在于,包括
存储器:用于存储可执行指令;
处理器:用于执行所述存储器中存储的可执行指令,实现如权利要求1-8任一项所述的一种基于深度学习的以图搜图方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都四方伟业软件股份有限公司,未经成都四方伟业软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210132113.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种铁基非晶带材叠片系数的快速测量方法
- 下一篇:合路装置及室分系统