[发明专利]配对图片集的生成方法、装置、电子设备和存储介质有效
申请号: | 202110468967.2 | 申请日: | 2021-04-28 |
公开(公告)号: | CN113190698B | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 龚震霆 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/53 | 分类号: | G06F16/53;G06F16/55;G06F16/583 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 王萌 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 配对 图片集 生成 方法 装置 电子设备 存储 介质 | ||
1.一种配对图片集的生成方法,包括:
获取用户输入的搜索信息;
根据所述搜索信息,生成图片数据集;所述图片数据集,包括多个键值对中的图片集;
将所述数据集中的每一个图片输入经过训练的第一特征提取模型,生成所述每一个图片的第一粒度类别特征;
将所述数据集中的每一个图片输入经过训练的第二特征提取模型,生成所述每一个图片的第二粒度类别全局特征和第二粒度类别局部特征;
将所述每一个图片的第一粒度类别特征,所述每一个图片的第二粒度类别全局特征和第二粒度类别局部特征进行融合,得到所述每一个图片的多粒度类别特征,其中,所述多粒度类别特征指示了特征提取的粒度大小;其中,所述第一粒度类别特征的粒度粗于所述第二粒度类别特征的粒度;
对每一个键值对中的图片集,选取第一粒度类别特征和/或第二粒度类别全局特征匹配的候选配对图片集;
针对每一个所述候选配对图片集,选取第二粒度类别局部特征匹配的第一配对图片集;
根据多个所述第一配对图片集,生成配对图片集。
2.根据权利要求1所述的方法,其中,所述根据所述搜索信息,生成图片数据集,包括:
根据所述搜索信息,获取搜索图片;
在预设时间内,响应于对所述搜索图片的用户操作,确定图片集;
针对每一个用户,根据用户标识、所述预设时间和所述图片集,生成键值对数据;其中,所述键值对中的键表示所述用户标识和所述预设时间,值表示所述图片集;
根据至少一个键值对数据,生成所述图片数据集。
3.根据权利要求1所述的方法,其中,所述根据所述搜索信息,生成图片数据集,包括:
根据所述搜索信息,获取至少一个目标文本;
针对每一个目标文本,根据所述目标文本中的图片集,生成键值对数据;其中,所述键值对中的键表示所述目标文本的语义信息,值表示所述目标文本中的图片集;
根据至少一个键值对数据,生成所述图片数据集。
4.根据权利要求1所述的方法,其中,所述对每一个键值对中的图片集,选取第一粒度类别特征和/或第二粒度类别全局特征匹配的候选配对图片集,包括:
对每一个键值对中的图片集,选取所述第一粒度类别特征匹配的第二配对图片集;
对每一个所述第二配对图片集,选取所述第二粒度类别全局特征匹配的候选配对图片集。
5.根据权利要求1所述的方法,其中,所述第一特征提取模型,采用第一训练样本和第二训练样本训练得到;
其中,所述第一训练样本,用于对所述第一特征提取模型进行第一阶段的训练;所述第一训练样本,是对已有图片库中的图片进行第一聚类得到的;
所述第二训练样本,用于对所述第一特征提取模型进行第二阶段的训练;其中,第二训练样本,是所述图片数据集。
6.根据权利要求5所述的方法,其中,所述第二特征提取模型,采用第三训练样本和第二训练样本训练得到;
其中,所述第三训练样本,用于对所述第二特征提取模型进行第一阶段的训练;第三训练样本,是对已有图片库中的图片进行第二聚类得到的,其中,所述第二聚类的类别数量大于所述第一聚类的类别数量;
所述第二训练样本,用于对所述第二特征提取模型进行第二阶段的训练;其中,第二训练样本,是所述图片数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110468967.2/1.html,转载请声明来源钻瓜专利网。