[发明专利]一种多元组样本构建方法及装置在审

专利信息
申请号: 201910049706.X 申请日: 2019-01-18
公开(公告)号: CN111461151A 公开(公告)日: 2020-07-28
发明(设计)人: 夏雄尉;谢泽华;周泽南;苏雪峰;许静芳 申请(专利权)人: 搜狗(杭州)智能科技有限公司;北京搜狗科技发展有限公司
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 北京华沛德权律师事务所 11302 代理人: 马苗苗
地址: 310016 浙江省杭州市经济技*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 多元 样本 构建 方法 装置
【说明书】:

发明实施例提供的一种多元组样本构建方法及装置,其中方法包括:获取由第一样本特征组成的第一特征集合;根据所述第一特征集合,获得预设的待训练模型当前次训练所需的第一多元组样本;通过所述待训练模型根据所述第一多元组样本进行前向计算获得第二样本特征;在所述第一特征集合中,将所述第一多元组样本所对应的第一样本特征更新为所述第二样本特征,获得第二特征集合;根据所述第二特征集合,获得所述待训练模型下一次训练时所需的第二多元组样本。本发明提高了多元组样本构建的质量,使用该方法构建的多元组样本可适应待训练模型不同阶段的学习,提高了待训练模型的收敛速度和效果。

技术领域

本发明涉及机器学习与图像识别技术领域,具体而言,涉及一种样本获取方法及装置。

背景技术

在度量学习任务中,通常通过构造由相似图和不相似图组成的多元组来监督网络学习到图片之间的相似性。在多元组样本中分别包括了参考样本(anchor)、正样本(positive)和负样本(negative)。其中参考样本与正样本相似,而与负样本不像似。

目前的多元组样本构建策略中,通常在一固定的样本训练集中对样本进行遍历计算完成,由于计算效率低,仅能在样本训练集的一小范围中构建多元组样本,这样构建的样本质量较低,无法有效的引导待训练模型不同阶段的学习。

发明内容

有鉴于此,本发明实施例的目的在于提供一种多元组样本构建方法及装置,本发明提高了多元组样本构建的质量;使用该方法构建的多元组样本可适应待训练模型不同阶段的学习,提高了待训练模型的收敛速度和效果。

第一方面,本申请通过本申请的一实施例提供如下技术方案:

一种多元组样本构建方法,包括:

获取由第一样本特征组成的第一特征集合;根据所述第一特征集合,获得预设的待训练模型当前次训练所需的第一多元组样本;通过所述待训练模型,根据所述第一多元组样本进行前向计算,获得第二样本特征;在所述第一特征集合中,将所述第一多元组样本所对应的第一样本特征更新为所述第二样本特征,获得第二特征集合;根据所述第二特征集合,获得所述待训练模型下一次训练时所需的第二多元组样本。

优选地,所述根据所述第一特征集合,获得预设的待训练模型当前次训练所需的第一多元组样本的步骤,包括:

根据随机特征,从所述第一特征集合中抽取参考特征,并基于所述参考特征获得参考样本,其中,所述随机特征为从所述第一特征集合中随机选取获得,在所述第一特征集合中与所述参考特征相似的第一样本特征均被标记有识别标识;根据所述参考样本和标记有所述识别标识的第一样本特征,获得与所述参考样本对应的正样本;根据所述参考样本和未标记所述识别标识的第一样本特征,获得与所述参考样本对应的负样本;根据所述参考样本,与所述参考样本对应的正样本,以及与所述参考样本对应的负样本获得第一多元组样本,每个所述参考样本对应一个多元组样本。

优选地,所述根据随机特征,从所述第一特征集合中抽取参考特征,并基于所述参考特征获得参考样本的步骤,包括:

获取所述随机特征与每一个第一样本特征之间的第一相似度;当所述第一相似度属于预设的第一范围时,抽取属于所述第一范围的所述第一相似度对应的第一样本特征作为参考特征;将所述参考特征所对应的样本作为所述参考样本。

优选地,所述根据所述参考样本和标记有所述识别标识的第一样本特征,获得与所述参考样本对应的正样本的步骤,包括:

对同一个参考样本,获取所述参考样本对应的参考特征与标记有所述识别标识的第一样本特征之间的第二相似度;当所述第二相似度属于预设的第二范围时,抽取属于所述第二范围的所述第二相似度对应的第一样本特征,作为所述参考样本对应的正样本的特征;根据所述正样本的特征,获得该个参考样本对应的正样本。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于搜狗(杭州)智能科技有限公司;北京搜狗科技发展有限公司,未经搜狗(杭州)智能科技有限公司;北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910049706.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top