[发明专利]样本扩展方法、训练方法和系统、及样本学习系统在审

专利信息
申请号: 202110325808.7 申请日: 2021-03-26
公开(公告)号: CN113033665A 公开(公告)日: 2021-06-25
发明(设计)人: 詹忆冰;韩梦雅 申请(专利权)人: 北京沃东天骏信息技术有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06N3/04
代理公司: 中国贸促会专利商标事务所有限公司 11038 代理人: 曹蓓;王莉莉
地址: 100176 北京市大兴区北京经济*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 样本 扩展 方法 训练 系统 学习
【说明书】:

本公开提出一种样本扩展方法、训练方法和系统、及样本学习系统,涉及机器学习技术领域。本公开的一种样本扩展方法,包括:通过特征提取网络提取样本的特征;根据具有类别标注的样本的特征确定每个具有类别标注的样本的价值参数;获取具有类别标注的样本中属于同一类别的样本的特征的加权和,作为对应类别的特征;根据待确定类别的样本的特征与每个类别的特征的相似性,确定待确定类别的样本的类别,进而标注对应的待确定类别的样本,获取扩展样本。通过这样的方法,当采用已有样本进行训练时,通过对样本的价值进行衡量,能够得到可信的扩展样本,提高样本扩展的鲁棒性和准确度,提高样本采集的可信度、效率和准确度,降低样本采集的负担。

技术领域

本公开涉及机器学习技术领域,特别是一种样本扩展方法、训练方法和系统、及样本学习系统。

背景技术

在实际生活中,常常需要对物体的类别进行归类,比如对同一种物品采用统一的表征,方便后续的物品分类、检索以及其他操作。目前的物品归类往往基于深度学习获取。由于深度模型的复杂性,往往需要大量的标注数据(物品样本数据)进行训练,才能获取较为鲁棒且可信度高的深度归类模型。

由于在实际场景中,获取大量的标注样本数据费时费力,且部分场景下,仅能获取少量的标注样本。因此如何从有限的标注样本中学习鲁棒且可信度高的新类别知识,即小样本学习,具有重要的实际价值。我们将实际生活中,基于少量标注样本对物体的类别进行归类的问题建模称为小样本学习问题。

小样本学习中最主要的解决方式是元学习(Meta-Learning)。元学习的核心是希望模型获取一种“学会学习”的能力,使其可以在获取已有“知识”的基础上快速学习新的任务。目前针对小样本问题的元学习方法可以大致分为两类:

一、基于优化的元学习方法,即通过少量数据,学习模型的参数初始化、模型的学习率、模型的梯度更新策略等;

二、基于度量的元学习方法,即学习样本的表示以及属于同一类的类别表示,从而直接度量新样本表示和类别表示的距离预测新样本的类别。

发明内容

本公开的一个目的在于提高样本扩展的准确度,提高样本采集的效率和准确度。

根据本公开的一些实施例的一个方面,提出一种样本扩展方法,包括:通过特征提取网络提取样本的特征,样本包括具有类别标注的样本和待确定类别的样本;根据具有类别标注的样本的特征确定每个具有类别标注的样本的价值参数;获取具有类别标注的样本中属于同一类别的样本的特征的加权和,作为对应类别的特征,其中,样本的特征的权重为价值参数;根据待确定类别的样本的特征与每个类别的特征的相似性,确定待确定类别的样本的类别;用确定的类别标注对应的待确定类别的样本,获取扩展样本。

在一些实施例中,在样本为图像的情况下,通过特征学习提取网络提取样本的特征包括:通过CNN(Convolutional Neural Networks,卷积神经网络)获取样本的初始特征;将初始特征进行二阶池化处理,获取样本的特征。

在一些实施例中,在样本为文本信息的情况下,通过特征学习提取网络提取样本的特征包括:通过LSTM(Long Short-Term Memory,长短期记忆人工神经网络)提取样本的特征。

在一些实施例中,根据具有类别标注的样本的特征确定每个具有类别标注的样本的价值参数包括:根据每个具有类别标注的样本的特征,通过一层非线性变换,获取样本的标量特征;将各个标量特征串行连接,获取样本集合特征向量;根据样本集合特征向量,通过样本价值估计网络获取价值参数向量,其中,价值参数向量中的元素为样本的价值参数,价值参数向量中的元素对应的样本的次序与样本集合特征向量中的元素对应的样本的次序相匹配。

在一些实施例中,根据待确定类别的样本的特征与每个类别的特征的相似性,确定待确定类别的样本的类别包括:获取待确定类别的样本的特征与每个类别的特征的余弦相似性;确定与待确定类别的样本的特征的余弦相似性最大的特征所属的类别,作为待确定类别的样本的类别。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司,未经北京沃东天骏信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110325808.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top