[发明专利]神经网络的训练方法、训练装置和电子设备在审

专利信息
申请号: 201910507780.1 申请日: 2019-06-12
公开(公告)号: CN112085041A 公开(公告)日: 2020-12-15
发明(设计)人: 徐麟;孙瀚;陈志远 申请(专利权)人: 北京地平线机器人技术研发有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06N3/04
代理公司: 北京彩和律师事务所 11688 代理人: 刘磊;闫桑田
地址: 100080 北京*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 神经网络 训练 方法 装置 电子设备
【说明书】:

公开了一种神经网络的训练方法、神经网络的训练装置和电子设备。该神经网络的训练方法包括:通过神经网络从一批样本获得样本距离矩阵,所述样本距离矩阵包括所述一批样本中的同类样本距离和异类样本距离;计算出与所述样本距离矩阵对应的最优传输规划矩阵;基于所述样本距离矩阵与所述最优传输规划矩阵的乘积的加权之和,确定最优传输损失函数值;以及,基于所述最优传输损失函数值更新所述神经网络和所述最优传输规划矩阵的参数。这样,通过对一批样本当中的难样本进行挖掘,提高了网络的训练的收敛速率和性能。

技术领域

本申请涉及深度学习领域,且更为具体地,涉及一种神经网络的训练方法,神经网络的训练装置和电子设备。

背景技术

在深度学习领域中,通过学习数据的语义嵌入度量,缩小数据类内差异(或距离),使相似的同类样本聚集在一起,以及扩大数据类间差异(或距离),使不相似的异类样本分开是物体识别任务的重要基础。

随着深度学习技术的迅速发展,深度度量学习近年来越来越受到重视。在深度度量学习中,通过端到端地训练深度神经网络,可以学习到复杂的高度非线性的数据深度特征表示(从输入空间到低维语义嵌入度量空间)。

深度度量学习到的深度特征表示和语义嵌入度量在视觉识别中有广泛的应用场景和优异的识别性能,例如,二维(2D)自然图像检索/分类、人脸识别、三维(3D)物体检索/分类、多源异构视觉感知数据跨模态检索(例如2D图像/视频、3D物体、文本数据之间的检索匹配)等。

因此,期望提供改进的神经网络的训练方案。

发明内容

为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种神经网络的训练方法、神经网络的训练装置和电子设备,其使用区分同类样本和异类样本的样本距离矩阵及其对应的最优传输规划矩阵来构造最优传输损失函数值并以此训练神经网络,从而学习样本重要性驱动的距离度量,提高了网络训练的收敛速率。

根据本申请的一方面,提供了一种神经网络的训练方法,包括:通过神经网络从一批样本获得样本距离矩阵,所述样本距离矩阵包括所述一批样本中的同类样本距离和异类样本距离;计算出与所述样本距离矩阵对应的最优传输规划矩阵;基于所述样本距离矩阵与所述最优传输规划矩阵的乘积的加权之和,确定最优传输损失函数值;以及,基于所述最优传输损失函数值更新所述神经网络和所述最优传输规划矩阵的参数。

根据本申请的另一方面,提供了一种神经网络的训练装置,包括:距离矩阵获得单元,用于通过神经网络从一批样本获得样本距离矩阵,所述样本距离矩阵包括所述一批样本中的同类样本距离和异类样本距离;传输矩阵获得单元,用于计算出与所述距离矩阵获得单元所获得的所述样本距离矩阵对应的最优传输规划矩阵;损失函数确定单元,用于基于所述距离矩阵获得单元所获得的所述样本距离矩阵与所述传输矩阵获得单元所获得的所述最优传输规划矩阵的乘积的加权之和,确定最优传输损失函数值;以及,参数更新单元,用于基于所述损失函数确定单元所确定的所述最优传输损失函数值更新所述神经网络和所述最优传输规划矩阵的参数。

根据本申请的再一方面,提供了一种电子设备,包括:处理器;以及,存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上所述的神经网络的训练方法。

根据本申请的又一方面,提供了一种计算机可读介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如上所述的神经网络的训练方法。

本申请提供的神经网络的训练方法、神经网络的训练装置和电子设备使用包括一批样本中的同类样本距离和异类样本距离的样本距离矩阵来通过最优传输方法计算出最优传输规划矩阵,使得能够按照样本的重要性赋予难样本更高的权重,这样,通过基于最优传输规划矩阵构造最优传输损失函数并以此训练神经网络,可以使得神经网络能够学习到样本重要性驱动的距离度量,从而提高网络训练的收敛速率。

附图说明

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京地平线机器人技术研发有限公司,未经北京地平线机器人技术研发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910507780.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top