[发明专利]基于层次三元组损失函数的深度度量学习方法及其装置有效
| 申请号: | 201811044820.5 | 申请日: | 2018-09-07 |
| 公开(公告)号: | CN109145129B | 公开(公告)日: | 2020-03-31 |
| 发明(设计)人: | 黄伟林;戈维峰;董登科;马修·罗伯特·斯科特 | 申请(专利权)人: | 深圳码隆科技有限公司 |
| 主分类号: | G06F16/50 | 分类号: | G06F16/50;G06N3/02 |
| 代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 刘贻盛 |
| 地址: | 518000 广东省深圳市盐田区沙头*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 层次 三元 损失 函数 深度 度量 学习方法 及其 装置 | ||
1.一种基于层次三元组损失函数的深度度量学习方法,其特征在于,包括:
基于三元组损失函数得到任意两类之间的类间距离,构建层次类别树;
基于所述层次类别树,通过所述类间距离,对三元组损失函数进行层次化,得到层次三元组损失函数;
基于所述层次三元组损失函数对神经网络进行训练,提取得到目标图像抽取特征,并根据所述目标图像抽取特征进行图像搜索,以便于得到目标搜索图像;
所述“基于所述层次类别树,通过所述类间距离,对三元组损失函数进行层次化,得到层次三元组损失函数”包括:
提取所述层次类别树中第0层级的叶子节点作为目标叶子节点;
基于所述类间距离,对所述目标叶子节点选择与其对应的近邻类别作为锚点类别;
在每个所述锚点类别中随机提取图片,组成训练图片;
搜索所述训练图片组成的三元组对应的动态损失边界,构成与所述动态损失边界对应的所述层次三元组损失函数;
所述“基于三元组损失函数得到任意两类之间的类间距离,构建层次类别树”包括:
利用标准的三元组损失函数训练得到三元组神经网络模型;
根据所述三元组神经网络模型,得到数据层次化结构;
通过所述数据层次化结构进行计算,得到任意两类之间的类间距离,并通过所述类间距离构建层次类别树;
所述“通过所述数据层次化结构进行计算,得到任意两类之间的类间距离”包括:
定义任意两个类别,即为第p个和第q个类别,其间的类间距离通过如下公式计算:
其中,该公式表征了第p个和第q个类别的平均距离,即为类间距离,其中,np为第p类训练样本的个数,nq为第q训练样本的个数,ri为第i个训练样本的深度学习特征,rj为第j个训练样本的深度学习特征;所述类间距离的取值范围为0-4;
所述层次类别树包括多个层级;其中,平均类内距离作为第0层级的合并阈值;所述层次类别树还包括多个叶子节点;每个所述叶子节点为对应层级的图像类别;
所述“并通过所述类间距离构建层次类别树”,包括:
根据所述类间距离对所述叶子节点进行合并;其中,叶子节点的合并的通过设置所述合并阈值进行合并,构建所述层次类别树;
所述合并阈值,被设定为如下公式:其中,dl为任意两类的距离,在所述层次类别树中,如果第一层级中任意两类的距离小于dl,即将该两类进行合并,d0为类内的平均距离。
2.如权利要求1所述基于层次三元组损失函数的深度度量学习方法,其特征在于,所述“搜索所述训练图片组成的三元组对应的动态损失边界,构成所述层次三元组损失函数”包括:
对于每一个所述训练图片组成的三元组,通过所述层次类别树计算所述锚点类别和负样本类别之间的类别关系,得到所述动态损失边界,成与所述动态损失边界对应的所述层次三元组损失函数。
3.一种基于层次三元组损失函数的深度度量学习装置,其特征在于,包括:构建模块、层次模块和训练模块;
所述构建模块,用于基于三元组损失函数得到任意两类之间的类间距离,构建层次类别树;
所述层次模块,用于基于所述层次类别树,通过所述类间距离,对三元组损失函数进行层次化,得到层次三元组损失函数;
所述训练模块,用于基于所述层次三元组损失函数对神经网络进行训练,提取得到目标图像抽取特征,并根据所述目标图像抽取特征进行图像搜索,以便于得到目标搜索图像;
所述层次模块包括用于提取所述层次类别树中第0层级的叶子节点作为目标叶子节点;基于所述类间距离,对所述目标叶子节点选择与其对应的近邻类别作为锚点类别;在每个所述锚点类别中随机提取图片,组成训练图片;搜索所述训练图片组成的三元组对应的动态损失边界,构成与所述动态损失边界对应的所述层次三元组损失函数。
4.一种用户终端,其特征在于,包括存储器以及处理器,所述存储器用于存储基于层次三元组损失函数的深度度量学习程序,所述处理器运行所述基于层次三元组损失函数的深度度量学习程序以使所述用户终端执行如权利要求1-2中任一项所述基于层次三元组损失函数的深度度量学习方法。
5.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有基于层次三元组损失函数的深度度量学习程序,所述基于层次三元组损失函数的深度度量学习程序被处理器执行时实现如权利要求1-2中任一项所述基于层次三元组损失函数的深度度量学习方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳码隆科技有限公司,未经深圳码隆科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811044820.5/1.html,转载请声明来源钻瓜专利网。





