[发明专利]基于层次三元组损失函数的深度度量学习方法及其装置有效
申请号: | 201811044820.5 | 申请日: | 2018-09-07 |
公开(公告)号: | CN109145129B | 公开(公告)日: | 2020-03-31 |
发明(设计)人: | 黄伟林;戈维峰;董登科;马修·罗伯特·斯科特 | 申请(专利权)人: | 深圳码隆科技有限公司 |
主分类号: | G06F16/50 | 分类号: | G06F16/50;G06N3/02 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 刘贻盛 |
地址: | 518000 广东省深圳市盐田区沙头*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 层次 三元 损失 函数 深度 度量 学习方法 及其 装置 | ||
本发明提供了一种基于层次三元组损失函数的深度度量学习方法及其装置,其中所述方法包括:基于三元组损失函数构建层次类别树;对三元组损失函数进行层次化,得到层次三元组损失函数;使用层次三元组损失函数训练深度神经网络;提取得到目标图像抽取特征,并进行图像搜索,以便于得到目标搜索图像。本发明通过预先构建层次类别树,并基于层次类别树得到层次三元组损失函数,进而通过该层次三元组损失函数对进行对神经网络训练,已提取特征并进行图像搜索,克服了现有的三元组损失函数算法中的样本过于随机的缺点,进行学习、搜索和识别任务的速度快、效率高,并且大大提高了准确度。
技术领域
本发明涉及图像识别技术领域,更具体地说,涉及一种基于层次三元组损失函数的深度度量学习方法及其装置。
背景技术
在统计学,统计决策理论和经济学中,损失函数是指一种将一个事件(在一个样本空间中的一个元素)映射到一个表达与其事件相关的经济成本或机会成本的实数上的一种函数。更通俗地说,在统计学中损失函数是一种衡量损失和错误(这种损失与“错误地”估计有关,如费用或者设备的损失)程度的函数。在深度卷积神经网络训练中,一般采用三元组损失的方法,去掉卷积神经网络最终的分类层,直接利用三元组损失函数归一化的特征编码。
现有的应用于卷积神经网络学习的三元组损失函数的深度学习方法,在应用于图像搜索任务和人脸识别任务的过程中,存在样本过于随机,导致速度慢、效率低、准确性差的缺点。
发明内容
有鉴于此,本发明提供一种基于层次三元组损失函数的深度度量学习方法及其装置以解决现有技术的不足。
为解决上述问题,本发明提供一种基于层次三元组损失函数的深度度量学习方法,包括:
基于三元组损失函数得到任意两类之间的类间距离,构建层次类别树;
基于所述层次类别树,通过所述类间距离,对三元组损失函数进行层次化,得到层次三元组损失函数;
基于所述层次三元组损失函数对神经网络进行训练,提取得到目标图像抽取特征,并根据所述目标图像抽取特征进行图像搜索,以便于得到目标搜索图像。
优选地,所述“基于三元组损失函数得到任意两类之间的类间距离,构建层次类别树”包括:
利用标准的三元组损失函数训练得到三元组神经网络模型;
根据所述三元组神经网络模型,得到数据层次化结构;
通过所述数据层次化结构进行计算,得到任意两类之间的类间距离,并通过所述类间距离构建层次类别树。
优选地,所述“通过所述数据层次化结构进行计算,得到任意两类之间的类间距离”包括:
定义任意两个类别,即为第p个和第q个类别,其间的类间距离通过如下公式计算:
其中,该公式表征了第p个和第q个类别之间的平均距离,即为类间距离;
优选地,所述类间距离的取值范围为0-4。
优选地,所述层次类别树包括多个层级;其中,平均类内距离作为第0层级的合并阈值;所述层次类别树还包括多个叶子节点;每个所述叶子节点为对应层级的图像类别;
所述“并通过所述类间距离构建层次类别树”,包括:
根据所述类间距离对所述叶子节点进行合并;其中,叶子节点的合并的通过设置所述合并阈值进行合并,构建所述层次类别树;
所述合并阈值,被设定为如下公式:其中,dl为任意两进行合并的阈值,在所述层次类别树中,如果第l层级中任意两类的距离小于dl,即将该两类进行合并。其中d0为类内的平均距离,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳码隆科技有限公司,未经深圳码隆科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811044820.5/2.html,转载请声明来源钻瓜专利网。