[发明专利]一种基于度量距离损失框架的半监督学习方法、设备及存储介质在审

专利信息
申请号: 202011297013.1 申请日: 2020-11-18
公开(公告)号: CN112348109A 公开(公告)日: 2021-02-09
发明(设计)人: 刘半藤;郑启航;陈唯;王章权;陈友荣 申请(专利权)人: 浙江树人学院(浙江树人大学)
主分类号: G06K9/62 分类号: G06K9/62;G06N3/04;G06N3/08
代理公司: 绍兴市寅越专利代理事务所(普通合伙) 33285 代理人: 胡国平
地址: 312303 浙江省绍*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 度量 距离 损失 框架 监督 学习方法 设备 存储 介质
【说明书】:

发明一种基于度量距离损失框架的半监督学习方法、设备及存储介质,S101、将分类损失、一致性损失、熵最小损失进行形式转换,并在转换后的一致性损失中加入伪标签作为类别信息,得到伪标签一致性损失,将转换后的分类损失、伪标签一致性损失、熵最小损失进行合成得到统一的半监督损失函数;S102、对统一后的半监督损失函数中核心的优化目标进行修正,添加自适应相似度权重、间距系数和缩放因子;S103、构建半监督神经网络模型,利用统一的半监督损失函数与梯度下降法优化神经网络模型参数;解决多任务下各个损失权重难以调节,优化方法不统一的问题。

技术领域

本发明属于本监督学习算法的技术领域,具体涉及一种基于度量距离损失框架的半监督学习方法、设备及存储介质。

背景技术

神经网络通过学习大量的标签样本训练智能模型,在多个领域中取得了较好的应用,其成功离不开越来越大的样本数据集。一般来说,标签样本集越大,训练所得的模型性能越好,而标记数据集对应的人工成本的消耗越大,为获得较大的样本数据集将会付出高昂的人工成本,特别是某些特定领域样本集(如医疗,工业,艺术)的标签必须由专家标注,其人工成本将进一步上升。

近年来,半监督学习(SSL)方法被广泛研究和关注,半监督学习通过构建适用于无标签样本的损失函数,使得模型的训练过程中仅需要少量标签样本和一定的无标签样本,可减轻对标记样本的需求。为获得具有较好泛化性的SSL模型,众多学者对如何改进SSL模型损失函数进行研究,SSL模型损失函数一般包括以下三种不同类型损失函数:1)分类交叉熵损失;2)熵最小化损失;3)一致性损失。近年来许多学者针对以上几种半监督学习损失函数进行进一步的研究,但均专注于提升以上损失函数中单一的部分进行优化,但半监督学习是多个损失函数的多任务学习的过程,需要构建共享模型参数下综合多种约束的损失函数,而此前方法未考虑不同任务损失函数间尺度差异的问题,会导致整体优化进程被某一个任务所主导,其他任务的损失无法影响网络共享层的学习过程,导致模型拟合效果较差。需要提出一种统一的损失函数框架,在不同任务指导同时优化模型参数,使模型总体最优。

发明内容

本发明克服现有技术存在的不足,所要解决的技术问题为:提供一种基于度量距离损失框架的半监督学习方法、设备及存储介质,解决多任务下各个损失权重难以调节、优化方法不统一的问题,提高建模的鲁棒性。

为了解决上述技术问题,本发明采用的技术方案为:一种基于度量距离损失框架的半监督学习方法,包括:

S101、将分类损失、一致性损失、熵最小损失进行形式转换,并在转换后的一致性损失中加入伪标签作为类别信息,得到伪标签一致性损失,将转换后的分类损失、伪标签一致性损失、熵最小损失进行合成得到统一的半监督损失函数;

S102、对统一后的半监督损失函数中核心的优化目标进行修正,添加自适应相似度权重、间距系数和缩放因子;

S103、构建半监督神经网络模型,利用统一的半监督损失函数与梯度下降法优化神经网络模型参数;

S104、对未知样本输入优化后的神经网络模型参数得到分类结果。

优选地,所述步骤S101具体包括:

S1011、定义数据集样本与标签x,y,定义半监督模型为f=p(y|x,θ),其中f为模型所输出的嵌入向量;

S1012、定义半监督模型分类损失为:

式(1)中,wj∈[0,C]表示类别C所对应的分类权重向量,C为数据集对应类别总数,yi为当前样本所对应的标签索引;

S1013、定义数据集中无标签样本为u,使用Pesudo-label方法计算无标签样本嵌入向量的伪标签:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江树人学院(浙江树人大学),未经浙江树人学院(浙江树人大学)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011297013.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top