[发明专利]基于数据扩充一致性的领域泛化和领域自适应学习方法在审

专利信息
申请号: 202010164318.9 申请日: 2020-03-11
公开(公告)号: CN111382871A 公开(公告)日: 2020-07-07
发明(设计)人: 肖良;许娇龙;聂一鸣;商尔科;朱琪;赵大伟;肖志鹏;戴斌 申请(专利权)人: 中国人民解放军军事科学院国防科技创新研究院
主分类号: G06N3/08 分类号: G06N3/08;G06N20/00
代理公司: 中国兵器工业集团公司专利中心 11011 代理人: 刘瑞东
地址: 100071 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 数据 扩充 一致性 领域 泛化 自适应 学习方法
【权利要求书】:

1.基于数据扩充一致性的领域泛化和领域自适应学习方法,其特征在于,包括如下步骤:

S1.根据任务需求,设计基于深度神经网络的预测模型pθ(y|x),其中θ为模型参数,该模型输出为给定样本x情况下标记y的条件概率分布;

S2.根据任务特点,构造数据扩充器,用于实现对样本表观的丰富变换且保持样本的核心内容不变,从而保证变换后样本的真实标记不变;

S3.利用原始训练样本和扩充后的样本构造由有监督损失和数据扩充一致性损失组成的多任务损失函数并进行训练,得到

S31.根据机器学习任务,选择有监督损失函数,计算源领域或多源领域全部有标记样本的有监督损失Ls

S32.构造模型预测结果的一致性度量,并计算数据扩充一致性损失;

假设原始样本为x,利用步骤S2中的数据扩充器变换后的样本为利用当前模型pθ分别对原始样本和扩充样本的预测结果分别为pθ(y|x)和数据扩充一致性则为pθ(y|x)和的一致性度量;

领域泛化学习,数据扩充一致性损失利用源领域(Ds)样本进行计算:

其中为一致性度量,表示步骤S2中所述的数据扩充器产生的数据分布,表示当前参数θ的固定拷贝,表示在反向传播中梯度不沿着往后传播;

领域自适应学习,数据扩充一致性损失利用包括源领域(Ds)样本和目标领域(Dt)无标记样本在内的所有可用样本进行计算:

S33.利用有监督损失和数据扩充一致性损失加权求和,构成总损失:

L=Ls+λ·Lc, (3)

其中λ为数据扩充一致性损失的权重参数;

S34.利用深度神经网络模型优化方法对模型参数θ进行优化,得到θ*

S4.将训练好的模型应用于目标领域测试样本进行预测。

2.根据权利要求1所述的基于数据扩充一致性的领域泛化和领域自适应学习方法,其特征在于,步骤S33中对于领域自适应学习,还可在总损失中引入目标领域无标记样本的条件熵损失,以鼓励模型提高目标领域样本预测的置信度;

上述条件熵损失可以表示为:

此时,领域自适应学习的总损失为:

L=Ls+λ·Lc+γ·Le, (5)

其中γ为条件熵损失的权重参数。

3.根据权利要求2所述的基于数据扩充一致性的领域泛化和领域自适应学习方法,其特征在于,所述步骤S32中可采用KL散度函数进行一致性度量。

4.根据权利要求1-3任一权利要求所述的基于数据扩充一致性的领域泛化和领域自适应学习方法,其特征在于,所述步骤S2中的数据扩充器通常由一组数据变换随机组合而成,其中可包含添加对抗扰动的数据扩充方法,用以增强模型的鲁棒性和泛化性能。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军军事科学院国防科技创新研究院,未经中国人民解放军军事科学院国防科技创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010164318.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top