[发明专利]基于分层变分条件转移神经元的跨域小样本学习方法在审
申请号: | 202210596869.1 | 申请日: | 2022-05-30 |
公开(公告)号: | CN115204253A | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 张磊;左利云;王宝艳;甄先通 | 申请(专利权)人: | 广东石油化工学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06N5/04 |
代理公司: | 北京瑞盟知识产权代理有限公司 11300 | 代理人: | 刘昕 |
地址: | 525000 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分层 条件 转移 神经元 跨域小 样本 学习方法 | ||
1.基于分层变分条件转移神经元的跨域小样本学习方法,其特征在于,包括以下步骤:
1)构建初始记忆单元集M;
2)随机初始化关键字生成网络丁的参数θ、查询集推理网络g的参数φ1、支持集推理网络g的参数φ2;
3)利用变分推理ELBO下限对所述记忆单元集M的生成过程以及所述参数θ、φ1、φ2进行优化;
4)在所述参数θ、φ1、φ2训练收敛之后,利用测试数据进行测试。
2.根据权利要求1所述的基于分层变分条件转移神经元的跨域小样本学习方法,其特征在于,在所述步骤3)中,所述变分推理ELBO下限为
式中Q为查询集,S为支持集,mt为t层的记忆单元,xi为查询集中样本i,yi为查询集中样本i对应的实际输出标签,q(mt|S,mt-1)为变分推理中的支持集对应的近似分布,而p(mt|xi,mt-1)为查询集对应的推理分布,DKL为支持集和查询集上关于记忆单元分布的KL距离。
3.根据权利要求1所述的基于分层变分条件转移神经元的跨域小样本学习方法,其特征在于,所述步骤3)包括以下步骤:
3.1)对于支持集S中每一个样本i,计算支持集S的交叉熵损失函数
其中yi为样本i的实际输出标签,为样本i的预测输出标签;
3.2)根据支持集S每一个样本i的交叉熵损失函数,计算每一层t的分层条件信息如下:
式中p设置为7,并且式中
3.3)对支持集中S每一个样本i,计算每一层的网络中间输出和输出
式中Wt和ht为第t层的基本识别模型B的参数,假设为已知,为的前一层的输出,为当前层的输出;
3.4)对支持集S中每一个样本i,从t=1开始递推生成各层的记忆单元其中初始设置为0;
3.5)将按照类别c和层t,拼接成记忆单元集M;
3.6)对于查询集Q中每一个样本数据x′i,以及支持集S中每个类别的样本特征平均值经过关键字生成网络f,生成其对应关键字如下:
k′i=fθ(x′i)
3.7)根据记忆单元集M,按如下公式计算查询集Q样本数据x′i的各层记忆单元:
α=softmax(cos(k′i,kc))
其中记忆单元m包含T层,由[m1...mT]组成,α为表示查询集Q样本与支持集S中各类样本之间相关程度的系数;
3.8)对于查询集Q中的样本数据x′i,按照如下公式得到其对应的中间输出和预测值
3.9)计算查询集Q中的所有样本的交叉熵
3.10)将送入查询集Q推理网络g,得到关于记忆单元的分布如下:
3.11)计算整体目标函数如下:
这里为根据支持集S得到的各类别c的记忆单元分布的均值和方差,{μt,σt}为查询集Q对应的记忆单元分布的均值和方差;
3.12)更新参数θ、φ1、φ2如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东石油化工学院,未经广东石油化工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210596869.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:显示面板的驱动方法和显示装置
- 下一篇:一种下肢外骨骼随动支撑设备控制系统