[发明专利]一种基于显著性的多模态小样本学习方法有效

申请号：	202010768906.3	申请日：	2020-08-03
公开（公告）号：	CN111881997B	公开（公告）日：	2022-04-19
发明（设计）人：	翁仲铭;陶文源	申请（专利权）人：	天津大学
主分类号：	G06V10/778	分类号：	G06V10/778;G06V10/764;G06V10/82;G06K9/62;G06N3/04
代理公司：	天津市北洋有限责任专利代理事务所 12201	代理人：	刘子文
地址：	300072***	国省代码：	天津;12
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于显著多模态小样本学习方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于显著性的多模态小样本学习方法，其特征在于，包括多模态结合和标签传播两部分，具体如下：

多模态结合过程中，首先通过预训练好的显著性检测网络对支持集的样本图像进行显著图提取，分离出样本图像的前景和背景；

其次通过GloVe模型获取支持集样本图像前景、背景区域语义的单词嵌入，作为语义信息辅助视觉信息分类；

最后对于所获取支持集样本图像的前景、背景与语义信息，分别通过模态混合机制进行自适应结合，将前景部分与前景语义相结合，背景部分与背景语义相结合，实现视觉与语义模态的结合，得到具有多模态信息的样本特征表示；

具体的，对于视觉信息和语义信息两种模态，通过凸组合的方式将两个模态进行结合，对于每一张图像新的前景混合信息F_c、背景混合信息B_c如下：

F_c＝λ_f·f(F_I)+(1-λ_f)·w_f (3)

B_c＝λ_b·f(B_I)+(1-λ_b)·w_b (4)

其中，F_I表示图像的前景部分，B_I表示图像的背景部分；f为神经网络；λ为自适应混合参数，λ_f和λ_b分别代表对于前景、背景的自适应参数，用来调节视觉与语义两种模态的权重；w_f＝g(e_f)为所获得的前景单词嵌入e_f经过神经网络g得到的前景嵌入特征，背景语义特征为w_b＝g(e_b)；λ自适应混合参数由以下公式计算：

其中u神经网络为一个包含300个隐藏单元的隐藏层，将输出变换为一个标量；

将混合模态的前景、背景信息进行自适应结合，公式如下：

P_c＝β·F_c+(1-β)·B_c (7)

其中β为自适应参数，同样由u神经网络获得，最终获得具有多模态信息的新图像表示；

标签传播过程中，首先将模态结合后的支持集样本与查询集样本根据K近邻方法进行图构造；最终通过带有标签的支持集样本预测没有标签的查询集样本的类别。

2.根据权利要求1所述一种基于显著性的多模态小样本学习方法，其特征在于，所述显著性检测网络为F3Net。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于天津大学，未经天津大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010768906.3/1.html，转载请声明来源钻瓜专利网。