[发明专利]一种数据有限和不平衡的语义软标签图像识别方法及装置在审
| 申请号: | 202210063646.9 | 申请日: | 2022-01-20 | 
| 公开(公告)号: | CN114419394A | 公开(公告)日: | 2022-04-29 | 
| 发明(设计)人: | 王瑞轩;钟哲灏 | 申请(专利权)人: | 中山大学 | 
| 主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/776;G06V10/82;G06V10/74;G06F40/30;G06N3/04;G06N3/08;G06K9/62 | 
| 代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 | 
| 地址: | 510275 广东*** | 国省代码: | 广东;44 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 数据 有限 不平衡 语义 标签 图像 识别 方法 装置 | ||
1.一种数据有限和不平衡的语义软标签图像识别方法,其特征在于,包括下述步骤:
构建语义软标签图像识别模型;所述语义软标签图像识别模型包括特征提取器及词嵌入模块;
在大规模文本数据集上对自监督网络进行预训练,获得词嵌入模块;
利用词嵌入模块,对训练数据集中的每个类别,生成对应的软标签;
将训练数据集输入特征提取器中获取特征向量,使用对应软标签来指导训练,得到训练好的语义软标签图像识别模型;
将测试数据集输入训练好的语义软标签图像识别模型中进行测试,获得图像识别结果。
2.根据权利要求1所述的一种数据有限和不平衡的语义软标签图像识别方法,其特征在于,所述词嵌入模块训练步骤为:
对大规模文本数据集中的训练文本进行处理,去掉乱码及符号后生成共有V个单词的词汇表;
将词汇表中每个单词对应确定为一个N维的可学习词向量;
使用词汇表中V个单词的N维可学习词向量对自监督网络进行训练,获得训练好的自监督网络;
保留训练好自监督网络的特征编码器部分作为词嵌入模块。
3.根据权利要求2所述的一种数据有限和不平衡的语义软标签图像识别方法,其特征在于,所述自监督网络包括Word2Vec、GloVe、Fasttext、Kazumachar及Bert网络。
4.根据权利要求2所述的一种数据有限和不平衡的语义软标签图像识别方法,其特征在于,所述生成对应的软标签,具体为:
将训练数据集输入词嵌入模块,获取每个类别对应的软标签,表示为:
wc∈RD
其中,wc表示训练数据集中第c个类的软标签,RD表示实数空间R上D维向量;
所述训练数据集表示为:
DA={(xi,yi),i=1,…,N}
其中,xi表示第i张训练图像,yi表示第i张训练图像对应的真实独热标签,N表示训练数据集中总的训练图像数量。
5.根据权利要求4所述的一种数据有限和不平衡的语义软标签图像识别方法,其特征在于,所述获取特征向量,具体为:
使用特征提取器提取训练图像xi的特征向量,表示为:
fi=F(xi)
其中fi表示特征提取器对于输入训练图像xi的D维特征向量输出。
6.根据权利要求5所述的一种数据有限和不平衡的语义软标签图像识别方法,其特征在于,所述得到训练好的语义软标签图像识别模型,具体为:
对于每一张训练图像xi,通过余弦距离损失函数来计算特征提取器输出的fi和对应软标签之间的余弦相似度,得到交叉熵损失函数,公式为:
其中,s(fi,wi)表示第i张训练图像的特征向量fi与第i张训练图像对应软标签wi之间的余弦相似度,C表示训练数据集中类别总数,s(fi,wj)是第i张训练图像的特征向量fi与训练数据集中第j个类别对应的软标签wj之间的余弦相似度,τ为温度超参数;
利用交叉熵损失函数对特征提取器进行训练,并通过随机梯度下降更新特征提取器的参数;
得到训练好的语义软标签图像识别模型。
7.根据权利要求6所述的一种数据有限和不平衡的语义软标签图像识别方法,其特征在于,所述特征提取器采用ResNet、VGG、DenseNet或ViT网络结构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210063646.9/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
 - 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
 - 数据发送方法、数据发送系统、数据发送装置以及数据结构
 - 数据显示系统、数据中继设备、数据中继方法及数据系统
 - 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
 - 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
 - 数据发送和数据接收设备、数据发送和数据接收方法
 - 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
 - 数据发送方法、数据再现方法、数据发送装置及数据再现装置
 - 数据发送方法、数据再现方法、数据发送装置及数据再现装置
 





