[发明专利]一种基于通用域自适应的图像大数据分类方法有效
申请号: | 202110333791.X | 申请日: | 2021-03-29 |
公开(公告)号: | CN113011513B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 罗荣华;周绍煌 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06V10/80 | 分类号: | G06V10/80;G06V10/764;G06V10/74;G06V10/82;G06N3/045;G06N3/0464;G06N3/048;G06N3/094 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍;江裕强 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 通用 自适应 图像 数据 分类 方法 | ||
1.一种基于通用域自适应的图像大数据分类方法,其特征在于,包括以下步骤:
将目标域图像数据输入预先训练好的通用域自适应网络,所述通用域自适应网络包括特征提取器F、分类部分G和域判别器D,通过特征提取器F将目标域图像数据转化成目标域图像特征向量,分类部分G对特征向量进行分类输出得到分类结果和余弦相似度,通过域判别器D对特征向量进行域判别,输出得到目标域判别;
将得到的分类结果、余弦相似度和目标域判别结合得到目标域权重,目标域权重与阈值相比较,大于阈值则输出分类结果,而小于阈值时对应的的目标域数据为目标域的特有类,将其视为一类输出,目标域的特有类加上源域和目标域共有的类别数作为最终的分类结果输出;
其中,在所述将目标域图像数据输入预先训练好的通用域自适应网络之前还包括训练通用域自适应网络的步骤,所述训练通用域自适应网络的步骤如下:
特征提取器F包括残差网络resnet-50,在image-net上预训练得到网络基础参数;
将有标签的源域数据和无标签的目标域图像数据同时输入至特征提取器F,特征提取器F输出源域图像特征向量和目标域图像特征向量,通过同一个特征提取器F使源域和目标域的图像特征向量映射在同一特征空间中;
将得到的源域图像特征向量和目标域图像特征向量作为输入,分别传给分类部分G和域判别器D,分类部分G对输入的特征向量进行分类,输出源域分类结果、源域余弦相似度和目标域分类结果、目标域余弦相似度,针对有标签的源域数据分类结果计算分类标签的损失函数,域判别器D将输入的特征向量进行二分类,判别输入数据来自源域还是目标域,输出源域判别和目标域判别;
按照源域和目标域将域判别器D输出的源域判别和目标域判别、分类部分G输出的源域余弦相似度和目标域余弦相似度结合起来,得到源域权重和目标域权重,将其中目标域权重与阈值进行对比,大于阈值时对应的目标域数据视为共有类,小于阈值时对应的目标域数据视为目标域特有类;
其中,所述阈值在训练阶段根据不同批次,动态线性变化,阈值公式:
其中t是当前训练批次,T是模型训练的总批次,是测试阶段的阈值,当训练到最后一批t=T时,。
2.根据权利要求1所述的基于通用域自适应的图像大数据分类方法,其特征在于:
所述特征提取器F,用于对输入的目标域图像数据进行特征向量提取,得到目标域图像特征向量;
所述分类部分G,输入目标域图像特征向量后,得到目标域分类结果、余弦相似度;
所述域判别器D,输入目标域图像特征向量后,输出目标域判别。
3.根据权利要求1所述的基于通用域自适应的图像大数据分类方法,其特征在于,分类部分G训练阶段时的损失函数计算函数表达式如下:
其中,x表示输入的图片,为交叉熵损失函数,p为源域部分,q为目标域部分,y为源域的真实标签, 为源域或目标域图像的分类输出,将目标域分类输出的最大值类别作为伪标签类别,表示当权重大于阈值时为1,否则为0,表示概率分布在p源域,表示概率分布在q目标域。
4.根据权利要求3所述的基于通用域自适应的图像大数据分类方法,其特征在于,将目标域图像的权重大于阈值的部分视为共有类,并将分类输出作为输入再训练分类部分G。
5.根据权利要求1所述的基于通用域自适应的图像大数据分类方法,其特征在于,所述分类部分G包括两个参数不同但结构相同的分类器,两个分类器的网络结构均包括2层全连接层,为确保分类器的参数不同,使两个分类器的参数保持余弦距离的损失函数公式如下:
所述分类部分G的输出是将两个分类器的输出向量求和并进行归一化处理,其中分别为两个分类器的所有参数。
6.根据权利要求1所述的基于通用域自适应的图像大数据分类方法,其特征在于,所述域判别器D包括三层全连接层,域判别器输出数据是来自源域还是目标域,源域训练标签为1目标域为0,所述域判别器D的训练损失函数如下所示:
其中,为输入图像的权重表示概率分布在p源域,表示概率分布在q目标域,为交叉熵损失函数,p为源域部分,q为目标域部分,为判别器的输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110333791.X/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序