[发明专利]一种基于对比学习的大规模图像在线聚类系统及方法在审
| 申请号: | 202011544811.X | 申请日: | 2020-12-24 |
| 公开(公告)号: | CN112668627A | 公开(公告)日: | 2021-04-16 |
| 发明(设计)人: | 彭玺;李云帆;杨谋星 | 申请(专利权)人: | 四川大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 成都正华专利代理事务所(普通合伙) 51229 | 代理人: | 李蕊 |
| 地址: | 610065 四*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 对比 学习 大规模 图像 在线 系统 方法 | ||
1.一种基于对比学习的大规模图像在线聚类系统,其特征在于,包括:增广子系统、特征提取子系统、实例级别对比头子系统和类别级别对比头子系统;
所述增广子系统用于对图像样本集进行增广操作,得到两组增广图像集;所述特征提取子系统包括:第一特征提取深度神经网络和第二特征提取深度神经网络;所述第一特征提取深度神经网络和第二特征提取深度神经网络的权值共享,其中第一特征提取深度神经网络用于对其中一组增广图像集进行特征提取;所述第二特征提取深度神经网络用于对另一组增广图像集进行特征提取;所述实例级别对比头子系统用于对提取的特征进行实例级别的对比学习,并对特征提取子系统进行优化;所述类别级别对比头子系统用于对提取的特征进行类别级别的对比学习,并对特征提取子系统的进行优化,实现在线聚类。
2.一种基于对比学习的大规模图像在线聚类方法,其特征在于,包括以下步骤:
S1、对原始图像样本集进行增广操作,得到第一组增广图像集和第二组增广图像集;
S2、构建总损失函数,将第一组增广图像集和第二组增广图像集作为训练集,采用梯度下降优化方法对大规模在线聚类系统进行训练,得到训练完成的大规模在线聚类系统;
S3、采用训练完成的大规模在线聚类系统对待处理的图像样本集进行聚类处理,将类别级别对比头子系统输出的最大概率对应的类别,作为每一张图像样本的聚类结果。
3.根据权利要求2所述的基于对比学习的大规模图像在线聚类方法,其特征在于,所述步骤S1包括以下分步骤:
S11、对原始图像样本集X=[x1,…,xi,…,xN]中每一张图像xi连续两次从裁剪缩放、水平翻转、颜色变换、转灰度图和高斯噪声中随机选择几种方式进行处理,得到每一张图像xi的两组增广策略Ta、Tb,其中,N为原始图像样本集中图像数量;
S12、将每一张图像xi的两组增广策略Ta、Tb分别作用于对应的图像xi,得到两组增广图像集:和为图像xi的增广图像,Ta(·)和Tb(·)为表示增广操作。
4.根据权利要求2所述的基于对比学习的大规模图像在线聚类方法,其特征在于,所述步骤S2中总损失函数为:
其中,为总损失函数,为实例损失函数,为类别损失函数。
5.根据权利要求4所述的基于对比学习的大规模图像在线聚类方法,其特征在于,所述实例损失函数为:
其中,为实例损失函数,N为原始图像样本集中图像数量,为第一特征向量,为第二特征向量,τI为第一调整系数,gI(·)为实例级别对比头子系统采用的一个共享的两层全连接神经网络,i,j∈[1,N]。
6.根据权利要求5所述的基于对比学习的大规模图像在线聚类方法,其特征在于,所述类别损失函数为:
其中,为类别损失函数,M为类别数,为软标签矩阵Ya的第i行,为软标签矩阵Yb的第i行,为软标签矩阵Ya的第i列,为软标签矩阵Yb的第i列,为软标签矩阵Ya的第j列,为软标签矩阵Yb的第j列,τC为第二调整系数,gC(·)为类别级别对比头子系统的采用的两层全连接神经网络,为第一特征向量,为第二特征向量,为某种增广下全部样本属于第i个类别的概率和,为某种增广下样本t属于第i个类别的概率,||Yk||1为软标签矩阵Yk的1范数,k表示某种增广,a表示第一种增广,b表示第二种增广,t为矩阵行下标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011544811.X/1.html,转载请声明来源钻瓜专利网。





