[发明专利]一种基于对比学习的大规模图像在线聚类系统及方法在审

申请号：	202011544811.X	申请日：	2020-12-24
公开（公告）号：	CN112668627A	公开（公告）日：	2021-04-16
发明（设计）人：	彭玺;李云帆;杨谋星	申请（专利权）人：	四川大学
主分类号：	G06K9/62	分类号：	G06K9/62;G06N3/04;G06N3/08
代理公司：	成都正华专利代理事务所(普通合伙) 51229	代理人：	李蕊
地址：	610065 四***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于对比学习大规模图像在线系统方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于对比学习的大规模图像在线聚类系统，其特征在于，包括：增广子系统、特征提取子系统、实例级别对比头子系统和类别级别对比头子系统；

所述增广子系统用于对图像样本集进行增广操作，得到两组增广图像集；所述特征提取子系统包括：第一特征提取深度神经网络和第二特征提取深度神经网络；所述第一特征提取深度神经网络和第二特征提取深度神经网络的权值共享，其中第一特征提取深度神经网络用于对其中一组增广图像集进行特征提取；所述第二特征提取深度神经网络用于对另一组增广图像集进行特征提取；所述实例级别对比头子系统用于对提取的特征进行实例级别的对比学习，并对特征提取子系统进行优化；所述类别级别对比头子系统用于对提取的特征进行类别级别的对比学习，并对特征提取子系统的进行优化，实现在线聚类。

2.一种基于对比学习的大规模图像在线聚类方法，其特征在于，包括以下步骤：

S1、对原始图像样本集进行增广操作，得到第一组增广图像集和第二组增广图像集；

S2、构建总损失函数，将第一组增广图像集和第二组增广图像集作为训练集，采用梯度下降优化方法对大规模在线聚类系统进行训练，得到训练完成的大规模在线聚类系统；

S3、采用训练完成的大规模在线聚类系统对待处理的图像样本集进行聚类处理，将类别级别对比头子系统输出的最大概率对应的类别，作为每一张图像样本的聚类结果。

3.根据权利要求2所述的基于对比学习的大规模图像在线聚类方法，其特征在于，所述步骤S1包括以下分步骤：

S11、对原始图像样本集X＝[x₁,…,x_i,…,x_N]中每一张图像x_i连续两次从裁剪缩放、水平翻转、颜色变换、转灰度图和高斯噪声中随机选择几种方式进行处理，得到每一张图像x_i的两组增广策略T^a、T^b，其中，N为原始图像样本集中图像数量；

S12、将每一张图像x_i的两组增广策略T^a、T^b分别作用于对应的图像x_i，得到两组增广图像集：和为图像x_i的增广图像，T^a(·)和T^b(·)为表示增广操作。

4.根据权利要求2所述的基于对比学习的大规模图像在线聚类方法，其特征在于，所述步骤S2中总损失函数为：

其中，为总损失函数，为实例损失函数，为类别损失函数。

5.根据权利要求4所述的基于对比学习的大规模图像在线聚类方法，其特征在于，所述实例损失函数为：

其中，为实例损失函数，N为原始图像样本集中图像数量，为第一特征向量，为第二特征向量，τ_I为第一调整系数，g_I(·)为实例级别对比头子系统采用的一个共享的两层全连接神经网络，i,j∈[1,N]。

6.根据权利要求5所述的基于对比学习的大规模图像在线聚类方法，其特征在于，所述类别损失函数为：

其中，为类别损失函数，M为类别数，为软标签矩阵Y^a的第i行，为软标签矩阵Y^b的第i行，为软标签矩阵Y^a的第i列，为软标签矩阵Y^b的第i列，为软标签矩阵Y^a的第j列，为软标签矩阵Y^b的第j列，τ_C为第二调整系数，g_C(·)为类别级别对比头子系统的采用的两层全连接神经网络，为第一特征向量，为第二特征向量，为某种增广下全部样本属于第i个类别的概率和，为某种增广下样本t属于第i个类别的概率，||Y^k||₁为软标签矩阵Y^k的1范数，k表示某种增广，a表示第一种增广，b表示第二种增广，t为矩阵行下标。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于四川大学，未经四川大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202011544811.X/1.html，转载请声明来源钻瓜专利网。

上一篇：基于导航点和RVO模型的人群疏散仿真方法
下一篇：一种角色标识显示方法、装置、设备及存储介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于对比学习的大规模图像在线聚类系统及方法在审

专利文献下载