[发明专利]使用聚类损失训练神经网络有效
申请号: | 201780070400.1 | 申请日: | 2017-11-15 |
公开(公告)号: | CN109983480B | 公开(公告)日: | 2023-05-26 |
发明(设计)人: | 宋贤吴 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06V10/764;G06V10/82;G06F18/23 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 李宝泉;周亚荣 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 损失 训练 神经网络 | ||
1.一种用于执行图像处理任务的方法,所述方法包括:
训练神经网络以通过接收和处理输入图像来执行图像处理任务,其中,所述神经网络具有多个网络参数并且被配置为根据所述网络参数生成所述输入图像的嵌入,其中,训练所述神经网络包括,在多个训练迭代中的每个训练迭代处:
获得该训练迭代的一批次训练图像和对所述批次中的所述训练图像到多个聚类的真实分配;
使用所述神经网络并根据所述网络参数的当前值处理所述批次中的所述训练图像,以为每个所述训练图像生成相应的嵌入;
基于所述相应的嵌入确定所述真实分配的oracle聚类分值;
其中,所述oracle聚类分值基于所述批次中每个训练图像的所述相应的嵌入来测量所述真实分配的质量;
从多个聚类分配中确定除所述真实分配之外的具有最高增强聚类分值的可能聚类分配,其中:
每个聚类分配将所述批次中的所述训练图像分配到相应的多个聚类中,所述多个聚类中的每一个由相应的方法表示,
所述增强聚类分值是所述可能聚类分配的聚类分值加上所述可能聚类分配和所述真实分配之间的结构化差额,
聚类分配的所述聚类分值针对所述训练图像的每个嵌入测量该嵌入与最接近该嵌入的中心点的接近程度,以及
所述结构化差额测量所述可能聚类分配相对于所述真实分配的质量;和
使用除所述真实分配之外的具有最高增强聚类分值的所述可能聚类分配训练所述神经网络,以更新所述网络参数的所述当前值;
在训练所述神经网络之后,使用所述神经网络对新输入图像执行所述图像处理任务,其中,所述图像处理任务包括图像分类、基于特征的检索、图像聚类、近似重复图像检测、特征匹配、域适应或基于视频的弱监督学习中的至少一个。
2.根据权利要求1所述的方法,其中,所述结构化差额基于在所述可能聚类分配与所述真实分配之间的标准化互信息度量。
3.根据权利要求1所述的方法,其中,确定除所述真实分配之外的具有所述最高增强聚类分值的可能聚类分配包括:
使用迭代损失增强推理技术来确定初始最佳可能聚类分配。
4.根据权利要求3所述的方法,其中,使用所述迭代损失增强推理技术来确定所述初始最佳可能聚类分配包括:
在所述推理技术的每个步骤处,向最大地增加所述增强聚类分值的聚类分配添加中心点。
5.根据权利要求3所述的方法,其中,确定除所述真实分配之外的具有所述最高增强聚类分值的可能聚类分配包括:
使用损失增强细化技术来修改所述初始最佳可能聚类分配,以确定除所述真实分配之外的具有所述最高增强聚类分值的可能聚类分配。
6.根据权利要求5所述的方法,其中,使用所述损失增强细化技术来修改所述初始最佳可能聚类分配包括:
根据当前最佳可能聚类分配,执行当前最佳可能聚类分配中的当前中心点与同一聚类中的替代点的成对交换;以及
如果所述成对交换增加所述增强聚类分值,则将所述当前中心点交换为所述替代点。
7.根据权利要求1所述的方法,其中,使用除所述真实分配之外的具有最高增强聚类分值的所述可能聚类分配训练所述神经网络以更新所述网络参数的所述当前值包括:
使用除所述真实分配之外的具有最高增强聚类分值的可能聚类分配来确定目标函数相对于所述网络参数的梯度;以及
使用所述梯度来确定对所述网络参数的所述当前值的更新。
8.根据权利要求1所述的方法,进一步包括:
使用设施位置评分函数来确定所述oracle聚类分值。
9.根据权利要求1所述的方法,其中,所述神经网络的训练是随机梯度下降的。
10.根据权利要求1所述的方法,进一步包括:
提供所训练的神经网络以用于为新输入数据图像生成嵌入。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780070400.1/1.html,转载请声明来源钻瓜专利网。