[发明专利]神经网络模型的训练方法、装置、电子设备及存储介质有效
| 申请号: | 201910722628.5 | 申请日: | 2019-08-06 |
| 公开(公告)号: | CN110413812B | 公开(公告)日: | 2022-04-26 |
| 发明(设计)人: | 李根;何轶;李磊;杨明敏 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
| 主分类号: | G06F16/51 | 分类号: | G06F16/51;G06K9/62;G06N3/08 |
| 代理公司: | 北京市立方律师事务所 11330 | 代理人: | 张筱宁 |
| 地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 神经网络 模型 训练 方法 装置 电子设备 存储 介质 | ||
1.一种神经网络模型的训练方法,其特征在于,包括:
获取训练样本数据,所述训练样本数据中包括正样本图像集和负样本图像集,其中,正样本图像集包括原始图像和原始图像的变换图像,负样本图像集中的图像与原始图像的相似度小于设定值;
基于所述训练样本数据对初始的神经网络模型进行训练,直至所述神经网络模型的总损失函数满足预设条件;
其中,所述神经网络模型是以图像为输入并且以图像的哈希码为输出的模型,所述总损失函数包括基于原始图像的哈希码和负样本图像集中的图像的哈希码确定的第一损失函数、以及基于原始图像的哈希码和原始图像的变换图像的哈希码确定的第二损失函数;
所述第一损失函数的取值表征了原始图像和负样本图像集中的图像的相似性,所述第二损失函数的取值表征了原始图像和原始图像的变换图像的差异性;
所述第一损失函数包括第一子函数和第二子函数,其中,所述第一子函数的取值表征了原始图像的哈希码和负样本图像集中的图像的哈希码的随机独立性,所述第二子函数的取值表征了原始图像的哈希码和负样本图像集中的图像的哈希码的相似度。
2.根据权利要求1所述的方法,其特征在于,所述预设条件包括:
预测准确度不小于预设阈值,其中,所述预测准确度为每次训练所计算出的所有总损失函数的结果中小于设定值的结果的数量的占比。
3.一种图像相似度的确定方法,其特征在于,包括:
获取第一图像和第二图像;
通过神经网络模型确定所述第一图像的第一哈希码和所述第二图像的第二哈希码,所述神经网络模型是通过权利要求1至2中任一项所述的方法训练得到的;
基于所述第一哈希码和所述第二哈希码,确定所述第一图像和所述第二图像的相似度。
4.一种神经网络模型的训练装置,其特征在于,包括:
样本数据获取模块,用于获取训练样本数据,所述训练样本数据中包括正样本图像集和负样本图像集,其中,正样本图像集包括原始图像和原始图像的变换图像,负样本图像集中的图像与原始图像的相似度小于设定值;
模型训练模块,用于基于所述训练样本数据对初始的神经网络模型进行训练,直至所述神经网络模型的总损失函数满足预设条件;
其中,所述神经网络模型是以图像为输入并且以图像的哈希码为输出的模型,所述总损失函数包括基于原始图像的哈希码和负样本图像集中的图像的哈希码确定的第一损失函数、以及基于原始图像的哈希码和原始图像的变换图像的哈希码确定的第二损失函数;
所述第一损失函数的取值表征了原始图像和负样本图像集中的图像的相似性,所述第二损失函数的取值表征了原始图像和原始图像的变换图像的差异性;
所述第一损失函数包括第一子函数和第二子函数中的至少一项,其中,所述第一子函数的取值表征了原始图像的哈希码和负样本图像集中的图像的哈希码的随机独立性,所述第二子函数的取值表征了原始图像的哈希码和负样本图像集中的图像的哈希码的相似度。
5.根据权利要求4所述的装置,其特征在于,所述预设条件包括:
预测准确度不小于预设阈值,其中,所述预测准确度为每次训练所计算出的所有总损失函数的结果中小于设定值的结果的数量的占比。
6.一种图像相似度的确定装置,其特征在于,包括:
图像获取模块,用于获取第一图像和第二图像;
哈希码确定模块,用于通过神经网络模型确定所述第一图像的第一哈希码和所述第二图像的第二哈希码,所述神经网络模型是通过权利要求1至3中任一项所述的方法训练得到的;
相似度确定模块,用于基于所述第一哈希码和所述第二哈希码,确定所述第一图像和所述第二图像的相似度。
7.一种电子设备,其特征在于,包括:
处理器和存储器;
所述存储器,用于存储计算机操作指令;
所述处理器,用于通过调用所述计算机操作指令,执行权利要求1至3中任一项所述的方法。
8.一种计算机可读存储介质,其特征在于,所述可读存储介质存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现权利要求1至3中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910722628.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于人脸识别的路人库跨通道聚合方法
- 下一篇:一种相同或相似图像搜索方法





