[发明专利]卷积神经网络的训练方法和系统以及预测方法和系统在审
申请号: | 202110062025.4 | 申请日: | 2021-01-18 |
公开(公告)号: | CN112651467A | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 张辉;姚权铭 | 申请(专利权)人: | 第四范式(北京)技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 朱志玲;苏银虹 |
地址: | 100085 北京市海淀区清*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积 神经网络 训练 方法 系统 以及 预测 | ||
提供了一种卷积神经网络的训练方法和系统以及预测方法和系统,其中,所述训练方法包括:获取训练数据集,其中,每个训练数据包括训练样本以及训练样本的标记,其中,标记包含噪声标记;基于训练样本本身对所述卷积神经网络的第一部分进行表示学习,以学习训练样本的特征表示;基于学习出的训练样本的特征表示以及训练样本的标记对所述卷积神经网络的第二部分进行分类器学习,以获得分类器。
技术领域
本公开总体说来涉及人工智能领域,更具体地,涉及一种用于训练卷积神经网络的方法和系统以及利用卷积神经网络执行预测的方法和系统。
背景技术
卷积神经网络(ConvNet)由于其强大的复杂模式拟合能力而被广泛地运用。但是这种能力是以获取到大量干净数据标注进行有效训练为前提,具体实践中由于成本等原因,标记数据中无法避免地会混入错误,即噪声标记(noisy label)。而ConvNet由于过度参数化的原因很容易记忆这些噪声标记,从而使得其泛化性(generalization)大大降低。目前,存在基于损失函数优化的噪声样本学习方法、基于半监督学习的噪声样本学习方法和基于元学习的噪声样本学习方法,然而,上述方法中对卷积神经网络的训练都是对整个卷积神经网络一起进行学习,而这导致训练的卷积神经网络容易受噪声标记的影响而训练效果欠佳,进而导致难以利用训练的卷积神经网络提供准确的预测结果。
发明内容
本公开提供一种用于训练卷积神经网络的方法和系统、一种利用卷积神经网络执行预测的方法和系统、一种存储指令的计算机可读存储介质以及一种包括至少一个计算装置和存储指令的至少一个存储装置的系统,以至少解决相关技术中的上述问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供了一种由计算装置执行的训练卷积神经网络的方法,所述方法包括:获取训练数据集,其中,每个训练数据包括训练样本以及训练样本的标记,其中,标记包含噪声标记;基于训练样本本身对所述卷积神经网络的第一部分进行表示学习,以学习训练样本的特征表示;基于学习出的训练样本的特征表示以及训练样本的标记对所述卷积神经网络的第二部分进行分类器学习,以获得分类器。
可选地,所述方法还包括:在获得分类器之后,对整个所述卷积神经网络进行半监督学习来调整所述卷积神经网络的参数。
可选地,对整个所述卷积神经网络进行半监督学习来调整所述卷积神经网络的参数,包括:使用获得的分类器对训练样本的标记以及所述卷积神经网络针对训练样本的预测结果进行可信度评估;根据可信度评估结果将训练数据集中的训练样本转换为不带标记的训练样本和带有无噪声标记的训练样本;基于不带标记的训练样本和带有无噪声标记的训练样本对整个所述卷积神经网络进行半监督学习来调整所述卷积神经网络的参数。
可选地,所述使用获得的分类器对训练样本的标记以及所述卷积神经网络针对训练样本的预测结果进行可信度评估,包括:利用第一高斯混合模型估计训练样本的标记的第一可信度,其中,第一高斯混合模型是根据分类器针对训练数据集的预测损失分布获得的;根据估计出的第一可信度,确定训练样本的标记是无噪声标记还是噪声标记;如果训练样本的标记被确定为是噪声标记,则将分类器针对该训练样本的预测结果作为该训练样本的修正标记;利用第二高斯混合模型估计修正标记的第二可信度,其中,第二高斯混合模型是根据分类器针对训练数据集的预测概率分布获得的。
可选地,所述根据可信度估计结果将训练数据集中的训练样本转换为不带标记的训练样本和带有无噪声标记的训练样本,包括:根据第一可信度和第二可信度将训练数据集中的训练样本转换为不带标记的训练样本和带有无噪声标记的训练样本。
可选地,所述根据第一可信度和第二可信度将训练数据集中的训练样本转换为不带标记的训练样本和带有无噪声标记的训练样本,包括:将与第一可信度大于第一阈值的标记对应的训练样本以及与第二可信度大于第二阈值的修正标记对应的训练样本确定为带有无噪声标记的训练样本;将与第二可信度小于或等于第二阈值的修正标记对应的训练样本的标记去除,作为不带标记的训练样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110062025.4/2.html,转载请声明来源钻瓜专利网。