[发明专利]一种具有稳定性能的深度学习方法有效
申请号: | 202110258971.6 | 申请日: | 2021-03-10 |
公开(公告)号: | CN112949658B | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 崔鹏;张兴璇 | 申请(专利权)人: | 清华大学 |
主分类号: | G06V10/44 | 分类号: | G06V10/44;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 廖元秋 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 具有 稳定 性能 深度 学习方法 | ||
1.一种具有稳定性能的深度学习方法,其特征在于,该方法首先获取用于分类任务的图片数据集训练数据集并构建一个由深度特征提取器和分类器构成的深度学习网络;从训练数据集中随机选取一个批次的样本输入该网络,其中深度特征提取器输出该输入批次样本的原始特征并经过随机傅立叶特征变换后得到对应的随机傅立叶表征矩阵;利用随机傅立叶表征矩阵对原始特征进行独立性检测,训练得到输入批次各样本的对应权重;利用该权重对当前网络的预测损失值中每个样本的预测损失值进行按位相乘得到修正后的最终训练损失值并更新网络参数,直至深度学习网络训练结束,得到训练完毕的深度学习网络;
其中,所述利用随机傅立叶表征矩阵对原始特征进行独立性检测,训练得到输入批次各样本的对应权重,包括:
构建训练损失函数如下:
其中,L(w)为训练损失,w为样本权重,wi为第i个样本的权重,n为输入批次中图片的数量,mZ为每张图片对应的原始特征的维度,Z为原始特征,u、v为随机傅立叶特征映射;输入批次中每个样本权重初始值均设为1。
2.如权利要求1所述的方法,其特征在于,该方法包括以下步骤:
1)获取训练数据集;
获取带有标注的可用于分类任务的图片数据集作为训练数据集,训练数据集中的每个训练样本包含图片和该图片对应的分类标签;
2)构建深度学习网络:
所述深度学习网络由深度特征提取器g和分类器f构成;深度特征提取器的输入是待分类的图片,输出为输入图片对应的深度视觉特征;分类器的输入为由特征提取器获取的深度视觉特征,输出为输入图片对应的分类结果;
3)从训练数据集中随机选取一个批次的样本作为当前深度学习网络的输入(X,Y),其中X代表该批次中所有图片组成的矩阵,Y代表该批次中所有图片对应的分类标签所组成的矩阵;
首先将X输入到当前深度学习网络中的深度特征提取器g中提取所有输入图片的视觉特征作为原始特征Z,然后将原始特征Z通过分类器f得到该深度学习网络输出的对应该输入批次图片的分类预测结果矩阵Y’,同时将该原始特征Z通过随机傅立叶特征变换RFF得到输入批次图片的随机傅立叶表征矩阵;
4)计算步骤3)所得到的输入批次图片分类标签的预测结果矩阵Y’与该批次图片分类标签矩阵Y的交叉熵,得到当前深度学习网络的预测损失值,该预测损失值包含该批次中每个训练样本对应的预测损失值;
5)使用步骤3)得到的输入批次图片的随机傅立叶表征矩阵对原始特征Z进行独立性检测,将各维随机傅立叶表征的相关性作为训练损失L(w),训练得到该批次各样本对应的样本权重;
6)使用步骤5)得到的样本权重与步骤4)得到的预测损失值中每个样本的预测损失值进行按位相乘,最终得到当前深度学习网络的最终训练损失值;
7)使用步骤6)的结果对当前深度学习网络进行梯度反向传播更新深度特征提取器与分类器的参数,得到更新后的当前深度学习网络;
8)重复步骤2)至7),直至深度学习网络训练结束,得到训练完毕的深度学习网络,深度学习完成。
3.如权利要求2所述的方法,其特征在于,所述深度特征提取器采用卷积网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110258971.6/1.html,转载请声明来源钻瓜专利网。