[发明专利]采样优化方法、装置、电子设备及存储介质在审
申请号: | 202111269562.2 | 申请日: | 2021-10-29 |
公开(公告)号: | CN114004364A | 公开(公告)日: | 2022-02-01 |
发明(设计)人: | 李楚鸣;刘宇;王晓刚 | 申请(专利权)人: | 上海商汤科技开发有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06V10/774;G06V10/764;G06K9/62 |
代理公司: | 北京中知恒瑞知识产权代理事务所(普通合伙) 11889 | 代理人: | 袁忠林 |
地址: | 201306 上海市浦东新区中国(上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 采样 优化 方法 装置 电子设备 存储 介质 | ||
1.一种采样优化方法,其特征在于,包括:
获取训练样本数据集,所述训练样本数据集包括具有标签的图像样本;
对所述训练样本数据集进行初始采样,基于采样结果对目标模型进行训练,得到预训练的目标模型,并基于所述预训练的目标模型确定每个图像样本的特征;
基于所述每个图像样本的特征构建概率函数;
基于所述概率函数以及所述预训练的目标模型,确定所述每个图像样本的目标采样概率。
2.根据权利要求1所述的方法,其特征在于,所述概率函数包含超参数,所述基于所述概率函数以及所述预训练的目标模型,确定所述每个图像样本的目标采样概率,包括:
通过贝叶斯优化对所述概率函数进行超参数随机搜索,确定初优化超参数,并基于所述初优化超参数得到所述每个图像样本的初优化的采样概率;
基于所述每个图像样本的初优化的采样概率,对所述训练样本数据集进行采样,基于采样结果对所述预训练的目标模型进行微训练,得到微训练结果;所述微训练是指训练迭代次数少于预设的总训练次数的训练;
基于所述微训练结果以及所述总的训练次数,确定所述每个图像样本的目标采样概率。
3.根据权利要求2所述的方法,其特征在于,所述基于所述微训练结果以及所述总的训练次数,确定所述每个图像样本的目标采样概率,包括:
基于所述微训练结果,通过贝叶斯优化对所述概率函数进行超参数搜索,得到次优化超参数,并基于所述次优化参数得到所述每个图像样本的次优化的采样概率;
基于所述每个图像样本的次优化的采样概率,对所述训练样本数据集进行采样,基于采样结果对所述预训练的目标模型进行所述微训练,得到微训练结果;
重复上述步骤,直到各个微训练的次数总和大于或等于所述预设的总的训练次数,根据每次微训练得到的微训练结果,确定所述每个图像样本的目标采样概率。
4.根据权利要求3所述的方法,其特征在于,所述根据每次微训练得到的微训练结果,确定所述每个图像样本的目标采样概率,包括:
将各个微训练结果中微训练结果最好所对应的每个图像样本的采样概率,确定为所述每个图像样本的目标采样概率。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述对所述训练样本数据集进行初始采样,包括:
以相同的采样概率对所述训练样本数据集进行所述初始采样。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述每个图像样本的特征包括所述每个图像样本的损失函数值和/或所述每个图像样本的密度值。
7.根据权利要求1至4任一项所述的方法,其特征在于,所述概率函数包括分段线性函数及所述每个图像样本的各个特征的线性加权函数,所述概率函数中的超参数包括所述每个图像样本的各个特征的权重系数及所述分段线性函数的分段端点和所述分段端点处的函数值。
8.根据权利要求1-7任一所述的方法,其特征在于,还包括:
以所述每个图像样本的目标采样概率对所述训练样本数据集进行采样,基于采样结果对所述目标模型进行训练,得到训练好的目标模型。
9.一种采样优化装置,其特征在于,所述装置包括:
样本获取模块,用于获取训练样本数据集,所述训练样本数据集包括具有标签的图像样本;
模型训练模块,用于对所述训练样本数据集进行初始采样,基于采样结果对目标模型进行训练,得到预训练的目标模型,并基于所述预训练的目标模型确定每个图像样本的特征;
函数构建模块,用于基于所述每个图像样本的特征构建概率函数;
概率优化模块,用于基于所述概率函数以及所述预训练的目标模型,确定所述每个图像样本的目标采样概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海商汤科技开发有限公司,未经上海商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111269562.2/1.html,转载请声明来源钻瓜专利网。