[发明专利]一种模型优化方法、设备及存储介质在审
| 申请号: | 202010550559.7 | 申请日: | 2020-06-16 |
| 公开(公告)号: | CN113807528A | 公开(公告)日: | 2021-12-17 |
| 发明(设计)人: | 陈泽晗;赵伟;陈岳峰;何源 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00 |
| 代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 张爱;刘戈 |
| 地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 模型 优化 方法 设备 存储 介质 | ||
1.一种模型优化方法,其特征在于,包括:
获取若干样本集,所述样本集中包含样本数据及打标信息;
基于所述若干样本集各自包含的样本数据及打标信息,从所述若干样本集中,批量选择符合预设要求的目标样本集;
根据所述目标样本集,训练待提升模型。
2.根据权利要求1所述的方法,其特征在于,所述基于所述若干样本集各自包含的样本数据及打标信息,从所述若干样本集中,批量选择符合预设要求的目标样本集,包括:
根据所述若干样本集各自包含的样本数据及打标信息,计算所述若干样本集各自对应的样本价值;
根据所述若干样本集各自对应的样本价值,从所述若干样本集中,批量选择符合预设要求的目标样本集。
3.根据权利要求2所述的方法,其特征在于,所述根据所述若干样本集各自包含的样本数据及打标信息,计算所述若干样本集各自对应的样本价值,包括:
分别对所述若干样本集各自包含的样本数据进行打标信息预测,以获得各样本数据各自对应的预测结果的预测概率;
根据所述若干样本集各自包含的打标信息,分别确定所述若干样本集各自对应的打标质量参数;
根据所述若干样本集各自对应的打标质量参数和预测结果的预测概率,计算所述若干样本集各自对应的样本价值。
4.根据权利要求3所述的方法,其特征在于,所述根据所述若干样本集各自包含的打标信息,分别确定所述若干样本集各自对应的打标质量参数,包括:
根据各样本数据各自对应的预测结果和打标信息,确定所述若干样本集各自对应的打标质量参数。
5.根据权利要求4所述的方法,其特征在于,所述根据各样本数据各自对应的预测结果和打标信息,计算所述若干样本集各自的打标质量参数,包括:
若第一样本数据对应的预测结果和打标信息一致,则确定所述第一样本数据所在的样本集的打标质量参数为打标正确;
若所述第一样本数据对应的预测结果和打标信息不一致,则确定所述第一样本数据所在的样本集的打标质量参数为打标错误;
其中,所述第一样本数据为所述若干样本集中任意一个样本集所包含的样本数据。
6.根据权利要求3-5任一项所述的方法,其特征在于,所述根据所述若干样本集各自对应的打标质量参数和预测结果的预测概率,计算所述若干样本集各自对应的样本价值,包括:
利用1减去第一样本集对应的所述预测结果的预测概率,获得第一因数;
将所述第一样本集对应的打标质量参数作为第二因数;
计算所述第一因数和所述第二因数的乘积,作为所述第一样本集对应的样本价值;
其中,所述第一样本集为所述若干样本集中的任意一个。
7.根据权利要求3所述的方法,其特征在于,所述分别对所述若干样本集各自包含的样本数据进行打标信息预测,以获得各样本数据各自对应的预测结果的预测概率,包括:
将所述若干样本集各自包含的样本数据输入所述待提升模型;
利用所述待提升模型,分别对所述若干样本集各自包含的样本数据进行结果预测,以获得各样本数据各自对应的预测结果的预测概率。
8.根据权利要求2所述的方法,其特征在于,所述根据所述若干样本集各自对应的样本价值,从所述若干样本集中,批量选择符合预设要求的目标样本集,包括:
基于所述若干样本集各自对应的样本价值,从至少一种选择维度,在所述若干样本集中选择符合预设要求的目标样本集。
9.根据权利要求8所述的方法,其特征在于,所述至少一种选择维度包括选择总量维度,所述基于所述若干样本集各自对应的样本价值,从至少一种选择维度,在所述若干样本集中选择符合预设要求的目标样本集,包括:
从所述若干样本集中,选择样本价值最大的N个样本集,作为目标样本集,其中,N为预设的选择总量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010550559.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:控制风电场的有功功率输出的方法及相应装置
- 下一篇:半导体结构的形成方法





