[发明专利]使用基于批次的主动学习方案训练机器学习模型在审
申请号: | 202011017744.6 | 申请日: | 2020-09-24 |
公开(公告)号: | CN112561073A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | G·古普塔;A·K·萨胡;林婉怡;J·C·舒利 | 申请(专利权)人: | 罗伯特·博世有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06K9/62 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 毕铮;刘春元 |
地址: | 德国斯*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 基于 批次 主动 学习 方案 训练 机器 模型 | ||
1.一种用于使用基于批次的主动学习方案来训练机器学习模型的系统,所述系统包括:
信息源;和
电子处理器,电子处理器被配置为
(i)接收要训练的机器学习模型、未标注训练数据集、经标注训练数据集和信息源的标识符;
(ii)从未标注训练数据集中选择训练示例批次;
(iii)针对所述批次中包括的每个训练示例,向信息源发送针对所述训练示例的标注的请求;
(iv)针对所述批次中包括的每个训练示例
接收标注,
将所述训练示例与所述标注相关联,并且
将所述训练示例添加到经标注训练数据集;以及
(v)使用所述批次中包括的经标注训练数据来训练机器学习模型。
2.根据权利要求1所述的系统,其中,电子处理器被配置为重复动作(ii)-(v),直到机器学习模型的训练完成。
3.根据权利要求2所述的系统,其中,当从包括以下各项的组中选择的至少一个时,机器学习模型的训练完成:机器学习模型达到期望的成功率,机器学习模型达到期望的失败率,电子处理器已经向信息源发送了至少预定数量的针对标注的请求,以及至少预定量的处理能力用于查询信息源。
4.根据权利要求1所述的系统,其中电子处理器被配置为通过以下方式从未标注训练数据集中选择训练示例批次
(vi)针对包括在未标注训练数据集中的每个训练示例向训练示例分配重要性分数;
(vii)对训练示例进行聚类;
(viii)基于包括在与质心相关联的聚类中的训练示例的重要性分数来确定每个聚类的质心;
(iv)针对每个质心,选择与质心相关联的一个或多个训练示例来包括在所述批次中。
5.根据权利要求4所述的系统,其中电子处理器被配置为
重复动作(iv),直到期望数量的训练示例被包括在所述批次中;以及
每次重复动作(iv),修改用于选择一个或多个训练示例来包括在批次中的预定阈值。
6.根据权利要求4所述的系统,其中,训练示例的重要性分数指示当使用所述训练示例训练机器学习模型时,机器学习模型的不确定性方面的减少。
7.根据权利要求4所述的系统,其中电子处理器被配置为
确定机器学习模型的不确定性;
使用具有温度系数的吉布斯分布,所述温度系数是机器学习模型确定训练示例与质心相关联的概率的不确定性的逆;以及
当所述训练示例与质心相关联的概率大于预定阈值时,将所述训练示例包括在所述批次中。
8.根据权利要求4所述的系统,其中聚类的质心的重要性分数是聚类中包括的训练示例中的每个训练示例的中值。
9.根据权利要求1所述的系统,其中电子处理器进一步被配置为
当机器学习模型的训练完成时,向机器学习模型输入图像或音频记录,用于分类到多个类之一中,以及
基于图像的分类,执行从包括控制车辆动作、允许访问电子设备以及向用户输出警报的组中选择的一个。
10.根据权利要求1所述的系统,其中电子处理器进一步被配置为将去噪层添附到机器学习模型上,其中去噪层确定与训练示例相关联的噪声,并且使用来自去噪层的输出来训练机器学习模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于罗伯特·博世有限公司,未经罗伯特·博世有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011017744.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电器及真空隔热结构
- 下一篇:显示面板光学串扰补偿系统和方法