[发明专利]使用基于批次的主动学习方案训练机器学习模型在审

专利信息
申请号: 202011017744.6 申请日: 2020-09-24
公开(公告)号: CN112561073A 公开(公告)日: 2021-03-26
发明(设计)人: G·古普塔;A·K·萨胡;林婉怡;J·C·舒利 申请(专利权)人: 罗伯特·博世有限公司
主分类号: G06N20/00 分类号: G06N20/00;G06K9/62
代理公司: 中国专利代理(香港)有限公司 72001 代理人: 毕铮;刘春元
地址: 德国斯*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 使用 基于 批次 主动 学习 方案 训练 机器 模型
【说明书】:

提供了使用基于批次的主动学习方案训练机器学习模型。用于使用基于批次的主动学习方案来训练机器学习模型的系统。所述系统包括信息源和电子处理器。电子处理器被配置为接收要训练的机器学习模型、未标注训练数据集、经标注训练数据集和信息源的标识符。电子处理器还被配置为从未标注训练数据集中选择训练示例批次,并且针对所述批次中包括的每个训练示例,向信息源发送针对所述训练示例的标注的请求。电子处理器进一步被配置为,针对所述批次中包括的每个训练示例:接收标注,将所述训练示例与所述标注相关联,并且将所述训练示例添加到经标注训练数据集。电子处理器还被配置为使用经标注训练数据来训练机器学习模型。

背景技术

机器学习模型(例如,神经网络、决策树、支持向量机、贝叶斯网络等)被包括在诸如汽车、医学装备、安全系统等许多产品中。机器学习模型被训练成通过使用经标注训练数据的学习算法将输入数据(例如,从相机接收的图像、从麦克风接收的音频记录等)分类为多个选项之一。例如,机器学习模型可以从相机接收图像作为输入,并被训练成确定图像是否包括大象。在该示例中,训练数据包括描绘或不描绘大象的多个图像。训练数据中的每个图像与标注相关联,该标注指示图像中是否包括大象。通过尝试针对训练数据中包括的每个训练示例确定图像中是否描绘了大象,并在每次确定错误时更新机器学习模型,机器学习模型学习检测图像是否包括大象。

发明内容

主动学习是机器学习的一种特殊情况,在该特殊情况下,学习算法能够交互式地查询用户或某个其他信息源(例如,数据库),以获得未标注训练数据的标注。主动学习是有用的,因为标注训练数据是一项耗时且劳动密集型的任务。例如,在医学诊断中,标注MRI扫描、计算机断层(CT)扫描、正电子发射断层(PET)扫描等来指示扫描是否指示特定的疾病或状况是要求专家医学知识的耗时的任务。使用主动学习的学习算法通过从未标注训练数据中选择最相关的训练示例并且仅针对被认为最相关的训练示例的标注查询信息源,来减少训练机器学习模型(例如,深度学习模型)所需的经标注训练示例的数量。

当前,存在使用主动学习来训练机器学习模型的若干种系统。然而,许多当前系统一次获取一个附加的经标注训练示例,将一个附加的训练示例添加到经标注训练数据,并且在每次获取之后使用更新的经标注训练数据来重新训练模型。这些当前系统花费大量的计算时间来重新训练机器学习模型,尤其是当机器学习模型是深度学习模型时。这些当前系统也是低效的,因为对信息源的每个查询与成本(例如,处理和网络容量)相关联,并且这些系统对信息源进行大量查询。附加地,许多当前系统未能将如下事实考虑在内:即信息源可能提供错误标注或有噪声的数据。

为了克服用于利用主动学习来训练机器学习模型的当前系统的缺陷,除了其他事物之外,本文的实施例还描述了用于使用基于批次的主动学习方案来训练机器学习模型的系统和方法。在一些实施例中,主动学习算法针对训练示例批次的标注查询信息源。在获取训练示例批次的标注之后,学习算法使用经标注训练示例批次来重新训练机器学习模型。在获取训练示例批次的标注之后重新训练机器学习模型而不是在获取单个训练示例的标注之后重新训练机器学习模型,允许使用更少的处理能力和不太强大的处理器来教导机器学习模型。附加地,使用训练示例批次而不是单个训练示例来训练机器学习模型,允许机器学习模型在更少的时间内并且在对信息源查询更少的情况下被训练。当机器学习模型利用深度学习(例如,深度神经网络)时,用于训练机器学习模型的更快且更高效的方法尤其重要。

本文描述的一些实施例还将针对一个或多个训练示例获取的标注可能错误或有噪声考虑在内。在一些实例中,实施例包括将层添附到正被训练的机器学习模型上。添附层确定了经训练的机器学习模型可能由于有噪声或误标注的训练数据而误标注其接收的输入的可能性。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于罗伯特·博世有限公司,未经罗伯特·博世有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011017744.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top