[发明专利]识别用于机器学习任务的迁移模型在审
申请号: | 201910403975.1 | 申请日: | 2019-05-16 |
公开(公告)号: | CN110503204A | 公开(公告)日: | 2019-11-26 |
发明(设计)人: | P·沃特森;B·博哈塔查尔杰;N·C·考德拉;B·M·贝尔高德瑞;P·都贝;M·R·格拉斯;J·R·肯德尔;霍思宇;M·L·赫尔 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06N3/04;G06K9/62 |
代理公司: | 11038 中国国际贸易促进委员会专利商标事务所 | 代理人: | 刘玉洁<国际申请>=<国际公布>=<进入 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 计算机可执行组件 存储器 相似性度量 机器学习 目标机器 评估组件 识别组件 源数据集 迁移 神经网络模型 处理器操作 存储计算机 可执行组件 样本数据 处理器 存储 关联 学习 评估 申请 | ||
本申请涉及识别用于机器学习任务的迁移模型。提供了关于自主地促进选择一个或多个迁移模型以增强一个或多个机器学习任务的性能的技术。例如,这里描述的一个或多个实施例可以包括一种系统,该系统可以包括可以存储计算机可执行组件的存储器。该系统还可以包括处理器,该处理器操作性地耦接到存储器,并且可以执行存储在存储器中的计算机可执行组件。该计算机可执行组件可以包括评估组件,该评估组件可以评估源数据集和来自目标机器学习任务的样本数据集之间的相似性度量。计算机可执行组件还可以包括识别组件,识别组件可以基于相似性度量识别与源数据集相关联的预训练的神经网络模型,以执行目标机器学习任务。
技术领域
本公开涉及用于机器学习任务的迁移模型的识别,并且更具体 地,涉及自主地识别要被选择用于迁移学习的一个或多个预训练的神 经网络,以增强一个或多个机器学习任务的性能。
背景技术
各种人工智能(“AI”)技术利用深度学习神经网络模型来执行一 个或多个机器学习任务。模型的准确性取决于用于训练该模型的数据 量和/或数据类型。例如,用于训练主题(subject)模型的唯一数据(例 如,非重复数据)越多,主题模型可以变得越准确。然而,许多机器 学习任务具有可用于训练模型的有限量的数据。另外,在其中大量数 据可用的情况下,训练模型可能是耗时的。传统方法试图通过迁移学 习来解决这些问题,其中利用预先存在的预训练的模型来分析新数据 集并执行一个或多个期望的机器学习任务。然而,对于给定的新数据 集,识别选择哪个预训练的模型用于迁移学习可以直接影响一个或多个期望的机器学习任务的性能。
发明内容
以下呈现发明内容以提供对本发明的一个或多个实施例的基本 理解。本发明内容不旨在识别关键或重要元素,或描绘特定实施例的 任何范围或权利要求的任何范围。其唯一目的是以简化形式来呈现概 念,以作为稍后呈现的更详细描述的序言。在这里描述的一个或多个 实施例中,描述了可以自主地识别要被选择用于迁移学习的一个或多 个预训练的神经网络以增强一个或多个机器学习任务的性能的系统、 计算机实现的方法、装置和/或计算机程序产品。
根据一个实施例,提供了一种系统。该系统可以包括可以存储计 算机可执行组件的存储器。该系统还可以包括处理器,该处理器可操 作地耦接到存储器,并且可以执行存储在存储器中的计算机可执行组 件。计算机可执行组件可以包括评估组件,该评估组件可以评估源数 据集和来自目标机器学习任务的样本数据集之间的相似性度量。计算 机可执行组件还可以包括识别组件,该识别组件可以基于相似性度量 识别与源数据集相关联的预训练的神经网络模型以执行目标机器学习 任务。
根据一个实施例,提供了一种计算机实现的方法。该计算机实现 的方法可以包括由可操作地耦接到处理器的系统评估源数据集和来自 目标机器学习任务的样本数据集之间的相似性度量。而且,计算机实 现的方法可以包括由系统基于相似性度量来识别与源数据集相关联的 预训练的神经网络模型以执行目标机器学习任务。
根据一个实施例,提供了一种计算机程序产品,该计算机程序产 品可以促进使用预训练的神经网络模型来增强目标机器学习任务的性 能。该计算机程序产品可以包括具有随其而体现的程序指令的计算机 可读存储介质。该计算机指令可以由处理器执行以使处理器由可操作 地耦接到处理器的系统评估源数据集和来自目标机器学习任务的样本数据集之间的相似性度量。而且,该程序指令还可以使处理器由系统 基于相似性度量识别与源数据集相关联的预训练的神经网络模型以执 行目标机器学习任务。
附图说明
该专利或申请文件包含至少一幅彩色图。在请求和支付必要费用 后,专利局将提供具有彩色图的本专利或专利申请公开的副本。
图1示出了根据这里描述的一个或多个实施例的示例的非限制性 系统的框图,该系统可以促进选择用于迁移学习的一个或多个预训练 的神经网络模型,该一个或多个预训练的神经网络模型可以增强一个 或多个机器学习任务的性能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910403975.1/2.html,转载请声明来源钻瓜专利网。