[发明专利]识别用于机器学习任务的迁移模型在审

申请号：	201910403975.1	申请日：	2019-05-16
公开（公告）号：	CN110503204A	公开（公告）日：	2019-11-26
发明（设计）人：	P·沃特森;B·博哈塔查尔杰;N·C·考德拉;B·M·贝尔高德瑞;P·都贝;M·R·格拉斯;J·R·肯德尔;霍思宇;M·L·赫尔	申请（专利权）人：	国际商业机器公司
主分类号：	G06N20/00	分类号：	G06N20/00;G06N3/04;G06K9/62
代理公司：	11038 中国国际贸易促进委员会专利商标事务所	代理人：	刘玉洁<国际申请>=<国际公布>=<进入
地址：	美国***	国省代码：	美国;US
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	计算机可执行组件存储器相似性度量机器学习目标机器评估组件识别组件源数据集迁移神经网络模型处理器操作存储计算机可执行组件样本数据处理器存储关联学习评估申请
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请涉及识别用于机器学习任务的迁移模型。提供了关于自主地促进选择一个或多个迁移模型以增强一个或多个机器学习任务的性能的技术。例如，这里描述的一个或多个实施例可以包括一种系统，该系统可以包括可以存储计算机可执行组件的存储器。该系统还可以包括处理器，该处理器操作性地耦接到存储器，并且可以执行存储在存储器中的计算机可执行组件。该计算机可执行组件可以包括评估组件，该评估组件可以评估源数据集和来自目标机器学习任务的样本数据集之间的相似性度量。计算机可执行组件还可以包括识别组件，识别组件可以基于相似性度量识别与源数据集相关联的预训练的神经网络模型，以执行目标机器学习任务。

技术领域

本公开涉及用于机器学习任务的迁移模型的识别，并且更具体地，涉及自主地识别要被选择用于迁移学习的一个或多个预训练的神经网络，以增强一个或多个机器学习任务的性能。

背景技术

各种人工智能(“AI”)技术利用深度学习神经网络模型来执行一个或多个机器学习任务。模型的准确性取决于用于训练该模型的数据量和/或数据类型。例如，用于训练主题(subject)模型的唯一数据(例如，非重复数据)越多，主题模型可以变得越准确。然而，许多机器学习任务具有可用于训练模型的有限量的数据。另外，在其中大量数据可用的情况下，训练模型可能是耗时的。传统方法试图通过迁移学习来解决这些问题，其中利用预先存在的预训练的模型来分析新数据集并执行一个或多个期望的机器学习任务。然而，对于给定的新数据集，识别选择哪个预训练的模型用于迁移学习可以直接影响一个或多个期望的机器学习任务的性能。

发明内容

以下呈现发明内容以提供对本发明的一个或多个实施例的基本理解。本发明内容不旨在识别关键或重要元素，或描绘特定实施例的任何范围或权利要求的任何范围。其唯一目的是以简化形式来呈现概念，以作为稍后呈现的更详细描述的序言。在这里描述的一个或多个实施例中，描述了可以自主地识别要被选择用于迁移学习的一个或多个预训练的神经网络以增强一个或多个机器学习任务的性能的系统、计算机实现的方法、装置和/或计算机程序产品。

根据一个实施例，提供了一种系统。该系统可以包括可以存储计算机可执行组件的存储器。该系统还可以包括处理器，该处理器可操作地耦接到存储器，并且可以执行存储在存储器中的计算机可执行组件。计算机可执行组件可以包括评估组件，该评估组件可以评估源数据集和来自目标机器学习任务的样本数据集之间的相似性度量。计算机可执行组件还可以包括识别组件，该识别组件可以基于相似性度量识别与源数据集相关联的预训练的神经网络模型以执行目标机器学习任务。

根据一个实施例，提供了一种计算机实现的方法。该计算机实现的方法可以包括由可操作地耦接到处理器的系统评估源数据集和来自目标机器学习任务的样本数据集之间的相似性度量。而且，计算机实现的方法可以包括由系统基于相似性度量来识别与源数据集相关联的预训练的神经网络模型以执行目标机器学习任务。

根据一个实施例，提供了一种计算机程序产品，该计算机程序产品可以促进使用预训练的神经网络模型来增强目标机器学习任务的性能。该计算机程序产品可以包括具有随其而体现的程序指令的计算机可读存储介质。该计算机指令可以由处理器执行以使处理器由可操作地耦接到处理器的系统评估源数据集和来自目标机器学习任务的样本数据集之间的相似性度量。而且，该程序指令还可以使处理器由系统基于相似性度量识别与源数据集相关联的预训练的神经网络模型以执行目标机器学习任务。

附图说明

该专利或申请文件包含至少一幅彩色图。在请求和支付必要费用后，专利局将提供具有彩色图的本专利或专利申请公开的副本。

图1示出了根据这里描述的一个或多个实施例的示例的非限制性系统的框图，该系统可以促进选择用于迁移学习的一个或多个预训练的神经网络模型，该一个或多个预训练的神经网络模型可以增强一个或多个机器学习任务的性能。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于国际商业机器公司，未经国际商业机器公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910403975.1/2.html，转载请声明来源钻瓜专利网。

上一篇：一种基于CAD的设计知识求解系统及系统的使用方法
下一篇：一种多模态数据处理方法及系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]识别用于机器学习任务的迁移模型在审

专利文献下载