[发明专利]识别用于机器学习任务的迁移模型在审
申请号: | 201910403975.1 | 申请日: | 2019-05-16 |
公开(公告)号: | CN110503204A | 公开(公告)日: | 2019-11-26 |
发明(设计)人: | P·沃特森;B·博哈塔查尔杰;N·C·考德拉;B·M·贝尔高德瑞;P·都贝;M·R·格拉斯;J·R·肯德尔;霍思宇;M·L·赫尔 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06N3/04;G06K9/62 |
代理公司: | 11038 中国国际贸易促进委员会专利商标事务所 | 代理人: | 刘玉洁<国际申请>=<国际公布>=<进入 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 计算机可执行组件 存储器 相似性度量 机器学习 目标机器 评估组件 识别组件 源数据集 迁移 神经网络模型 处理器操作 存储计算机 可执行组件 样本数据 处理器 存储 关联 学习 评估 申请 | ||
1.一种计算机实现的方法,包括:
由操作性地耦接到处理器的系统评估源数据集和来自目标机器学习任务的样本数据集之间的相似性度量;以及
由所述系统基于所述相似性度量识别与所述源数据集相关联的预训练的神经网络模型,以执行所述目标机器学习任务。
2.如权利要求1所述的计算机实现的方法,其中所述评估还包括:
由所述系统使用特征提取器和统计聚合技术来创建所述源数据集的第一向量表示和所述样本数据集的第二向量表示;以及
由所述系统使用所述关于所述第一向量表示和所述第二向量表示的距离计算技术来评估所述相似性度量。
3.如权利要求2所述的计算机实现的方法,其中,所述距离计算技术选自包括以下各项的组:Kullback-Leibler散度、欧几里德距离、余弦相似性,曼哈顿距离、明可夫斯基距离、简森香农距离、卡方距离和杰卡德相似性。
4.如权利要求1所述的计算机实现的方法,还包括由所述系统使用来自所述目标机器学习任务的目标数据集在所述预训练的神经网络模型上执行训练步骤。
5.如权利要求1所述的计算机实现的方法,其中,所述识别包括由所述系统从预先存在的模型库中识别所述预训练的神经网络模型。
6.如权利要求1所述的计算机实现的方法,还包括:
由所述系统评估多个源数据集和所述样本数据集之间的相似性度量,其中所述源数据集包括在所述多个源数据集内;以及
由所述系统使用所述源数据集和来自所述多个源数据集的第二源数据集生成所述预训练的神经网络模型。
7.如权利要求6所述的系统,其中所述源数据集与基于视觉的模型相关联,并且所述第二源数据集与基于知识的模型相关联。
8.如权利要求1所述的系统,其中在云计算环境中访问所述相似性度量。
9.如权利要求2所述的计算机实现的方法,其中所述统计聚合技术选自包括以下各项的组:平均值、码本、标准偏差和中值平均值。
10.一种系统,包括:
存储计算机可执行组件的存储器;以及
执行存储在所述存储器中的所述计算机可执行组件的处理器,其中所述计算机可执行组件包括用于实现权利要求1-9之一所述的方法中的步骤的组件。
11.一种计算机程序产品,所述计算机程序产品促进使用预训练的神经网络模型来增强目标机器学习任务的性能,所述计算机程序产品包括具有随其体现的程序指令的计算机可读存储介质,所述程序指令能够由处理器执行以使所述处理器实现权利要求1-9之一所述的方法中的步骤。
12.一种计算机实现的系统,包括用于实现权利要求1-9之一所述的方法中的步骤的装置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910403975.1/1.html,转载请声明来源钻瓜专利网。