[发明专利]将外部应用程序集成到深度神经网络中有效

专利信息
申请号: 201910503522.6 申请日: 2019-06-12
公开(公告)号: CN110610234B 公开(公告)日: 2023-04-07
发明(设计)人: B·卡尔梅丽;G·哈达什;E·科尔曼伊;O·拉维;G·雷维;O·萨尔-沙尔罗姆 申请(专利权)人: 国际商业机器公司
主分类号: G06N3/084 分类号: G06N3/084;G06N3/09
代理公司: 中国贸促会专利商标事务所有限公司 11038 代理人: 刘玉洁
地址: 美国*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 外部 应用程序 集成 深度 神经网络
【说明书】:

本申请涉及将外部应用程序集成到深度神经网络中。在深度神经网络(DNN)的端到端训练期间,操作可微分的估计器子网以估计外部软件应用程序的功能。然后,在由所训练的DNN进行推理期间,通过启用DNN和外部软件应用程序之间的API通信,将可微分的估计器子网替换为外部软件应用程序的功能。

技术领域

发明涉及深度神经网络(DNN)领域。

背景技术

DNN的端到端学习在过去几年中已经占据了一席之地,在包括计算机视觉、文本分析和语音识别在内的多个领域实现了最先进的性能。在端到端学习中,学习过程可以在单个端到端步骤中训练分类器,这消除了对复杂的多阶段机器学习流水线的需要。

行业面临的挑战之一是将DNN与外部应用程序集成。使DNN能够(例如,通过应用程序编程接口(API))使用外部应用程序或与外部应用程序交互可以产生优越的解决方案,因为外部应用程序提供的功能或逻辑可以被包括在DNN中,或者成为DNN的一部分。访问API是经由API的输入和输出参数完成的。例如,考虑简单的问题:“7.2大于4.5吗?”。可以通过让DNN处理自然语言处理部分并访问简单的API(例如通过运行确定哪个值更大的简单函数)来解决逻辑部分来回答该问题。这可以被称为“混合”解决方案。通过使用已经在外部应用程序中实现的分析技术和封闭算法,该类型的解决方案可以胜过纯DNN模型。这样的外部应用程序不需要学习,因此使用它们会减少所需的训练数据总量。

训练DNN以通过外部应用程序的API与外部应用程序交互存在固有的困难:大多数DNN训练过程依赖于梯度反向传播的不同变体。因此,只有所有解决方案部分都被实现为神经网络,或者至少可以返回有效梯度,才可能对它们进行端到端训练。因此,整体解决方案的所有部分必须是可微分的。

相关技术的前述示例和与其相关的限制旨在是说明性的而非排他性的。通过阅读说明书和研究附图之后,相关领域的其他限制对于本领域技术人员而言将变得明显。

发明内容

结合系统、工具和方法来描述和说明以下实施例及其方面,这些系统、工具和方法旨在是示例性和说明性的,而不是限制范围。

一个实施例提供了一种方法,包括:在深度神经网络(DNN)的端到端训练期间,操作可微分的估计器子网以估计外部软件应用程序的功能。

另一实施例提供了一种计算机程序产品,包括具有随其实现的程序代码的非暂态计算机可读存储介质,该程序代码可由至少一个硬件处理器执行以:在深度神经网络(DNN)的端到端训练期间,操作可微分的估计器子网以估计外部软件应用程序的功能。

另一实施例提供了一种系统,包括:至少一个硬件处理器;以及具有随其实现的程序代码的非暂态计算机可读存储介质,该程序代码可由所述至少一个硬件处理器执行以:在深度神经网络(DNN)的端到端训练期间,操作可微分的估计器子网以估计外部软件应用程序的功能。

在一些实施例中,该方法或指令还包括:在由所训练的DNN进行的推理期间,通过启用DNN与外部软件应用程序之间的API通信,来将可微分的估计器子网替换为外部软件应用程序的功能。

在一些实施例中,端到端训练具有随机梯度下降(SGD)。

在一些实施例中,外部软件应用程序的功能是不可微分的。

在一些实施例中,外部软件应用程序的功能是可微分的。

在一些实施例中,该方法或指令还包括操作至少一个选择器子网以:确定对外部软件应用程序的应用程序编程接口(API)调用;以及从到DNN的输入中提取合适的API自变量。

在一些实施例中,该方法或指令还包括操作适应函数以:使选择器子网的输出格式适应API所需的输入格式;并且在推理期间使API的输出格式适应DNN的更高网络层所需的输入格式。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910503522.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top