[发明专利]用于提供具有可调节计算需求的机器学习模型的系统和方法在审
申请号: | 201980056728.7 | 申请日: | 2019-09-19 |
公开(公告)号: | CN112868033A | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | M.沙里夫;A.沙马;A.莫德文特西夫 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06F9/50;G06N3/08 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 金玉洁 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 提供 具有 调节 计算 需求 机器 学习 模型 系统 方法 | ||
1.一种计算设备,包括:
至少一个处理器;
机器学习模型,包括多个块和所述多个块中的两个或更多个块之间的一个或多个残差连接,其中所述机器学习模型被配置为接收模型输入,并且响应于模型输入的接收,输出模型输出;
至少一个有形的、非瞬时性计算机可读介质,所述计算机可读介质存储指令,所述指令当由所述至少一个处理器执行时使得所述至少一个处理器执行操作,所述操作包括:
确定资源分配参数,所述资源分配参数与在推理时间对所述机器学习模型的系统资源的期望分配相对应;
基于所述资源分配参数停用所述机器学习模型的多个块的子集;
将所述模型输入输入到所述多个块的子集被停用的机器学习模型;以及
接收所述模型输出作为所述机器学习模型的输出。
2.根据权利要求1所述的计算设备,其中选择所述多个块的子集以使得所述残差连接中的至少一个绕过所述多个块的子集中的每一个。
3.根据权利要求1所述的计算设备,其中所述多个块的子集中的每一个位于所述机器学习模型的残差连接的至少一个之间。
4.根据权利要求1所述的计算设备,其中所述资源分配参数基于以下中的一个或多个来确定:电池状态、计算设备的模式、当前可用处理器能力或当前正在运行的应用的数量。
5.根据权利要求1所述的计算设备,其中确定所述资源分配参数包括从所述计算设备的用户接收输入。
6.根据权利要求1所述的计算设备,其中确定所述资源分配参数包括在将所述模型输入输入到所述机器学习模型之前确定所述资源分配参数。
7.根据权利要求1所述的计算设备,其中:
所述多个块中的至少两个块残差地连接在残差链中;以及
停用所述机器学习模型的多个块的子集包括停用所述残差链的起始残差块和残差尾部部分。
8.根据权利要求7所述的计算设备,其中:
所述残差链从所述机器学习模型的输入端向所述机器学习模型的输出端延伸;以及
所述残差尾部部分包括从所述起始残差块向所述机器学习模型的输出端延伸的残差链内的块。
9.根据权利要求1所述的计算设备,其中选择所述多个块的子集包括基于与所述机器学习模型内的每个块的相应位置正相关的每个块的相应概率来选择块。
10.根据权利要求1所述的计算设备,其中:
所述资源分配参数与所述机器学习模型的最大目标资源分配量相对应;以及
选择所述多个块的子集包括基于每个块的相应资源消耗量来选择块,以将执行所述机器学习模型所要求的资源量调节为小于所述最大目标资源分配量。
11.根据权利要求1所述的计算设备,还包括基于所述资源分配参数的幅度来选择用于停用的所述多个块的子集的大小,以使得所述多个块的子集的大小与所述资源分配参数的幅度负相关。
12.根据权利要求1所述的计算设备,其中停用所述机器学习模型的多个块的子集包括停用所述机器学习模型的层。
13.根据权利要求1所述的计算设备,其中所述机器学习模型包括卷积神经网络,并且所述多个块中的至少一个块包括应用至少一个卷积滤波器的卷积块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980056728.7/1.html,转载请声明来源钻瓜专利网。