[发明专利]面向微服务的批推理方法、服务器和计算机可读存储介质有效

专利信息
申请号: 201911256451.0 申请日: 2019-12-10
公开(公告)号: CN111124708B 公开(公告)日: 2023-05-16
发明(设计)人: 赵耀;孙霞 申请(专利权)人: 广州小鹏汽车科技有限公司
主分类号: G06F9/54 分类号: G06F9/54;G06N5/043
代理公司: 暂无信息 代理人: 暂无信息
地址: 510000 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 面向 微服 推理 方法 服务器 计算机 可读 存储 介质
【说明书】:

发明涉及深度学习技术领域,特别是涉及一种面向微服务的批推理方法、服务器和计算机可读存储介质。面向微服务的批推理方法包括:接收客户端发送的用户请求;将请求存入字典并添加到当前请求队列;等待子线程返回当前请求队列中所有请求对应的微服务的批推理结果;读取批推理结果;向客户端返回批推理结果。在实际的业务场景中,微服务之间往往是并发关系,使用框架级别的批推理无法对此进行优化,使用本发明提出的方案,可以节约并发场景下的无效等待时间,提升优化效果。

技术领域

本发明涉及深度学习技术领域,特别是涉及一种面向微服务的批推理方法、、服务器和计算机可读存储介质。

背景技术

随着BERT、ERNIE、XLNET等大规模语言模型的问世,各种自然语言技术(文本分类、用户画像、知识图谱、命名实体识别、语义匹配、中文分词等)都逐渐基于此类模型,业务精度也随之不断提升。

由于BERT等语言模型中模型的参数越多,其在各个NLP(Natural LanguageProcessing,自然语言处理)任务上的精度也越高,进而导致训练和推理的资源消耗也越大。在当前业务耗时受约束、资源有限的条件下,如何支撑更大的流量成为大规模语言模型应用落地的一大难题。当前基于Tensorflow Serving的批推理框架兼容性较差,商业云解决方案必须购买云服务在云上实现,另外没有针对微服务本身的批推理方案。每个微服务的特点不同,业务逻辑也不同,目前并没有任何架构在云服务上提出通用的微服务级别的解决方案。因此,亟需一个微服务级别的批推理解决方案,在有限的资源约束下,支撑线上庞大的业务请求量。

发明内容

鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种面向微服务的批推理方法、服务器和计算机可读存储介质。

为了解决上述问题,本发明实施例公开了一种一种面向微服务的批推理方法,其特征在于,包括:

接收客户端发送的用户请求;

将请求存入字典并添加到当前请求队列;

等待子线程返回当前请求队列中所有请求对应的微服务的批推理结果;

读取批推理结果;

向客户端返回批推理结果。

进一步地,等待子线程返回当前请求队列中所有请求对应的微服务的批推理结果包括:

等待子线程先确定当前请求队列符合进行批推理的条件,再返回当前请求队列中所有请求对应的微服务的批推理结果;其中,批推理的条件和微服务参数相关。

进一步地,微服务参数包括队列长度,符合进行批推理的条件包括:当前请求队列的长度等于预设的队列最大长度。

进一步地,微服务参数包括等待时间,符合进行批推理的条件包括:当前请求队列的等待时间达到预设的最长等待时间。

进一步地,等待子线程先确定当前请求队列符合进行批推理的条件,再返回当前请求队列中所有请求对应的微服务的批推理结果包括:

等待子线程通信返回的批推理结果;其中,子线程先确定当前请求队列符合进行批推理的条件,接着将当前请求队列中请求发送给各个模型对应的微服务由各个微服务单独进行批推理,然后获取所有微服务的批推理结果,根据请求对批推理结果进行拆分并将拆分后的批推理结果存入词典。

进一步地,子线程包括上游服务,其中,子线程将当前请求队列中请求发送给各个模型对应的微服务由各个微服务单独进行批推理包括:

子线程通过上游服务将当前请求队列中所有请求合并为一批请求,然后将该一批请求并发发送给各个模型对应的微服务由各个微服务单独进行批推理。

进一步地,所有微服务使用一个工作队列,该工作队列包括若干个请求队列。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州小鹏汽车科技有限公司,未经广州小鹏汽车科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911256451.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top