[发明专利]服务请求处理方法、装置、服务器及存储介质有效
申请号: | 202110538953.3 | 申请日: | 2021-05-18 |
公开(公告)号: | CN113242307B | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 黄亮;曹文慧;李英民;钟辉 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | H04L67/00 | 分类号: | H04L67/00;G06F16/903 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 宁立存 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 服务 请求 处理 方法 装置 服务器 存储 介质 | ||
本公开关于一种服务请求处理方法、装置、服务器及存储介质,涉及互联网技术领域。方法包括:接收终端发送的第一服务请求;确定该第一服务请求所需的服务资源,从服务器集群中,选择与该服务资源匹配的目标服务器,该服务器集群包括异构服务器和非异构服务器;通过该目标服务器对该第一服务请求进行处理,得到处理结果;向该终端发送该处理结果。通过本方案,在所需的服务资源的资源量较大时,也能使用匹配的目标服务器进行处理,保证了在指定时间内能完成处理该第一服务请求,这样就无需对目标服务器中的算法进行压缩,从而在保证第一服务请求不延迟的前提下,保证了第一服务请求的处理结果的质量。
技术领域
本公开涉及互联网技术领域,尤其涉及服务请求处理方法、装置、服务器及存储介质。
背景技术
服务器处理的服务请求中,存在一些处理时长明显高于均值的长尾请求。目前,在对长尾请求进行处理时,一般通过算法优化,对服务器中用于处理服务请求的模型进行压缩,从而通过减少服务器中模型的计算量来提高服务器的处理速度,进而缩短服务器处理服务请求的时长。然而,在对模型进行压缩的过程中,会使模型受损,导致模型的精度降低,造成服务请求的处理效果下降。
发明内容
本公开提供一种服务请求处理方法、装置、服务器及存储介质,能够提高服务请求的处理效果。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种服务请求处理方法,所述方法包括:
接收终端发送的第一服务请求;
确定所述第一服务请求所需的服务资源,从服务器集群中,选择与所述服务资源匹配的目标服务器,所述服务器集群包括异构服务器和非异构服务器;
通过所述目标服务器对所述第一服务请求进行处理,得到处理结果;
向所述终端发送所述处理结果。
在一些实施例中,所述从服务器集群中,选择与所述服务资源匹配的目标服务器,包括:
若所述服务资源的资源量大于预设资源量,从所述服务器集群中选择所述异构服务器,将所述异构服务器确定为所述目标服务器;
若所述服务资源的资源量不大于所述预设资源量,从所述服务器集群中选择所述非异构服务器,将所述非异构服务器确定为所述目标服务器。
在一些实施例中,所述预设资源量是通过如下方式确定的:
确定所述服务器集群支持的最大延迟量,所述最大延迟量为所述服务器集群允许延迟的最长时长;
确定所述非异构服务器处理服务请求的最快处理速度;
基于所述最大延迟量和所述最快处理速度,确定所述非异构服务器支持的最大服务资源;
将所述最大服务资源的数量确定为所述预设资源量。
在一些实施例中,所述方法还包括:
确定所述服务器集群接收到的不同类型的服务请求的比例,所述不同类型的服务请求包括所述非异构服务器的处理时长超过预设时长的服务请求和处理时长不超过所述预设时长的服务请求;
基于所述比例,确定所述异构服务器和所述非异构服务器的数量之比。
在一些实施例中,所述确定所述第一服务请求所需的服务资源,从服务器集群中,选择与所述服务资源匹配的目标服务器,包括:
向所述非异构服务器转发所述第一服务请求,所述非异构服务器用于确定所述第一服务请求所需的服务资源,从服务器集群中,选择与所述服务资源匹配的目标服务器。
在一些实施例中,所述第一服务请求用于请求在数据库中查询目标数据,所述确定所述第一服务请求所需的服务资源,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110538953.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种腹腔镜用穿刺器
- 下一篇:一种生物制药用的过滤装置