[发明专利]丢包定位方法、装置、计算设备及介质在审
申请号: | 202210302678.X | 申请日: | 2022-03-24 |
公开(公告)号: | CN114629824A | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 黄建博;焦海荣;刘阳 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | H04L43/0829 | 分类号: | H04L43/0829;H04L41/0631;H04L67/10 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 董晓盈 |
地址: | 310052 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 定位 方法 装置 计算 设备 介质 | ||
公开了一种丢包定位方法、装置、计算设备及介质,所述方法包括:获取服务器集群的非应答NAK监控数据,所述NAK监控数据指示在进行数据传输过程中发生丢包事件的发送方和接收方的IP地址;根据所述NAK监控数据确定第一服务器,所述第一服务器为IP地址出现次数大于第一设定阈值的服务器;通过根据第一服务器的数量初步判断引起丢包事件的可能是服务器或者交换机,结合所述NAK监控数据与所述服务器集群的异常监测数据的关联性,可以进一步确定引起丢包事件的第一服务器中的目标网卡,或者交换机的目标端口,实现了基于服务器集群的NAK监控数据对网络丢包事件进行高效、细粒度的定位。
技术领域
本说明书一个或多个实施例涉及通信技术领域,尤其涉及一种丢包定位方法、装置、计算设备及介质。
背景技术
远程直接内存访问(Remote Direct Memory Access,RDMA)技术能够提供高带宽、低时延和低CPU负载的特性,随着对网络性能要求的提高,RDMA网络技术的应用也日益广泛。而随着应用RDMA技术的需求的增加,诞生了基于融合以太网的远程直接内存访问(RDMAover Converged Ethernet,RoCE)技术。目前众多的大规模数据中心部署RoCE网络。虽然RoCE网络引入了多种拥塞控制机制,但还是有一定的丢包概率。对于大规模RoCE网络而言,丢包的定位效率和定位准确度成为影响RoCE网络质量的重要一环,因此需要提出一种针对大规模RoCE网络进行丢包定位的方法。
发明内容
有鉴于此,本说明书一个或多个实施例提供一种丢包定位方法、装置、计算设备及介质。为实现上述目的,本说明书一个或多个实施例提供技术方案如下。
根据本说明书一个或多个实施例的第一方面,提出了一种丢包定位方法,该方法包括:
获取服务器集群的非应答NAK监控数据,所述NAK监控数据指示在进行数据传输过程中发生丢包事件的发送方和接收方的IP地址;
根据所述NAK监控数据确定第一服务器,所述第一服务器为IP地址出现次数大于第一设定阈值的服务器;
根据所述服务器集群中存在所述第一服务器的数目,以及所述NAK监控数据与所述服务器集群的异常监测数据的关联性,确定引起丢包事件的目标对象。
在一些实施例中,所述根据所述服务器集群中存在所述第一服务器的数目,以及所述NAK监控数据与所述服务器集群的异常监测数据的关联性,确定引起丢包事件的目标对象,包括:
响应于所述服务器集群中存在一个第一服务器,根据所述NAK监控数据与所述服务器集群的异常监测数据的关联性,确定引起丢包事件的第一服务器的目标网卡;
响应于存在多个第一服务器,根据所述服务器集群的拓扑结构以及所述NAK监控数据与所述服务器集群的异常监测数据的关联性,确定引起丢包事件的交换机的目标端口。
在一些实施例中,所述方法还包括:接收丢包告警,所述丢包告警指示第一范围内的服务器集群在第一时间范围内存在丢包事件;
所述获取服务器集群的非应答NAK监控数据,包括:
响应于所述丢包告警,获取所述第一范围内的服务器集群在所述第一时间范围内的NAK监控数据。
在一些实施例中,所述根据所述NAK监控数据确定第一服务器包括:
根据所述服务器集群的NAK监控数据生成节点图,所述节点图中的节点指示所述服务器集群中各个服务器的IP地址,两个节点之间的边指示NAK监控数据;
根据度大于所述第一设定阈值的节点,确定所述第一服务器,其中,所述度指示与所述节点相关联的边的数目。
在一些实施例中,所述第一服务器具有多个网卡,每个网卡通过一条链路上联至交换机的端口;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210302678.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防止出现穴蚀的静压轴承
- 下一篇:拍照方法、装置、介质和终端设备